UNIVERSITI KEBANGSAAN MALAYSIA2024-12-152024-12-15https://dspace.academy.edu.ly/handle/123456789/883ABSTRACT The topic of identifying hate speech at scale remains unresolved despite the several strategies lately proposed in natural language processing research for detecting various types of abusive language. The challenge facing the online hate speech detection problem is that the content generated by users resorts to being noisy that may contain shorter slang words or different creative spelling. However, normalization methods have not been extensively examined in the hateful context to reduce the out-ofvocabulary (OOV) issue. Among the words used to compose social media messages are words that have repeated letters. Several techniques have been developed to normalize words with repeated letters. HoweverABSTRAK Topik bagi mengenal pasti ucapan kebencian secara berskala masih tidak dapat diselesaikan walaupun beberapa strategi dicadangkan dalam penyelidikan pemprosesan bahasa tabii untuk mengesan pelbagai jenis bahasa kesat. Cabaran yang dihadapi oleh masalah pengesanan ucapan kebencian dalam talian ialah kandungan yang dijana oleh pengguna selalunya hingar yang mungkin mengandungi perkataan slanga yang lebih pendek atau ejaan kreatif yang berbeza. Walau bagaimanapun, kaedah penormalan belum diteliti secara meluas dalam konteks kebencian untuk mengurangkan isu luarperbendaharaan-kata (LPK). Antara perkataan yang digunakan untuk mengarang mesej media sosial ialah perkataan yang mempunyai huruf berulang. Beberapa teknik telah dibangunkan untuk menormalkan perkataanA RULE-BASED NORMALIZATION MODEL WITH EMBEDDING TECHNIQUES FOR BI-LSTM HATE SPEECH DETECTION MODELA RULE-BASED NORMALIZATION MODEL WITH EMBEDDING TECHNIQUES FOR BI-LSTM HATE SPEECH DETECTION MODEL