مشروع البحث:
A Hybrid Deep Learning Technique for Arabic Voice Recognition

dc.contributor.advisorAbduelbaset Mustafa Goweder
dc.date.accessioned2024-12-03T13:42:44Z
dc.date.available2024-12-03T13:42:44Z
dc.descriptionAbstract Speech recognition is a valuable tool in various industries; however, achieving high accuracy remains a major challenge, despite the rapid growth of the speech recognition market. Arabic in particular lags behind other languages in the field of speech recognition, requiring further attention and development. To address this issue, this research uses deep neural networks to develop an automatic Arabic speech recognition model based on isolated words technology. A hybrid technique, which is originally developed by Radfar et al. [1] for English speech recognition, is adopted to be used for Arabic speech recognition. This technique combines the strengths of recurrent neural networks (RNNs), which are critical in speech recognition tasks, with convolutional neural networks (CNNs) to form a hybrid model known as ConvRNN. The adopted technique is trained using an Arabic speech publicly available dataset of isolated words, along with a custom-generated dataset specially prepared for this research. The built model's performance has been evaluated using standard metrics, including word error rate (WER), accuracy, precision, recall, and F-measure (also referred to as f-score). In addition, K-fold cross-validation method has been employed to ensure robustness and generalizability. The results demonstrated that the ConvRNN model achieved a high accuracy rate of 95.7% on unseen data, with a minimal WER of just 4.3%. These findings highlight the model's effectiveness in accurately recognizing Arabic speech with minimal errors. Comparisons with similar models from previous studies further validated the superiority of the ConvRNN model. Overall, the ConvRNN model shows great promise for applications requiring accurate and efficient Arabic speech recognition. This research contributes to narrowing the gap in Arabic speech recognition technology, offering a robust solution for accurately converting Arabic speech into text
dc.description.abstractالمستخلص يعد التعرف على الكلام أداة قيمة في مختلف الصناعات؛ ومع ذلك، يظل تحقيق الدقة العالية تحديًا كبيرًا، على الرغم من النمو السريع لسوق التعرف على الكلام. تتخلف اللغة العربية بشكل خاص عن اللغات الأخرى في مجال التعرف على الكلام، مما يتطلب المزيد من الاهتمام والتطوير. لمعالجة هذه المشكلة، يستخدم هذا البحث الشبكات العصبية العميقة لتطوير نموذج التعرف التلقائي على الكلام العربي بناءً على تقنية الكلمات المعزولة. تم اعتماد تقنية هجينة، تم تطويرها في الأصل بواسطة Radfar et al. [1] للتعرف على الكلام الإنجليزي، لاستخدامها في التعرف على الكلام العربي. تجمع هذه التقنية بين نقاط قوة الشبكات العصبية المتكررة (RNNs)، والتي تعد بالغة الأهمية في مهام التعرف على الكلام، مع الشبكات العصبية التلافيفية (CNNs) لتشكيل نموذج هجين يُعرف باسم . ConvRNN يتم تدريب التقنية المعتمدة باستخدام مجموعة بيانات متاحة للجمهور من الكلام العربي للكلمات المعزولة، جنبًا إلى جنب مع مجموعة بيانات تم إنشاؤها خصيصًا لهذا البحث. تم تقييم أداء النموذج المبني باستخدام مقاييس قياسية، بما في ذلك معدل خطأ الكلمات (WER)، والدقة، والدقة، والتذكر، ومقياس F (يشار إليه أيضًا باسم درجة .(f- بالإضافة إلى ذلك، تم استخدام طريقة التحقق المتبادل K-fold لضمان المتانة والقدرة على التعميم. أظهرت النتائج أن نموذج ConvRNN حقق معدل دقة مرتفع بنسبة 95.7٪ على البيانات غير المرئية، مع معدل خطأ أدنى بنسبة 4.3٪ فقط . تسلط هذه النتائج الضوء على فعالية النموذج في التعرف بدقة على الكلام العربي بأقل قدر من الأخطاء. كما أثبتت المقارنات مع نماذج مماثلة من الدراسات السابقة تفوق نموذج ConvRNN . بشكل عام، يُظهر نموذج ConvRNN وعدًا كبيرًا للتطبيقات التي تتطلب التعرف الدقيق والفعال على الكلام العربي. يساهم هذا البحث في تضييق الفجوة في تكنولوجيا التعرف على الكلام العربي، ويقدم حلاً قويًا لتحويل الكلام العربي إلى نص بدقة.
dc.identifier24471
dc.identifier.urihttps://dspace.academy.edu.ly/handle/123456789/485
dc.subjectتجمع هذه التقنية بين نقاط قوة الشبكات العصبية المتكررة (RNNs
dc.titleA Hybrid Deep Learning Technique for Arabic Voice Recognition
dspace.entity.typeProject
project.endDate2024
project.funder.nameComputer Science
project.investigatorFathiyah Antaat Habeeb
project.startDate2023
الملفات
الحزمة الأصلية
يظهر اﻵن 1 - 1 من 1
لا توجد صورة مصغرة متاحة
اﻻسم:
_ConvRNN_Thesis.pdf
الحجم:
3.09 MB
التنسيق:
Adobe Portable Document Format
حزمة الترخيص
يظهر اﻵن 1 - 1 من 1
لا توجد صورة مصغرة متاحة
اﻻسم:
license.txt
الحجم:
1.71 KB
التنسيق:
Item-specific license agreed to upon submission
الوصف: