انشاء قاعدة بيانات للقران الكريم

تفاصيل العمل

يصف العمل المقدم في المصادر عملية إنشاء مجموعة بيانات صوتية للقرآن الكريم ودمجها مع منصة Hugging Face، وتتلخص خطوات هذا العمل فيما يلي:

• تحميل ملفات الصوت: يتم تحميل ملفات صوتية لكل آية بصيغة MP3 من موقع "everyayah.com" بناءً على رقم السورة ورقم الآية واسم القارئ . يتم تنظيم هذه الملفات في مجلدات مقسمة حسب القارئ والسورة.

• ربط الصوت بالنص: يتم استخراج أرقام السور والآيات من أسماء الملفات، ثم استخدام وظيفة مخصصة لربط كل ملف صوتي بالنص المقابل له من ملف JSON يحتوي على نص القرآن الكريم .

• بناء مجموعة البيانات (Dataset Construction): يتم تجميع كافة المعلومات (مسار الملف، ملف الصوت، اسم القارئ، النص، والمعرف الخاص بالآية) في هيكل بيانات موحد. يتم بعد ذلك تحويل هذه القوائم إلى كائنات Hugging Face Dataset مع تحديد عمود الصوت "Audio" .

• الرفع إلى Hugging Face: في المرحلة النهائية، يتم دمج مجموعات التدريب والتحقق والاختبار في قاموس بيانات واحد (DatasetDict) ورفعه مباشرة إلى Hugging Face Hub ليكون متاحاً للاستخدام في مشاريع التعلم الآلي.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز
المهارات