تخصيص نموذج AraGPT2-large على متن "التدمرية" لشيخ الإسلام ابن تيمية.

تفاصيل العمل

يركّز هذا المشروع على تحسين نموذج AraGPT2-large باستخدام النص الإسلامي الكلاسيكي التدمُرية لشيخ الإسلام ابن تيمية. الهدف الرئيسي هو الحفاظ على الأسلوب اللغوي الفريد والعمق العلمي للنص من خلال تدريب نموذج لغة متخصص. هذا المشروع جزء من مبادرة أوسع تهدف إلى تطبيق تقنيات معالجة اللغة الطبيعية (NLP) المتقدمة على التراث الإسلامي، مما يسهم في تعميق التفاعل وجعل النصوص أكثر سهولة.

مراحل المشروع الرئيسية

استخراج البيانات:

الوصف: تم جمع نص التدمُرية من ملفات HTML التي تم الحصول عليها من مكتبة الشاملة. احتوت هذه الملفات على مشاكل في التنسيق مثل العناوين وأرقام الصفحات وبعض الأخطاء، والتي تم تنظيفها باستخدام مكتبات Python مثل Beautiful Soup.

الهدف: إعداد نسخة نظيفة ومنظمة من النص لتدريب النموذج.

المخرجات: مجموعة بيانات نظيفة محفوظة بصيغة CSV، ومتوفر على منصّة Hugging Face Datasets للاستخدام العام.

النموذج الأساسي وتحسين المعاملات الفائقة:

الوصف: تم تدريب نموذج AraGPT2-large في البداية على النص النظيف لـ التدمُرية، ولكن النتائج الأولية لم تكن مُرضية، مما دفع إلى إجراء بحث شامل لتحسين المعاملات الفائقة لتحقيق أداء أفضل للنموذج.

الهدف: تحسين النموذج ليتمكن من توليد نصوص تتطابق مع أسلوب التدمُرية.

المخرجات: سجلات التحقق من المعاملات، التصورات البيانية، والنموذج المحسّن المتاح على Hugging Face Hub.

تصوير البيانات:

الوصف: ركزت هذه المرحلة على تصور تأثير المعاملات الفائقة المختلفة على أداء النموذج باستخدام أدوات مثل TensorBoard لتتبع تقدم التدريب.

الهدف: تحليل وتحديد أفضل المعاملات الفائقة للمهمة.

المخرجات: تحليلات ورسوم بيانية من بحث تحسين المعاملات.

بناء النموذج النهائي:

الوصف: تم استخدام التكوين الأمثل للمعاملات الفائقة الناتج عن البحث لبناء النموذج النهائي، والذي تم تحسينه خصيصًا لنص التدمُرية وجعله متاحًا للجمهور.

الهدف: إنشاء نموذج محسّن يُنتج نصوصًا تعكس الأسلوب اللغوي لابن تيمية.

المخرجات: النموذج النهائي متاح على Hugging Face Hub.

اختبار النموذج:

الوصف: تم اختبار النموذج النهائي بعناية عن طريق توليد نصوص بأسلوب شيخ الإسلام ابن تيمية. تم تقييم المخرجات من حيث الجودة ومدى توافقها مع أسلوب ومحتوى النص الأصلي.

الهدف: التأكد من أن النموذج ينتج نصوصًا عالية الجودة ومناسبة للسياق.

المخرجات: نتائج الاختبار وملاحظات حول قوة النموذج وقيوده.

أثر المشروع وخطوات المستقبل

النموذج النهائي المتوفر على Hugging Face يثبت قدرته على توليد نصوص متماسكة تتطابق مع الطابع اللغوي والفكري لشيخ الإسلام ابن تيمية. يسهم هذا المشروع في الحفاظ على التراث الإسلامي الكلاسيكي من خلال تقنيات الذكاء الاصطناعي المتقدمة.

الأعمال المستقبلية:

توليد الأسئلة والأجوبة: تحسين النموذج ليتمكن من توليد الأسئلة والأجوبة بناءً على النص، بما يتماشى مع أسلوب السؤال والجواب الذي يتميز به ابن تيمية.

التلخيص: تحسين قدرة النموذج على تلخيص الأفكار والحجج الرئيسية من التدمُرية، مما يجعل المحتوى أكثر سهولة.

المساعدة العلمية: تطوير النموذج ليساعد في التحليل العلمي من خلال تقديم استجابات دقيقة وواعية بالسياق على نمط كتابات ابن تيمية.

هذه الخطوات المستقبلية ستزيد من قيمة النموذج كأداة مفيدة للطلاب والباحثين في الدراسات الإسلامية، وخاصة في التفاعل مع أعمال ابن تيمية.

للمزيد من التفاصيل أو للمشاركة، النموذج متاح على Hugging Face، والمساهمات مرحب بها من خلال تقديم اقتراحات أو طلبات السحب.

ملفات مرفقة

بطاقة العمل

اسم المستقل أحمد ا.
عدد الإعجابات 0
عدد المشاهدات 3
تاريخ الإضافة