تفاصيل العمل

يتضمن المشروع عدة جوانب:

معالجة البيانات: يتم تجهيز النصوص الخام عن طريق تقسيمها إلى أجزاء، وإزالة الكلمات غير المهمة (Stop-words)، وتصغير الكلمات إلى جذورها (Stemming).

بناء النماذج: يتم تمثيل المستندات في "الفضاء المتجه" (Vector Space Model) باستخدام تقنيات مثل TF-IDF وLatent Dirichlet Allocation لإنشاء فهرس.

تنفيذ الاستعلامات: يسمح النظام للمستخدم بإدخال استعلام، ثم يقوم بحساب مدى التشابه بين الاستعلام والمستندات الموجودة، ويقوم بترتيب المستندات الأكثر صلة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز