قمت ببناء نظام متكامل يعتمد على تقنية Retrieval-Augmented Generation (RAG) لمساعدة المستخدمين على تحليل المستندات القانونية والعقود بطريقة ذكية وسريعة. يسمح النظام برفع الملفات واستخراج المعلومات المهمة منها والإجابة عن الأسئلة بدقة مع إظهار مصادر الإجابة من داخل المستند.
يعتمد النظام على تقسيم المستندات إلى أجزاء صغيرة وتحويلها إلى تمثيلات رقمية (Embeddings)، ثم تخزينها في قاعدة بيانات متجهية، مما يسمح بالبحث الدقيق داخل المستندات واسترجاع المعلومات ذات الصلة عند طرح أي سؤال.
التقنيات المستخدمة:
LangChain لإدارة وتنظيم تدفق العمل بين مكونات النظام
Groq (Llama 3.1) لتشغيل نموذج اللغة بسرعة عالية
HuggingFace Embeddings (all-MiniLM-L6-v2) لتحويل النصوص إلى متجهات
ChromaDB لتخزين البيانات المتجهية والبحث الدلالي
FastAPI لبناء الـ Backend
Gradio لإنشاء واجهة استخدام تفاعلية سهلة