تفاصيل المشروع
قمت بإنجاز مشروع لعميل يهدف إلى بناء تطبيق بسيط يعتمد على تقنية Retrieval-Augmented Generation (RAG) باستخدام Streamlit و LangChain.
التطبيق يسمح للمستخدمين برفع ملفات PDF وطرح الأسئلة عليها للحصول على إجابات ذكية معتمدة على محتوى المستند.
المهام المنجزة
رفع ملفات PDF واستخراج النصوص منها.
إنشاء Embeddings للنصوص وتخزينها باستخدام FAISS.
ربط الأسئلة بالمحتوى عبر البحث الشعاعي (Vector Search).
استخدام Hugging Face Models لتوليد الإجابات.
تطوير واجهة تفاعلية بـ Streamlit لتشغيل واختبار النظام.
إعداد Jupyter Notebook يشرح خطوة بخطوة خط سير عمل RAG.
️ الأدوات والتقنيات المستخدمة
Python
Streamlit
LangChain
Hugging Face Transformers & Sentence Transformers
FAISS (Facebook AI Similarity Search)
PyPDF2
Jupyter Notebook
Kaggle (لتنفيذ وتوثيق النموذج)
النتيجة
تم تسليم حل متكامل يشمل:
تطبيق واجهة تفاعلية لطرح الأسئلة على ملفات PDF.
بايبلاين RAG كامل (PDF → Embeddings → Vector Search → LLM Answer).
تجربة مستخدم عملية مع تحسين دقة الإجابات مقارنة بالاستخدام المباشر للنماذج اللغوية.