روبوت محادثة RAG مع وصف الصور (نظام ذكاء اصطناعي متعدد الوسائط)
قمت بتطوير نظام ذكاء اصطناعي متعدد الوسائط يجمع بين تقنية Retrieval-Augmented Generation (RAG) وقدرات فهم الصور لتقديم إجابات ذكية تعتمد على السياق وتحليل البيانات من المستندات ومجموعات البيانات والصور.
يتيح النظام للمستخدمين رفع ملفات PDF أو CSV أو صور، ثم التفاعل معها من خلال واجهة روبوت محادثة تفاعلية. يقوم النظام باسترجاع المعلومات ذات الصلة من المصادر المتاحة وتوليد إجابات دقيقة اعتمادًا على نماذج اللغة الكبيرة (LLMs).
المميزات الرئيسية
فهرسة مستندات PDF والإجابة على الأسئلة باستخدام RAG لفهم المحتوى اعتمادًا على السياق
تحليل وتلخيص بيانات CSV مع تقديم اقتراحات وتحليلات ذكية
وصف الصور باستخدام نموذج BLIP لفهم المحتوى البصري
واجهة روبوت محادثة تفاعلية باستخدام Streamlit
إدارة الذاكرة لكل مصدر بيانات لتحسين سياق المحادثة
إجابات معتمدة على الاسترجاع من المصادر لضمان الدقة وربط الإجابات بالمصدر