مشروع نظام أسئلة وأجوبة ذكي من ملفات PDF

تفاصيل العمل

نظرة عامة على المشروع

هذا المشروع عبارة عن تطبيق ويب تفاعلي يستخدم الذكاء الاصطناعي للإجابة على الأسئلة المستخرجة من ملفات PDF. التطبيق يقوم بتحليل محتوى المستندات ويتيح للمستخدمين طرح أسئلة والحصول على إجابات دقيقة بناءً على محتوى الملف.

المميزات الرئيسية

1. رفع وتحليل ملفات PDF

إمكانية رفع أي ملف PDF

استخراج النصوص تلقائياً من جميع صفحات المستند

معالجة الملفات الكبيرة بكفاءة

2. البحث الذكي (RAG - Retrieval Augmented Generation)

تقسيم النص إلى أجزاء صغيرة ومترابطة للمعالجة الأفضل

تحويل النصوص إلى تمثيل رقمي (Embeddings) باستخدام FastEmbed

تخزين البيانات في قاعدة بيانات متجهة (Vector Store) باستخدام Chroma

3. الإجابة على الأسئلة بالذكاء الاصطناعي

استخدام نموذج Llama 3.1 عبر منصة Groq للسرعة الفائقة

البحث عن الأجزاء الأكثر صلة بالسؤال

توليد إجابات دقيقة ومبنية على محتوى المستند فقط

4. واجهة مستخدم بسيطة وسهلة

تصميم نظيف وبديهي باستخدام Streamlit

تجربة مستخدم سلسة ومباشرة

لا تحتاج لخبرة تقنية للاستخدام

️ التقنيات المستخدمة

المكتبات والأدوات:

Streamlit: لبناء واجهة الويب التفاعلية

PyPDF2: لقراءة واستخراج النصوص من ملفات PDF

LangChain: إطار عمل متقدم لتطبيقات الذكاء الاصطناعي

FastEmbed: لتوليد التمثيلات الرقمية بسرعة عالية

Chroma: قاعدة بيانات متجهة للبحث الدلالي

Groq + Llama 3.1: نموذج ذكاء اصطناعي قوي وسريع

حالات الاستخدام

مناسب للشركات والأفراد:

الباحثون والطلاب: تحليل الأوراق البحثية والمستندات الأكاديمية

المحامون: البحث في العقود والوثائق القانونية

الشركات: تحليل التقارير والعقود والمستندات التجارية

الأطباء: البحث في المراجع الطبية والدراسات

أي شخص: يحتاج لاستخراج معلومات من مستندات PDF طويلة

️ كيفية العمل

رفع الملف: المستخدم يرفع ملف PDF

المعالجة: النظام يستخرج النص ويقسمه لأجزاء

الفهرسة: يتم تحويل الأجزاء لتمثيلات رقمية وتخزينها

السؤال: المستخدم يكتب سؤاله

البحث: النظام يبحث عن الأجزاء الأكثر صلة

الإجابة: الذكاء الاصطناعي يولد إجابة دقيقة

المزايا التنافسية

سرعة فائقة: استخدام Groq لاستجابة شبه فورية

دقة عالية: الإجابات مبنية على محتوى المستند فقط

سهولة الاستخدام: لا حاجة لخبرة تقنية

مجاني ومفتوح المصدر: يمكن تخصيصه حسب الحاجة

خصوصية: المعالجة تتم محلياً

إمكانيات التطوير

يمكن توسيع المشروع ليشمل:

دعم ملفات Word و Excel

حفظ تاريخ الأسئلة والأجوبة

دعم لغات متعددة

تصدير الإجابات

واجهة API للتكامل مع أنظمة أخرى

نظام مستخدمين متعدد

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز
المهارات