تفاصيل العمل

ما هو هذا المشروع؟

طوّرت شات بوت ذكي متخصص في المجال الزراعي، يستطيع الإجابة على الأسئلة الزراعية باللغة العربية واللغة الإنجليزية بشكل طبيعي. النظام مبني على تقنية RAG (Retrieval-Augmented Generation) التي تضمن أن كل إجابة مبنية على معرفة موثقة فقط، وليس على تخمينات أو معلومات قد تكون خاطئة.

الفكرة بسيطة: تسأل سؤالاً زراعياً إما بالعربية أوبالإنجليزية، النظام يبحث في قاعدة المعرفة الزراعية، يسترجع المعلومات ذات الصلة، ثم يولد إجابة مبنية على هذه المعلومات. إذا لم يجد معلومات كافية، يعترف بذلك صراحةً وينصحك باستشارة مختص زراعي.

لماذا هذا المشروع مميز؟

المشكلة التي واجهتها: الشات بوتات العادية مثل ChatGPT تعاني من مشكلة خطيرة تسمى "الهلوسة" - حيث تولد معلومات خاطئة بثقة عالية جداً. في المجال الزراعي، هذا الأمر خطير للغاية لأن نصيحة خاطئة عن نبات سام قد تؤذي طفلاً، أو علاج خاطئ لمرض نباتي قد يدمر محصولاً كاملاً.

الحل الذي قدمته: بنيت النظام على مبدأ "الأمان أولاً" (Safety-First) مع بنية RAG التي تضمن أن كل إجابة مرتبطة بمصدر موثوق. النظام لا يتخمن أبداً - إما يجيب من المعرفة الموثقة، أو يعترف بأنه لا يعرف ويوجهك للمختص.

كيف يعمل النظام؟

النظام يعمل على ثلاث مراحل متتالية:

المرحلة الأولى - المنسق (Orchestrator): يستقبل سؤالك بالعربية، ينظف النص، يكتشف نيتك (هل تسأل عن رعاية نبات؟ سمية؟ مرض؟)، ويستخرج الكيانات المهمة مثل اسم النبات.

المرحلة الثانية - RAG Pipeline: يبحث في قاعدة البيانات المتجهية (ChromaDB) عن المعلومات ذات الصلة بسؤالك، باستخدام تمثيلات دلالية متعددة اللغات (multilingual-e5-base) لفهم المعنى بالعربية.

المرحلة الثالثة - توليد الإجابة: نموذج Llama 3.3 70B يولد الإجابة، لكنه مقيد بالسياق المسترجع فقط مع قواعد أمان صارمة تمنعه من التخمين.

المهام المدعومة:

النظام يدعم رعاية النباتات (الري والإضاءة والتسميد والتقليم)، فحص السمية (هل النبات سام؟ مع تحذيرات السلامة)، أمراض النباتات (الأعراض والأسباب والعلاج)، تحديد النباتات من الصور، تحليل صحة النبات بناءً على بيانات الحساسات، بالإضافة للأسئلة الزراعية العامة.

النتائج والتقييم:

تم تقييم النظام يدوياً بمقارنة الإجابات مع مراجع زراعية موثقة. حقق النظام دقة 75% في صحة المعلومات الزراعية العامة، و85% في معلومات النباتات السامة (الأهم للسلامة). النظام يعترف بعدم اليقين عند الحاجة ويوجه للمختصين في الحالات الحرجة.

التقنيات المستخدمة:

نموذج اللغة: Llama 3.3 70B عبر Groq API

قاعدة البيانات المتجهية: ChromaDB

التمثيل الدلالي: multilingual-e5-base بأبعاد 768

الـ Backend: FastAPI مع Python

قاعدة المعرفة: أكثر من 500 مستند زراعي موثق تغطي أكثر من 50 نوع نبات و30 مرض نباتي

ما الذي يميز هذا العمل؟

هذا النظام يتميز بكونه آمناً (لا نصائح خطرة أو تخمينات)، صادقاً (يعترف بحدوده)، داعماً للعربية بشكل كامل، ومبنياً على معرفة موثقة فقط. كما أنه جاهز للنشر مع FastAPI ومُقيّم يدوياً بدقة.

يوجد ملف توثيق كامل مرفق يشرح كل خطوة في التصميم والتنفيذ والتقييم