الأدوات: Python، EasyOCR، Tesseract، LangChain، Hugging Face، Gemini API، ChromaDB
بناء نظام RAG للإجابة على الأسئلة، مصمم خصيصًا للتعامل مع الوثائق المكتوبة باللهجة المصرية العامية.
تصميم بنية معيارية وتدفقات عمل مرنة وقابلة للتوسع لدمج الذكاء الاصطناعي في معالجة الوثائق.
تحسين هندسة المحفزات (Prompt Engineering) باستخدام أسلوب "few-shot prompting" مع مجموعة بيانات MADAR.
تحسين أداء الاسترجاع من خلال تجربة أفضل طرق تقسيم النصوص (chunking) المتاحة في LangChain.
دمج التضمينات متعددة اللغات باستخدام ChromaDB مع استكشاف استراتيجيات استرجاع متعددة لتعزيز دقة الإجابات.