المساعد الذكي لشؤون الطلاب باستخدام معمارية RAG (AI-Powered Student Services Chatbot using Retrieval-Augmented Generation)
نظرة عامة على المشروع (Project Overview)
هو نظام محادثة آلي (Chatbot) ذكي مصمم خصيصا للعمل كموظف شؤون طلاب افتراضي متاح على مدار الساعة. يعتمد النظام بالكامل على "لائحة دليل الطالب الجامعي" (Student Handbook) كمرجعية وحيدة للمعلومات. يهدف المشروع إلى تزويد الطلاب بإجابات دقيقة، فورية، وموثقة حول القوانين الأكاديمية، المواعيد النهائية، السكن الجامعي، والسياسات المالية، مع دعم كامل وثنائي اللغة (عربي/إنجليزي).
المشكلة والحل (Problem & Solution)
المشكلة: يواجه الطلاب صعوبة في البحث داخل اللوائح الجامعية الطويلة والمعقدة (ملفات PDF ضخمة) للوصول إلى معلومة محددة، مما يضغط على إدارة شؤون الطلاب بالأسئلة المتكررة.
الحل: بدلا من استخدام أنظمة المحادثة التقليدية التي تعتمد على القواعد الثابتة (Rule-based) أو التي قد تقوم بتأليف معلومات خاطئة (Hallucination)، قمنا ببناء نظام يعتمد على معمارية RAG، والذي يقوم بالبحث الدقيق داخل نصوص اللائحة أولا، ثم صياغة إجابة بشرية سلسة وموثقة بمرجع من اللائحة.
التقنيات المستخدمة (Tech Stack)
إطار العمل الأساسي (Framework): LangChain لربط جميع مكونات الذكاء الاصطناعي وإدارة سلاسل العمليات.
معالجة البيانات (Embeddings): نموذج paraphrase-multilingual من Hugging Face لتحويل النصوص العربية والإنجليزية إلى متجهات رقمية (Vectors).
قاعدة البيانات المتجهة (Vector Store): ChromaDB لتخزين البيانات محليا وإجراء عمليات البحث السريعة.
نموذج توليد اللغة (LLM): نموذج Qwen-2.5-7B-Instruct (عبر Hugging Face API) لقدرته الفائقة على فهم وصياغة اللغة العربية والإنجليزية بدقة.
واجهة المستخدم (UI): مكتبة Streamlit لبناء واجهة تفاعلية بسيطة وسريعة الاستجابة.
دورة عمل النظام (System Workflow)
ينقسم عمل النظام إلى مرحلتين أساسيتين:
مرحلة معالجة البيانات (Data Ingestion - Offline):
قراءة ملف اللائحة (PDF) وتقسيمه إلى أجزاء صغيرة (Chunks) للحفاظ على السياق.
تحويل هذه الأجزاء إلى أرقام (Embeddings) وتخزينها في قاعدة بيانات ChromaDB.
مرحلة الاستعلام والرد (Query & Retrieval - Online):
يستقبل النظام سؤال الطالب.
يستخدم الذاكرة (Memory) لفهم سياق المحادثة إذا كان السؤال مرتبطا بما قبله.
يبحث في قاعدة البيانات باستخدام خوارزمية MMR لجلب أكثر النصوص دقة وتنوعا من اللائحة.
يرسل السؤال والنصوص المستخرجة إلى نموذج الذكاء الاصطناعي (LLM) مع تعليمات صارمة (Prompt) للإجابة بلغة الطالب وفقط من المعلومات المتاحة.
المميزات الحصرية للنظام (Key Features)
انعدام التأليف (Zero-Hallucination): النظام مبرمج للرد بـ "لا أعلم، يرجى مراجعة شؤون الطلاب" إذا كانت المعلومة غير موجودة في اللائحة.
ثنائي اللغة (Bilingual): يفهم ويرد بنفس اللغة التي يسأل بها الطالب (عربي أو إنجليزي) بفضل الـ Multilingual Embeddings والـ Prompt الصارم.
الذاكرة السياقية (Contextual Memory): يتذكر آخر 5 رسائل في المحادثة لضمان تجربة دردشة طبيعية ومترابطة.
السرعة والكفاءة (Cost & Compute Efficiency): استخدام واجهة برمجة التطبيقات السحابية يوفر استهلاك موارد الأجهزة المحلية ويضمن سرعة الرد.