تفاصيل العمل

يهدف هذا المشروع إلى بناء روبوت محادثة طبي (Chatbot) متخصص. يعتمد الروبوت على محتوى ملف PDF طبي كمصدر أساسي للمعرفة، ويستخدم مجموعة من الوكلاء الأذكياء (Agents) المبنيين باستخدام إطار العمل LangChain للإجابة على أسئلة المستخدمين.

الفكرة الأساسية هي استخلاص النصوص من ملف PDF طبي، وتحويلها إلى قاعدة بيانات معرفية، ثم استخدام "وكيل رئيسي" لتوجيه سؤال المستخدم إلى الأداة أو "الوكيل المتخصص" المناسب، سواء كان ذلك لاسترداد معلومة مباشرة، أو تلخيصها، أو تقديم توصية، أو حتى البحث على الإنترنت عن معلومات إضافية.

ملاحظة هامة: الكود في الملف يواجه خطأ في التنفيذ لأنه يتطلب مفتاح واجهة برمجة تطبيقات OpenAI (OpenAI API key) الذي لم يتم توفيره.

الخوارزميات والتقنيات المستخدمة ?

يستخدم النظام بنية متكاملة تعتمد على عدة تقنيات وخوارزميات حديثة في مجال الذكاء الاصطناعي، وهي كالتالي:

1. الاسترداد المعزز للتوليد (Retrieval-Augmented Generation - RAG)

هذه هي الاستراتيجية الأساسية للنظام. بدلاً من الاعتماد على المعرفة العامة للنموذج اللغوي فقط، يقوم النظام بالآتي:

* الاسترداد (Retrieval): يبحث أولاً في قاعدة البيانات المعرفية (المُنشأة من ملف PDF) عن الأجزاء الأكثر صلة بسؤال المستخدم.

* التوليد المعزز (Augmented Generation): يمرر هذه الأجزاء ذات الصلة إلى النموذج اللغوي الكبير (LLM) كـ "سياق إضافي"، ليقوم النموذج بتوليد إجابة دقيقة ومبنية على المعلومات الموجودة في المستند.

2. التضمين المتجه (Vector Embeddings)

لجعل نصوص PDF قابلة للبحث والفهم بواسطة الكمبيوتر، يتم تحويلها من كلمات إلى تمثيلات رقمية (متجهات رياضية) باستخدام نموذج تضمين.

* الخوارزمية المستخدمة: OpenAIEmbeddings. يقوم هذا النموذج بتحويل كل جزء من النص إلى متجه رقمي يعبر عن معناه الدلالي.

3. البحث بالتشابه (Similarity Search)

بعد تحويل النصوص إلى متجهات، يتم تخزينها في قاعدة بيانات متخصصة تسمى قاعدة بيانات المتجهات (Vector Database). عندما يطرح المستخدم سؤالاً، يتم تحويل السؤال أيضاً إلى متجه، ثم تبحث قاعدة البيانات عن المتجهات (النصوص) الأكثر تشابهاً معه.

* الأداة المستخدمة: ChromaDB. وهي قاعدة بيانات تستخدم خوارزميات فعالة مثل Approximate Nearest Neighbor (ANN) للعثور بسرعة على المعلومات الأكثر صلة.

4. النماذج اللغوية الكبيرة (Large Language Models - LLMs)

هي المحرك الأساسي لتوليد النصوص وفهم اللغة. في هذا المشروع، تُستخدم للقيام بعدة مهام.

* الأداة المستخدمة: OpenAI.

* الاستخدامات:

* اتخاذ القرار: الوكيل الرئيسي يستخدم النموذج ليقرر أي أداة يجب استخدامها للإجابة على السؤال.

* التلخيص: "وكيل التلخيص" يستخدم النموذج لتلخيص المعلومات.

* التوصية: "وكيل التوصيات" يستخدم النموذج لتقديم توصيات بناءً على الاستعلام.

* توليد الإجابة النهائية: صياغة الإجابة النهائية بناءً على المعلومات المسترجعة.

5. إطار عمل ReAct (Reason and Act)

الوكيل الرئيسي (master_agent) تم إعداده باستخدام استراتيجية "zero-shot-react-description". هذه الخوارزمية تمكن النموذج اللغوي من التفكير بشكل منهجي لاتخاذ القرارات:

* التفكير (Reason): يحلل النموذج السؤال ويفكر في الخطوة التالية المناسبة.

* التصرف (Act): بناءً على تفكيره، يختار النموذج أحد الأدوات المتاحة له (مثل البحث في قاعدة البيانات، أو التلخيص، أو البحث على الويب).

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
المهارات