تفاصيل العمل

صممت هذا المشروع لحل مشكلة شائعة: كيفية إيجاد إجابات سريعة ودقيقة من داخل المستندات الطويلة. الهدف كان بناء بوت دردشة يستطيع أي شخص أن يسأله عن محتوى ملف معين فقط بذكر اسم الملف، ويحصل على إجابة مباشرة بدلاً من قراءة الملف كاملاً.

كتطبيق عملي، جعلت البوت خبيراً في "اللوائح الخاصة بمختلف الجمعيات الهندسية الطلابية (الجمعية الميكانيكية، الجمعية الكهربائية، ...إلخ)"، حيث أصبح قادراً على الإجابة عن أي استفسار يتعلق ببنودها وموادها.

كيف يعمل؟

الفكرة بسيطة وتتم على مرحلتين:

مرحلة التحضير: في البداية، يقوم النظام بقراءة المستند (ملف PDF مثلاً) من Google Drive. بعد ذلك، يستخدم نموذج الذكاء الاصطناعي (Google Gemini) لتفكيك المحتوى إلى أفكار وفقرات رئيسية، ثم يحولها إلى بصمات رقمية (Embeddings) ويخزنها في قاعدة بيانات متخصصة (Pinecone). هذه العملية أشبه بصنع فهرس ذكي جداً للمستند.

مرحلة الإجابة: عندما يطرح المستخدم سؤالاً، يبحث البوت في الفهرس الذكي عن أجزاء النص الأكثر صلة بالإجابة داخل المستند الأصلي. بعد أن يجدها، يستخدم نموذج محادثة آخر من Gemini ليصيغ منها إجابة واضحة ومباشرة.

الميزة الأساسية هنا أن إجابات البوت تستند دائماً إلى المحتوى الفعلي للمستند، مما يضمن دقتها ويمنع "اختلاق" المعلومات.

التقنيات المستخدمة:

الفكرة الأساسية: RAG (Retrieval-Augmented Generation)

نماذج الذكاء الاصطناعي: Google Gemini

قاعدة البيانات المتجهية: Pinecone

منصة التشغيل الآلي: n8n

تخزين الملفات: Google Drive

بطاقة العمل