RAG QA Evaluation Dataset — Logs & Corpus for Groundedness Testing

تفاصيل العمل

نشرت Dataset على Kaggle موجهة لتقييم أنظمة RAG بشكل عملي: سجلات أسئلة/إجابات + corpus لاختبار جودة الاسترجاع وجودة الإجابة (groundedness/answer quality).

الهدف: توفير بيانات جاهزة لبناء evaluation harness لأنظمة RAG بدل الاعتماد على انطباعات.

المخرجات الأساسية:

Dataset منظمة + وصف استخدام واضح.

مناسبة لبناء اختبارات regression لتحديثات RAG.

قابلة للتوسيع داخل dashboards أو pipelines.

Tech: Data packaging, documentation, evaluation datasets.

معاينة

بطاقة العمل

اسم المستقل

Tarek E.

عدد الإعجابات

عدد المشاهدات

تاريخ الإضافة

28/01/2026

تاريخ الإنجاز

28/01/2026

المهارات

RAG QA Evaluation Dataset — Logs & Corpus for Groundedness Testing

تفاصيل العمل

بطاقة العمل

روابط

تابع مستقل على

وسائل الدفع المتاحة