RAG QA Evaluation Dataset — Logs & Corpus for Groundedness Testing

تفاصيل العمل

نشرت Dataset على Kaggle موجهة لتقييم أنظمة RAG بشكل عملي: سجلات أسئلة/إجابات + corpus لاختبار جودة الاسترجاع وجودة الإجابة (groundedness/answer quality).

الهدف: توفير بيانات جاهزة لبناء evaluation harness لأنظمة RAG بدل الاعتماد على انطباعات.

المخرجات الأساسية:

Dataset منظمة + وصف استخدام واضح.

مناسبة لبناء اختبارات regression لتحديثات RAG.

قابلة للتوسيع داخل dashboards أو pipelines.

Tech: Data packaging, documentation, evaluation datasets.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
7
تاريخ الإضافة
تاريخ الإنجاز
المهارات