نشرت Dataset على Kaggle موجهة لتقييم أنظمة RAG بشكل عملي: سجلات أسئلة/إجابات + corpus لاختبار جودة الاسترجاع وجودة الإجابة (groundedness/answer quality).
الهدف: توفير بيانات جاهزة لبناء evaluation harness لأنظمة RAG بدل الاعتماد على انطباعات.
المخرجات الأساسية:
Dataset منظمة + وصف استخدام واضح.
مناسبة لبناء اختبارات regression لتحديثات RAG.
قابلة للتوسيع داخل dashboards أو pipelines.
Tech: Data packaging, documentation, evaluation datasets.