"مشروع متخصص في مراجعة وتقييم جودة ردود نماذج الذكاء الاصطناعي (LLMs). يتضمن العمل:
تقييم الدقة: التأكد من صحة المعلومات لغوياً وعلمياً في اللغتين العربية والإنجليزية.
تحليل البيانات: تصنيف الأخطاء وتقديم تغذية راجعة (Feedback) لتحسين أداء النماذج.
تجسيد الأداء: استخدام الرسوم البيانية لتتبع تطور دقة النموذج عبر مراحل التدريب المختلفة.
ضبط السلامة: ضمان خلو المخرجات من أي محتوى غير آمن أو مضلل."