تحليل بيانات معلومات وراثية و جينية ل الوصول ل علاج للكورونا

تفاصيل العمل

في مشروعي كان الهدف تصنيف الوصفات إلى مجموعتين: "عالية الزيارات" و"منخفضة الزيارات". قمت ببناء نموذجين: نموذج أساسي ونموذج "Random Forest". كلا النموذجين حققا متطلبات الأداء، لكن نموذج الـ Random Forest كان أداؤه أفضل في التدريب وأسوأ قليلاً في الاختبار. لتحسين التقييم، طورت مؤشر أداء رئيسي جديد (KPI) يُسمى "نسبة التحويل للزيارات العالية"، والذي يعتمد على التوقعات الصحيحة والخاطئة للوصفات ذات الزيارات العالية.

كما أجريت تحليلًا استكشافيًا للبيانات (EDA) لفهم البيانات بشكل أفضل. واكتشفت أن الوصفات التي تحتوي على مكونات مثل "لحم الخنزير"، "الخضروات"، و"البطاطس" تجذب زيارات عالية، بينما الوصفات التي تحتوي على المشروبات كانت تجذب زيارات أقل.

باختصار، المشروع ركّز على مقارنة النماذج، تطوير مؤشرات أداء ملائمة، وتحليل البيانات بعمق لتحسين دقة التوقعات.

ملفات مرفقة

بطاقة العمل

اسم المستقل محمد س.
عدد الإعجابات 0
عدد المشاهدات 1
تاريخ الإضافة
تاريخ الإنجاز