في هذا المشروع قمت بتطوير نموذج تعلم آلي لتحليل وتصنيف بيانات الأدوية الطبية من خلال ملف بيانات حقيقي (Drugs_Data.csv). الهدف من المشروع هو التنبؤ بنتيجة التشخيص (Diagnosis) بناءً على مجموعة من الخصائص الطبية المرتبطة بكل عينة.
المشروع يتضمن:
- تنظيف ومعالجة البيانات: إزالة الأعمدة غير المهمة، التعامل مع القيم المفقودة والمكررة.
- تحليل استكشافي (EDA): عرض توزيعات الأعمدة، تحليل الارتباط بين الخصائص، وإنشاء رسوم بيانية توضيحية.
- إعداد البيانات للنموذج: تحويل البيانات النصية إلى قيم رقمية باستخدام Label Encoding.
- بناء نموذج تصنيف باستخدام خوارزمية Naive Bayes (BernoulliNB).
- تقييم النموذج باستخدام مؤشرات الأداء مثل: الدقة Accuracy، مصفوفة الالتباس Confusion Matrix، تقرير التصنيف Classification Report.
النتيجة: نموذج قادر على التنبؤ بنتيجة التشخيص بدقة عالية، مما يساعد على دعم القرارات الطبية بشكل أسرع وأكثر فعالية.
هذا المشروع مناسب للعملاء الذين يبحثون عن:
- تحليل وتصنيف بيانات طبية أو دوائية.
- نماذج تعلم آلي يمكن إعادة استخدامها أو تطويرها على بيانات مختلفة.
- أمثلة عملية لتطبيق Naive Bayes في تصنيف البيانات.