تنبؤ وصف الدكتور لدواء المندوب الطبي (Medical Representative Prediction)

تفاصيل العمل

مشروع "تنبؤ أداء المندوب الطبي"

وصف المشروع:

يهدف هذا المشروع إلى استخدام تقنيات التعلم الآلي للتنبؤ باحتمالية وصف الأطباء لدواء معين، مما يساعد شركات الأدوية في تحسين جهودها التسويقية وزيادة كفاءة المندوبين الطبيين. يعتمد المشروع على تحليل بيانات وصف الأدوية وبناء نماذج تنبؤية متقدمة، مما يمكّن المندوبين الطبيين من اتخاذ قرارات مستنيرة وتقليل التكاليف وزيادة التأثير.

1. استكشاف البيانات (Data Exploration):

- تحليل البيانات التاريخية لوصفات الأدوية.

- دراسة العوامل المؤثرة في سلوك وصف الأطباء.

2. تنظيف البيانات وتحضيرها (Data Cleaning and Preprocessing):

- جمع البيانات باستخدام SQLMagic.

- معالجة القيم المفقودة وتصحيح التناقضات.

- تطبيع البيانات باستخدام Min-Max Scaler.

- ترميز المتغيرات الفئوية باستخدام الترميز الأحادي (One-Hot Encoding).

- حفظ النموذج وخطوات التحضير باستخدام Joblib للتطبيق المستقبلي.

3. اختيار النماذج وضبطها (Model Selection and Tuning):

تم تنفيذ وضبط ثلاثة نماذج للتعلم الآلي:

Decision Tree:

الضبط باستخدام GridSearchCV و 5-Fold Cross-Validation.

المعلمات المثلى:

max_depth: 4.

min_samples_leaf: 6.

min_samples_split: 2.

الأداء:

دقة التدريب: 74%.

دقة الاختبار: 81%.

درجة F1: تدريب (76%)، اختبار (85%).

AdaBoost (أفضل نموذج):

الدمج مع Decision Tree كالمقدر الأساسي.

المعلمات المثلى:

n_estimators: 85.

learning_rate: 0.4.

معلمات Decision Tree: max_depth: 4، min_samples_leaf: 14، min_samples_split: 8.

الأداء:

دقة التدريب: 86%.

دقة الاختبار: 85%.

درجة F1: تدريب (87%)، اختبار (88%).

درجة Fβ (β = 0.5): تدريب (87%)، اختبار (89%).

Support Vector Machine (SVM):

النواة: Polynomial.

المعلمات المثلى:

kernel: poly.

degree: 3.

C: 2.2.

الأداء:

دقة التدريب: 82%.

دقة الاختبار: 82%.

درجة F1: تدريب (85%)، اختبار (87%).

4. تطبيق النموذج (Model Deployment):

- تم بناء تطبيق مكتبي باستخدام مكتبة Tkinter.

- دمج النموذج التنبؤي لتقديم توصيات للمندوبين الطبيين.

- حفظ النموذج وخطوات التحضير باستخدام Joblib لتسهيل النشر.

5. النتائج والتأثير (Impact and Conclusion):

- تحسين كفاءة المندوبين الطبيين من خلال استهداف الأطباء الأكثر احتمالاً لوصف الأدوية.

- تقليل التكاليف من خلال تقليل الوقت والموارد المهدرة.

- دعم أفضل لاتخاذ القرارات بناءً على البيانات.

التقنيات المستخدمة:

تحليل البيانات والتصور:

Pandas، NumPy، Matplotlib، Seaborn.

تحضير البيانات:

SQLMagic، Min-Max Scaler، One-Hot Encoding، Joblib.

التعلم الآلي:

Decision Tree، AdaBoost، SVM.

تطبيق النموذج:

Tkinter، Joblib.

ملفات مرفقة

بطاقة العمل

اسم المستقل مازن ا.
عدد الإعجابات 0
عدد المشاهدات 3
تاريخ الإضافة
تاريخ الإنجاز