تفاصيل العمل

عنوان المشروع: مقارنة بين نماذج تعلم الآلة: الانحدار اللوجستي (Logistic Regression)، آلة الدعم المتجهة (SVM)، وغابة القرار العشوائية (Random Forest)

الهدف:

تطوير نماذج تعلم الآلة المختلفة وتقييم أدائها باستخدام مجموعة متنوعة من الطرق بما في ذلك الانحدار اللوجستي (Logistic Regression)، آلة الدعم المتجهة (SVM)، وغابة القرار العشوائية (Random Forest). التركيز كان على تحسين الأداء وزيادة الدقة عبر تقييم النماذج باستخدام Cross-Validation.

مراحل التنفيذ:

جمع المتطلبات:

تحديد الهدف من المشروع وهو مقارنة أداء نماذج مختلفة لتعلم الآلة على مجموعة بيانات معينة، باستخدام مقاييس الأداء مثل الدقة (Accuracy)، استرجاع البيانات (Recall)، والدقة التنبؤية (Precision).

تحليل البيانات:

تم استخدام مكتبة Pandas لتحليل البيانات، حيث تم تنظيف وتجهيز البيانات للتأكد من جاهزيتها للاستخدام في النماذج.

المكتبات المستخدمة:

jupyter notebook:لكتابه الاكواد

scikit-learn: لتطوير النماذج وتنفيذ عمليات التدريب والاختبار.

Pandas وNumPy: لتحليل البيانات ومعالجتها.

Matplotlib وSeaborn: لتصور النتائج والرسوم البيانية.

تطوير النماذج:

Logistic Regression: تم استخدامه كنموذج خطي لتصنيف البيانات.

SVM: تم استخدامه لتحقيق تصنيف دقيق باستخدام Margins بين الفئات.

Random Forest: تم تطويره كنموذج تجميعي يعتمد على عدة أشجار قرارات لزيادة الأداء والدقة.

تقييم النماذج:

KFold Cross-Validation: تم استخدام KFold لتقسيم البيانات وتقييم أداء النماذج بشكل موثوق.

تم حساب المقاييس المهمة مثل:

Accuracy: لقياس نسبة التنبؤات الصحيحة.

Precision وRecall: لتقييم كيفية تعامل النماذج مع التوازن بين التنبؤات الإيجابية والسلبية.

Confusion Matrix: تم استخدامه لتوضيح نتائج التنبؤات وتصنيف الأخطاء.

تحسين الأداء:

تم تحسين النماذج باستخدام Hyperparameter Tuning من خلال البحث الشبكي (Grid Search) لتحقيق أفضل أداء ممكن لكل نموذج.

المميزات:

المقارنة بين النماذج سمحت بفهم أعمق لكيفية تحسين الأداء.

استخدام أدوات متنوعة لتحليل البيانات وتحسين النماذج.

اعتماد تقنيات تقييم موثوقة مثل Cross-Validation لتحقيق نتائج دقيقة.

الملفات المصدرية/لقطات الشاشة:

تم إرفاق لقطات من البرمجة والنماذج المستخدمة لتوضيح تنفيذ العمل، بالإضافة إلى النتائج المتحصل عليها بعد تقييم النماذج.

بطاقة العمل

اسم المستقل Tarek N.
عدد الإعجابات 0
عدد المشاهدات 1
تاريخ الإضافة

المهارات المستخدمة