تفاصيل العمل

هل يمكن للذكاء الاصطناعي التنبؤ بمستوى دخلك؟

قمت ببناء نموذج تعلم آلي كامل يعتمد على مجموعة بيانات التعداد السكاني الأمريكية (UCI Adult Dataset) لتصنيف ما إذا كان دخل الشخص أكثر من 50 ألف دولار سنويًا — والنتائج كانت مدهشة!

️ الأدوات المستخدمة:

Python · Pandas · Scikit-learn · Seaborn · Matplotlib

أهداف المشروع:

بناء نظام تنبؤ قابل للتفسير وقابل للتوسيع

مقارنة أداء 6 خوارزميات تعلم آلي

التعامل مع تحديات البيانات الواقعية: القيم المفقودة وعدم توازن الفئات

️ مراحل التنفيذ:

تنظيف البيانات ومعالجتها (LabelEncoder, StandardScaler)

تحويل الهدف إلى قيمة ثنائية (الدخل → 0 أو 1)

تدريب النماذج التالية:

• الانحدار اللوجستي

• شجرة القرار

• الغابة العشوائية

• آلة الدعم الناقل (SVM)

• أقرب الجيران (KNN)

• نايف بايز Gaussian

التقييم باستخدام:

• الدقة، الاسترجاع، الدقة النوعية، وF1-score

• مصفوفة الالتباس (Heatmap)

• مقياس ROC AUC

• مخطط مقارنة بين النماذج

أهم النتائج:

نموذج الغابة العشوائية (Random Forest) حقق أعلى دقة

️ لكن عدم توازن البيانات أثر على استرجاع الفئة ذات الدخل الأعلى — مما أبرز أهمية استخدام مقاييس تقييم مناسبة.

هذا المشروع ساعدني على تطوير مهاراتي في:

تنظيف البيانات، اختيار النماذج، وتحليل الأداء وتقديم النتائج بشكل بصري ومهني.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
14
تاريخ الإضافة
تاريخ الإنجاز
المهارات