penguin Data Analysis Project
قمت بتحليل بيانات البطاريق لفهم الفروق بين الأنواع (Adelie, Chinstrap, Gentoo) ودراسة العلاقة بين القياسات الجسدية وتوزيعها على الجزر المختلفة.
شمل العمل:
تنظيف ومعالجة البيانات
تحليل استكشافي (EDA)
تصور البيانات باستخدام Matplotlib, Seaborn, وPower BI
بناء نماذج تعلم آلة للتنبؤ بالأنواع (Logistic Regression, Decision Trees, Random Forest)
استخدام NLP لتحليل الملاحظات النصية
النتيجة: الحصول على رؤى واضحة حول الاختلافات بين الأنواع وتوقع الأنواع بدقة عالية باستخدام النماذج.