في هذا المشروع، قمت بإجراء تحليل بيانات استكشافي (EDA) معمق لمجموعة بيانات تخص سكان لعبة "Animal Crossing: New Horizons". الهدف الأساسي كان فهم الخصائص الديموغرافية للسكان وتحديد العوامل التي تؤثر على شعبيتهم ("Wish Rank") بين اللاعبين.
لقد قمت بإدارة المشروع وتنفيذه بالكامل باستخدام لغة Python داخل بيئة Kaggle Notebooks.
المراحل والتقنيات المستخدمة:
1. استيراد وتجهيز البيانات (Data Import & Cleaning):
قمت باستيراد مجموعات البيانات من مصادر متعددة (ملفات CSV و TXT) باستخدام مكتبة Pandas.
شملت مرحلة التنظيف إزالة البيانات المكررة، التعامل مع القيم المفقودة، وتنظيف النصوص (إزالة الفراغات الزائدة وتوحيد حالة الأحرف) لضمان دقة التحليل.
قمت بتحويل الكود البرمجي الأصلي المكتوب بلغة R إلى Python لتنفيذ عمليات محددة مثل إنشاء ترتيب (Rank) بناءً على شعبية السكان.
2. دمج وتشكيل البيانات (Data Merging & Wrangling):
قمت بدمج مجموعات البيانات المختلفة (بيانات السكان مع بيانات الترتيب) بناءً على اسم الساكن ("Name") لإنشاء مجموعة بيانات موحدة وغنية بالمعلومات.
قمت بترشيح البيانات (Filtering) لإزالة المدخلات غير المرغوبة مثل "Not in stock"، وإعادة تعيين المؤشرات (Reset Index) لتسهيل عمليات المعالجة اللاحقة.
3. تجميع وتحليل البيانات (Data Aggregation & Analysis):
قمت بتجميع البيانات (Grouping) لحساب متوسط الترتيب ("Mean Wish Rank") بناءً على فئات مختلفة مثل فصيلة الحيوان ("Species") والسمات الشخصية ("Personality").
شمل التحليل فرز القيم (Sorting) لتحديد الفئات الأكثر والأقل شعبية.
4. تصوير البيانات (Data Visualization):
استخدمت مكتبة Seaborn (المرتكزة على Matplotlib) لإنشاء مخططات تشتت (Scatter Plots) احترافية.
قمت بتحسين المخططات من خلال:
ضبط حجم الشكل (Figure Size) ليكون واضحاً.
تدوير تسميات المحور السيني (X-axis labels rotation) لتفادي تداخل النصوص.
استخدام لوحات ألوان مخصصة (مثل 'BrBG' و 'cubehelix') لتمييز البيانات بصرياً.
ربط حجم النقاط بمتوسط الترتيب لإضافة بُعد تحليلي إضافي للمخطط.
الاستنتاجات الرئيسية (Insights):
تمكنت من تحديد متوسط مستويات الشعبية لكل فصيلة حيوانية وشخصية داخل اللعبة.
أظهر التحليل الأولي أن فصائل معينة (مثل القطط) تحظى بشعبية أعلى مقارنة بغيرها، وكذلك بعض السمات الشخصية.
توفر المخططات البيانية التفاعلية نظرة سريعة وواضحة لتوزيع السكان الأكثر رغبة بناءً على فصائلهم وشخصياتهم.