لإظهار معرفتي واكتساب الخبرة ، قررت أن أقوم بمشروع بنفسي. لذلك ذهبت إلى موقع kaggle.com وبحثت عن Data set مناسبة لتحليلها ووجدت هذه Data set ، وهي عبارة data set sample فيها بيانات عن استخدام بطاقة الائتمان في الهند من 2013 إلى 2015 ، وتحتوي على معلومات أساسية مثل تاريخ العملية ، والمبلغ المنفق فى العملية وغيرها من المعلومات المهمة.
نقدر نقسم المشروع لاربع خطوات اساسيسة
الخطوة 1 تجهيز البيانات
لحسن الحظ ، Data set كانت منظمة وشبه جاهزة لاجراء التحليلات مباشرة
بس احتجت اقوم بعمل بعض التعديلات البسيطة زى ازالة Outliers وتعديل بعض Columns ويمكنك رؤية هذه التعديلات لانى وضعت نسخة من Data set قبل التعديل بالاضافة الى نسخة منها بعد التعديل
الخطوة 2، الاسئلة
قمت بكتابة عدد كبير من الاسئلة والعلاقات التى يمكننى استنتاجها من Data set، وهذه اهم الاسئلة
- كيف يختلف متوسط الإنفاق حسب الشهر؟
- هل هناك علاقة بين متوسط الانفاق ونوع البطاقة المستخدمة؟
- هل يختلف متوسط الانفاق من مدينة إلى اخرى؟
- هل يتأثر متوسط الإنفاق بالنوع (ذكر ام انثى)؟
الخطوة 3، تحليل البيانات
هذه هى الخطوة الاهم والاصعب، فى هذه الخطوة قمت بصناعة عدد من Pivot tables وقمت بصناعة رسوم بيانية، ثم قمت باخذ ملاحاظات والاجابة على الاسئلة بناء على هذه النتائج
الخطوة 4، عرض النتائج
بعد الانتهاء من التحليل اخذت اهم الاستنتاجات والملاحظات والرسوم البيانية وقمت بصناعة Presentation تلخص اهم تلك النتائج
فى رابط المشروع توجد كل الملفات المتعلقة بالمشروع.
ملوظة مهمة!!!!!!!
يرجى فتح الملفات عن طريق Excel وليس عن طريق Google sheets