قمت بتنفيذ مشروع تحليل بيانات لتطبيقات متجر Google Play باستخدام Python بهدف استخراج معلومات مهمة عن التطبيقات والأسعار والتقييمات.
البيانات المستخدمة من Kaggle:
خطوات العمل في المشروع:
* تنظيف البيانات ومعالجة القيم المفقودة
* تحويل أنواع البيانات مثل السعر والحجم وعدد التنزيلات
* تحليل التقييمات وعدد المراجعات
* تحليل التطبيقات المجانية والمدفوعة
* إنشاء رسومات بيانية لفهم الأنماط داخل البيانات
الأسئلة التي تم تحليلها في المشروع:
* ما هو أغلى تطبيق على المتجر؟
* أي فئة (Genre) تحتوي على أكبر عدد من التطبيقات؟
* ما متوسط حجم التطبيقات المجانية مقارنة بالتطبيقات المدفوعة؟
* ما هي أغلى 5 تطبيقات تقييمها 5؟
* كم عدد التطبيقات التي لديها أكثر من 50 ألف مراجعة؟
* ما متوسط سعر التطبيقات لكل فئة مع عدد التنزيلات؟
* كم عدد التطبيقات التي تقييمها أعلى من 4.7 وما متوسط سعرها؟
* كم حققت Google من التطبيقات التي لديها أكثر من 5,000,000 عملية تثبيت؟
* ما أكبر وأصغر حجم للتطبيقات المجانية والمدفوعة؟
* هل توجد علاقة بين التقييم وعدد المراجعات والحجم مع سعر التطبيق؟
* كم عدد التطبيقات لكل نوع (مجاني / مدفوع) حسب الفئة العمرية (Content Rating)؟
* كم عدد التطبيقات التي تعمل على إصدار Android 4؟
الأدوات المستخدمة:
Python – Pandas – NumPy – Matplotlib – Seaborn
هذا المشروع يوضح قدرتي على تنظيف البيانات وتحليلها واستخراج رؤى مفيدة تساعد في فهم سلوك المستخدمين واتجاهات السوق داخل متجر التطبيقات.