قمت في هذا المشروع بالتعامل مع قاعدة بيانات ضخمة مستخرجة من موقع أمازون تحتوي على أكثر من 50,000 صف، حيث تم توظيف لغة Python ومكتباتها المتقدمة لإتمام المهام التالية:
تنظيف البيانات (Data Cleaning): باستخدام مكتبة Pandas لمعالجة القيم المفقودة، وتصحيح أنواع البيانات، وإزالة التكرارات لضمان دقة التحليل.
هيكلة البيانات: تحويل البيانات الخام إلى جداول منظمة يسهل التعامل معها برمجياً.
التحليل الإحصائي: استخراج رؤى دقيقة حول الأسعار، التقييمات، وأكثر الفئات مبيعاً باستخدام NumPy.
التمثيل البصري (Visualization): إنشاء رسوم بيانية توضح اتجاهات السوق باستخدام Matplotlib و Seaborn.
الأتمتة (Automation): بناء "سكربت" قادر على معالجة هذا الكم الهائل من البيانات في ثوانٍ معدودة، وهو ما يصعب تنفيذه يدوياً أو بالأدوات التقليدية.