أكملت مشروع رائع يركز على التحقيق في بيانات Netflix.
تسليط الضوء على المشروع: تحقيق بيانات Netflix
في هذا المشروع، بحثت في بيانات Netflix لاستكشاف اتجاه مدة عرض الأفلام على مر السنين. باستخدام بايثون، قمت بتحليل مجموعة البيانات وحاولت الإجابة على سؤال رائع: هل أصبحت الأفلام على Netflix أقصر؟
إليكم لمحة عن رحلة مشروعي:
1- استكشاف البيانات: بدأت بتحميل مجموعة بيانات Netflix وتصفية البرامج التلفزيونية، مع التركيز فقط على الأفلام.
2- تحليل البيانات: قمت بدراسة الاتجاهات في مدة الفيلم، مع التركيز بشكل خاص على الأفلام التي تقل مدتها عن 60 دقيقة.
3- التصور: باستخدام Matplotlib، قمت بإنشاء مخطط متناثر يعرض فترات الفيلم على مر السنين، مرمزة بالألوان حسب مجموعات النوع.
4- الخلاصة: بعد التحليل الدقيق أجبت على السؤال الحاسم: "هل نحن متأكدون من أن الأفلام أصبحت أقصر؟"
استكشاف البيانات:
بعد التحليل الشامل، في المخطط المبعثر، يمثل كل لون نوعًا مختلفًا من الفيلم. إذا كانت نقاط بيانات متعددة (مبعثرة) تشترك في نفس اللون، فهذا يشير إلى أنها تنتمي إلى نفس نوع الفيلم.
الجواب على السؤال هل نحن متأكدون من أن الأفلام أصبحت أقصر؟ لا يوجد. عند فحص البيانات، يصبح من الواضح أن الأنواع مثل أفلام الأطفال والأفلام الوثائقية تتجمع جميعها حول النصف السفلي من الحبكة، مما يشير إلى أنه ليست كل الأفلام تشهد انخفاضًا في المدة.