يحتوي هذا المشروع على تحليل و تصور لبيانات لنظام مشاركة دراجات بالولايات المتحدة الأمريكية و استخراج استنتاجات بناءا على البيانات و رسومات بيانية متنوعة لتوضيح الاستنتاجات للخبراء و لغير الخبراء بتحليل البيانات. البيانات مقسمة بالشهر على مدار حوالى 4 سنوات بداية من عام 2017 حتى شهر 8 عام 2020.
يحتوي المشروع على عدة أجزاء كالتالي:
- دمج البيانات في ملف واحد و تحتوي على حوالي 6500000 صف (Row / Record) و 25 عمود (Column / Feature) و هذا عدد صفوف كبير جدا بالنسبة للبيانات المتوفرة لدى أغلب الشركات و الأنظمة.
- الجزء الثاني و هو تحليل استكشافي للبيانات (Exploratory Data Analysis) لتحقيق نظرة وافية على البيانات و تحديد استراتيجيات مناسبة لتحليلها.
- الخطوة الثالثة هي تنظيف البيانات (Data cleaning and wrangling) و تتضمن حل المشاكل الموجودة في البيانات التي قد تعوق تحليلها مثل القيم الفقودة أو القيم المتطرفة.
- الجزء الرابع هو تحليل البيانات الجاهزة من المراحل السابقة.
- الجزء الأخير هو تصور البيانات عن طريق رسوم بيانية مما يتيح لأي شخص فهم نتائج تحليل البيانات الذي تم إجراؤه.
لقد قمت بإرفاق ملف للمشروع بصيغة html لإتاحة عرضه بدون تنصيب أي برامج إضافية كما قمت بإضافة بعض الصور من المشروع لإتاحة إلقاء نظرة بشكل أسرع.
اسم المستقل | محمد م. |
عدد الإعجابات | 3 |
عدد المشاهدات | 635 |
تاريخ الإضافة |