قمت بتطوير مشروع تحليل بيانات متكامل يعتمد على بيانات حقيقية لطيور البطريق (Palmer Penguins)، حيث تم تنفيذ الخطوات التالية:
إعداد ومعالجة البيانات:
حفظ البيانات بصيغة CSV مع الحفاظ على هيكلها ومحتواها الفعلي.
بناء قاعدة بيانات SQL:
إنشاء قاعدة بيانات SQLite واستيراد البيانات إليها.
كتابة وتنفيذ استعلامات SQL لاستخراج المؤشرات الإحصائية والتوزيعات الهامة.
التحليل الإحصائي والرسومي:
استخدام Python (Pandas + Matplotlib) لعرض النتائج وتحليلها بيانياً.
إنشاء رسوم بيانية (Histogram، Boxplot، Scatter plot، Heatmap) لتمثيل البيانات بصرياً.
إخراج التقرير النهائي:
دمج الجداول الإحصائية والرسوم التحليلية في تقرير PDF متعدد الصفحات.
إضافة صفحات ملخصات نصية وجداول مرتبة لتسهيل قراءة النتائج.
التكامل والتوزيع:
تجهيز نسخة Notebook (Google Colab) لتشغيل المشروع مباشرة على السحابة.
إمكانية رفع المشروع على GitHub مع ملف README وrequirements.txt لتوثيق وتشغيل الكود بسهولة.
التقنيات المستخدمة:
Python (Pandas, Matplotlib, SQLite3)
SQL (SQLite)
Google Colab
GitHub
المخرجات النهائية:
ملف CSV للبيانات المعالجة
ملف Python/Notebook يحتوي الكود الكامل للتحليل.
تقرير PDF احترافي متعدد الصفحات يحتوي على الجداول والرسوم البيانية.
مستودع GitHub جاهز للنشر أو التعديل.