الأدوات والتقنيات المستخدمة:
Python (Pandas, NumPy): لتنظيف البيانات ومعالجتها.
Matplotlib, Seaborn, Plotly: لإنشاء رسوم بيانية توضيحية تفاعلية وساكنة.
SciPy: لإجراء اختبارات إحصائية مثل اختبار الفرضيات (T-Test).
الخطوات المنفذة في المشروع:
تحميل البيانات من ملف CSV وفحص بنيتها الأساسية.
معالجة القيم المفقودة عبر حذف السجلات غير الكاملة في الأعمدة المهمة.
معالجة التواريخ وتحويلها إلى صيغة زمنية قابلة للتحليل، مع استخراج معلومات إضافية مثل اليوم من الأسبوع والشهر.
إنشاء أعمدة مشتقة (مثل تحديد ما إذا كان اليوم عطلة نهاية أسبوع).
التحليل الإحصائي الوصفي لتوزيع تركيز الأوزون وفهم المتوسط والانحراف المعياري والقيم القصوى.
الكشف عن القيم الشاذة باستخدام الرسوم الصندوقية (Boxplots).
إجراء اختبارات إحصائية للمقارنة بين مستويات الأوزون في عطلة نهاية الأسبوع وأيام الأسبوع.
حفظ البيانات النظيفة في ملف CSV لاستخدامها لاحقاً.
القيمة المضافة:
يوفر هذا المشروع إطار عمل متكامل لتحليل جودة الهواء من خلال الجمع بين تنظيف البيانات والتحليل الإحصائي والتصور البصري، مما يمكّن الباحثين وصناع القرار من فهم التغيرات في مستويات الأوزون واتخاذ قرارات مبنية على البيانات.