Project Overview:
قمت بتنفيذ مشروع تحليل بيانات استكشافي (EDA) باستخدام SQL فقط بهدف فهم البيانات، اكتشاف الأنماط، تحليل السلوك، والكشف عن المشكلات داخل البيانات من خلال الاستعلامات المنظمة.
1. Data Understanding (فهم البيانات)
بدأت بتحليل هيكل قاعدة البيانات من خلال:
استعراض الجداول (Tables)
فحص الأعمدة (Columns) وأنواع البيانات (Data Types)
تحديد المفاتيح الأساسية (Primary Keys) والعلاقات (Relationships)
أمثلة:
SELECT * FROM table LIMIT 10;
DESCRIBE table;
2. Data Cleaning (تنظيف البيانات)
تحققت من جودة البيانات عن طريق:
اكتشاف القيم المفقودة (NULL Values)
إزالة التكرار (Duplicates)
التحقق من القيم غير المنطقية (Invalid Data)
أمثلة:
SELECT COUNT(*) FROM table WHERE column IS NULL;
SELECT column, COUNT(*) FROM table GROUP BY column HAVING COUNT(*) > 1;
3. Descriptive Analysis (التحليل الوصفي)
استخدمت دوال التجميع لتحليل البيانات:
المتوسط (AVG)
المجموع (SUM)
العدد (COUNT)
القيم العظمى والصغرى (MAX / MIN)
أمثلة:
SELECT AVG(sales), SUM(sales) FROM orders;
4. Data Exploration (استكشاف البيانات)
قمت بتحليل الأنماط والعلاقات باستخدام:
GROUP BY لتجميع البيانات
ORDER BY لترتيب النتائج
JOIN لدمج الجداول
CASE WHEN لإنشاء تصنيفات
أمثلة:
تحليل المبيعات حسب الفئة
تحليل العملاء حسب المناطق
5. Anomaly Detection (اكتشاف القيم الشاذة)
قمت بالكشف عن القيم غير الطبيعية باستخدام:
شروط منطقية (Conditions)
مقارنة القيم بمتوسطات أو حدود معينة
مثال:
SELECT * FROM sales WHERE amount > (SELECT AVG(amount)*3 FROM sales);
6. Advanced SQL Techniques (تقنيات متقدمة)
استخدمت مفاهيم متقدمة مثل:
Window Functions (مثل ROW_NUMBER, RANK)
Subqueries
CTEs (Common Table Expressions)
Aggregation with partitions
7. Business Insights (استخراج الرؤى)
في النهاية، قمت بتحويل النتائج إلى رؤى عملية مثل:
تحديد أفضل المنتجات أو الخدمات
تحليل سلوك العملاء
اكتشاف الاتجاهات الزمنية
دعم اتخاذ القرار بناءً على البيانات