عنوان العمل: هندسة وتنظيف البيانات المتقدمة باستخدام SQL
وصف المشروع:
يركز هذا العمل على المرحلة الأهم في تحليل البيانات وهي (Data Cleaning & Preparation). قمت بمعالجة قاعدة بيانات خام تحتوي على أخطاء وتكرارات وقيم مفقودة، وتحويلها إلى قاعدة بيانات منظمة وجاهزة للاستخدام في اتخاذ القرارات أو العرض البصري.
المهام التقنية التي قمت بها:
معالجة البيانات المفقودة (Handling Missing Data): قمت بكتابة استعلامات SQL متطورة (Self-Joins) لتعبئة الحقول الفارغة آلياً بناءً على سجلات تاريخية لنفس الشركة، مما رفع من دقة البيانات.
إزالة التكرارات (Deduplication): استخدمت تقنيات SQL لتحديد وحذف السجلات المكررة لضمان عدم تضخم الأرقام بشكل خاطئ.
هيكلة البيانات (Data Transformation): قمت بتعديل أنواع البيانات (Data Types) وإعادة صياغة الأعمدة لتتناسب مع معايير التحليل القياسية.
تحسين الأداء (Schema Optimization): قمت بتنظيف جداول قاعدة البيانات من الأعمدة المؤقتة وغير الضرورية باستخدام أوامر ALTER و DROP لزيادة سرعة استجابة الاستعلامات.
الأدوات المستخدمة:
MySQL Workbench.
Advanced SQL Queries (Joins, CTEs, Data Manipulation Language).