قمت فى هذا المشروع بالتعامل مع بيانات ضخمة (Dataset) لمرضى القلب كانت بتنسيق Excel حيث مرت الداتا برحلة كاملة من كونها بيانات خام (Raw Data) الى رؤى و تحليلات جاهزة لاتخاذ القرارات على النحو الاتى :
1. استيراد ومعالجة البيانات (Data ETL):
* استيراد البيانات من Excel إلى بيئة Microsoft SQL Server.
* فحص جودة البيانات (Data Profiling) لتحديد المشاكل الموجودة مثل القيم المفقودة (Nulls) أو السجلات المكررة.
2. تنظيف البيانات عبر SQL Queries:
* كتابة استعلامات (Queries) متقدمة لتنظيف البيانات، وتوحيد التنسيقات (Data Standardization).
* التعامل مع القيم المفقودة وتصحيح أنواع البيانات لضمان دقة العمليات الحسابية.
3. تحليل البيانات واستخراج الرؤى (Data Analysis):
* إجراء تحليل إحصائي لاستخراج أهم المؤشرات (KPIs) المتعلقة بأمراض القلب.
* ربط العوامل المختلفة (مثل العمر، الكوليسترول، والتدخين) ومدى تأثيرها على احتمالية الإصابة.
* تجهيز جداول نهائية منظمة يمكن استخدامها مباشرة في أدوات التصوير البياني (Data Visualization).
الأدوات المستخدمة:
* Microsoft SQL Server (SSMS): للمعالجة والتحليل الأساسي.
* T-SQL: لكتابة أوامر التنظيف والتحليل.
* Excel: للمعاينة الأولية للبيانات.