وصف تحليل بيانات مرض القلب
قمت بتنفيذ تحليل استكشافي شامل لبيانات مرض القلب بهدف فهم طبيعة البيانات والعوامل المؤثرة على الإصابة بالمرض قبل بناء أي نموذج تنبؤي.
بدأت بتحليل المتغيرات الفردية من خلال دراسة توزيع كل خاصية على حدة، واكتشاف القيم الشاذة، وأنماط التوزيع، ومدى توازن البيانات، مما ساعد على تكوين صورة واضحة عن سلوك كل متغير بشكل مستقل.
بعد ذلك انتقلت إلى تحليل العلاقات الثنائية بين الخصائص والمتغير المستهدف، حيث تم دراسة تأثير كل خاصية على احتمالية الإصابة بمرض القلب، مع الاعتماد على التصور البياني لاكتشاف العلاقات، الاتجاهات، والفروق بين الفئات المختلفة.
اعتمد التحليل على الرسوم البيانية المناسبة لتوضيح العلاقات بشكل بصري واضح، مما سهّل استخراج رؤى حقيقية حول أكثر العوامل ارتباطًا بالمرض، وأبرز الخصائص ذات التأثير الأقوى، وكذلك الخصائص التي لا تضيف قيمة حقيقية للنموذج.
التحليل الاستكشافي ساهم في:
فهم البيانات بعمق بدل الاعتماد على الافتراضات
تحديد الخصائص المؤثرة وغير المؤثرة
دعم قرارات اختيار الخصائص وبناء النماذج لاحقًا
تقليل الأخطاء وتحسين جودة الأداء النهائي