حسابي

بحث

القائمة

تجميع وتحليل بيانات وعرضها لتوقع الإصابة بالسكتة الدماغية (Stroke Prediction)

تفاصيل العمل

يهدف هذا المشروع إلى جمع وتحليل بيانات مرضى السكتة الدماغية من مجموعة متنوعة من المصادر، ثم القيام بتحليل استكشافي للبيانات و عرض النتائج باستخدام تقنيات التصور البياني (Data Visualization). يركز المشروع على فهم العوامل المؤثرة في حدوث السكتة الدماغية، مثل العمر، الجنس، ارتفاع ضغط الدم، السكري، وغيرها من العوامل التي قد تلعب دورًا في زيادة مخاطر الإصابة.

لا يتضمن المشروع بناء نماذج تعلم آلي، ولكن يُستخدم التحليل الإحصائي والتصور البياني لعرض النتائج بشكل واضح ومفهوم.

الخطوات الرئيسية للمشروع:

1. جمع البيانات:

المصدر: يتم جمع البيانات من مجموعات بيانات مفتوحة مثل Kaggle Stroke Prediction Dataset أو أي مصدر آخر يحتوي على معلومات طبية حول مرضى السكتة الدماغية.

البيانات المجمعة: تشمل البيانات متغيرات مثل:

العمر

الجنس

التاريخ الطبي (السكري، ضغط الدم المرتفع)

مستوى الجلوكوز في الدم

مؤشر كتلة الجسم (BMI)

نمط الحياة (التدخين، النشاط البدني)

2. تنظيف البيانات:

التعامل مع القيم المفقودة: سيتم استخدام طرق مثل التعويض بالقيم المتوسطة أو حذف الصفوف التي تحتوي على قيم مفقودة.

تحويل البيانات الفئوية إلى قيم رقمية: يتم استخدام الترميز (Label Encoding) لتحويل الأعمدة مثل الجنس و حالة التدخين إلى قيم رقمية.

3. تحليل البيانات:

التحليل الاستكشافي:

تحليل العوامل التي تؤثر على الإصابة بالسكتة الدماغية باستخدام التحليل الوصفي.

عرض التوزيع البياني للعوامل المختلفة باستخدام الرسوم البيانية مثل المخططات الصندوقية (Boxplots) و الهيستوجرامات (Histograms).

تحليل الارتباط بين المتغيرات (مثلاً: هل يوجد ارتباط بين مستوى الجلوكوز في الدم وارتفاع ضغط الدم).

4. التصور البياني للبيانات:

الرسوم البيانية: استخدام أدوات مثل Matplotlib و Seaborn لإنشاء رسومات بيانية تفاعلية تعرض:

توزيع العمر بين المرضى المصابين وغير المصابين بالسكتة الدماغية.

العلاقة بين الجنس وحالة الإصابة بالسكتة الدماغية.

العلاقة بين ارتفاع ضغط الدم والسكتة الدماغية.

التحليل المقارن بين المدخنين وغير المدخنين.

5. تحليل الارتباط بين المتغيرات:

الارتباط بين العوامل المؤثرة في السكتة الدماغية: من خلال حساب مصفوفة الارتباط بين المتغيرات لمعرفة تأثير العوامل المختلفة مثل السكري وارتفاع ضغط الدم على الإصابة.

استخدام المخططات الحرارية (Heatmap) لعرض مصفوفة الارتباط بين المتغيرات.

6. عرض النتائج:

تصور النتائج: استخدام الرسوم البيانية التفاعلية عبر أدوات مثل Dash أو Plotly لعرض البيانات بشكل جذاب.

اللوحات المعلوماتية (Dashboards): يمكن إنشاء لوحة عرض باستخدام أدوات مثل Power BI أو Tableau لعرض النتائج بصورة بصرية وتنظيمها بطريقة تفاعلية.

المكونات المستخدمة في المشروع:

البيانات:

Kaggle Stroke Prediction Dataset أو أي مصدر بيانات آخر موثوق.

الأدوات البرمجية:

Python: لتطوير وتحليل البيانات.

Pandas: للتعامل مع البيانات وتنظيفها.

Matplotlib و Seaborn: لتصور البيانات.

Jupyter Notebook أو Google Colab: لتنفيذ الكود وتحليل البيانات.

التحديات التي تم التعامل معها:

التعامل مع البيانات المفقودة: التعامل مع القيم المفقودة من خلال استراتيجيات التعويض المناسبة.

فهم العلاقة بين العوامل المختلفة: فهم تأثير المتغيرات المختلفة على الإصابة بالسكتة الدماغية وتحليلها باستخدام الرسوم البيانية.

النتائج:

تمكنت من جمع وتحليل البيانات بشكل فعال باستخدام الأدوات المناسبة، مع عرض النتائج بشكل مرئي واضح. تظهر الرسوم البيانية تحليلًا للعوامل المؤثرة في الإصابة بالسكتة الدماغية، مما يساعد على فهم البيانات بشكل أفضل.

ملخص: يركز هذا المشروع على تحليل البيانات حول مرض السكتة الدماغية باستخدام أدوات التصور البياني لتحليل العوامل المؤثرة في الإصابة بالسكتة الدماغية. هذا المشروع يمكن أن يساعد الباحثين أو المهنيين الصحيين في فهم الأنماط والاتجاهات التي قد تؤدي إلى الإصابة بالسكتة الدماغية، مع تقديم رؤى قيمة من خلال التصورات البيانية دون استخدام النماذج المعقدة.

ملفات مرفقة

بطاقة العمل

اسم المستقل Saif Eldin F.
عدد الإعجابات 1
عدد المشاهدات 5
تاريخ الإضافة