Lung Cancer Insights - دراسة العوامل المؤثره على سرطان الرئة

تفاصيل العمل

تم العمل على مجموعة بيانات تحتوي على 309 صفوف و16 عموداً، وهي تركز على العلاقة بين العمر، الجنس، والتدخين وأثرها على الإصابة بسرطان الرئة.

الخطوات التي تم تنفيذها على مجموعة البيانات:

قراءة البيانات: تم استيراد البيانات باستخدام مكتبة pandas وتحويلها إلى إطار بيانات (DataFrame).

استكشاف البيانات: تم فحص الهيكل الأساسي للبيانات باستخدام دوال مثل .shape لمعرفة عدد الصفوف والأعمدة، و .describe لتوليد الإحصائيات الوصفية.

التحقق من القيم الناقصة: تم استخدام .isnull().sum() للتأكد من عدم وجود قيم مفقودة في البيانات.

فرز وتصفية البيانات: تم فرز بيانات العمر والجنس واستخدام جداول التقاطع (crosstab) لتحليل العلاقات بين المتغيرات مثل سرطان الرئة والتدخين والجنس.

التحليل الإحصائي: تم تطبيق اختبار كاي-تربيع (chi-square test) على العلاقة بين التدخين وسرطان الرئة. كما تم استخدام معامل بيرسون لقياس الارتباط بين العمر والتدخين.

التصورات البيانية: تم إنشاء مخططات مثل المخططات الشريطية (bar charts) والمخططات المبعثرة (scatter plots) لتوضيح العلاقات بين المتغيرات المختلفة مثل التدخين وسرطان الرئة والعمر.

النتائج:

التدخين وسرطان الرئة: التحليل أظهر وجود علاقة إحصائية ذات دلالة بين التدخين وسرطان الرئة، حيث المدخنين لديهم نسبة أعلى للإصابة.

الجنس وسرطان الرئة: الفروق بين الجنسين ظهرت بشكل ملحوظ في النتائج، حيث كان الذكور أكثر عرضة للإصابة.

العمر وسرطان الرئة: تم اكتشاف أن تقدم العمر مرتبط بزيادة مخاطر الإصابة بسرطان الرئة.

التوصيات المستقبلية:

تحسين دقة البيانات ومعالجة القيم المفقودة والأنماط المتكررة قد يسهم في الحصول على نتائج أكثر موثوقية.

يمكن استخدام هذه النتائج لدعم الجهود الوقائية وزيادة الوعي حول مخاطر التدخين.

ملفات مرفقة

بطاقة العمل

اسم المستقل Maryam A.
عدد الإعجابات 0
عدد المشاهدات 5
تاريخ الإضافة