تم العمل على مجموعة بيانات تحتوي على 309 صفوف و16 عموداً، وهي تركز على العلاقة بين العمر، الجنس، والتدخين وأثرها على الإصابة بسرطان الرئة.
الخطوات التي تم تنفيذها على مجموعة البيانات:
قراءة البيانات: تم استيراد البيانات باستخدام مكتبة pandas وتحويلها إلى إطار بيانات (DataFrame).
استكشاف البيانات: تم فحص الهيكل الأساسي للبيانات باستخدام دوال مثل .shape لمعرفة عدد الصفوف والأعمدة، و .describe لتوليد الإحصائيات الوصفية.
التحقق من القيم الناقصة: تم استخدام .isnull().sum() للتأكد من عدم وجود قيم مفقودة في البيانات.
فرز وتصفية البيانات: تم فرز بيانات العمر والجنس واستخدام جداول التقاطع (crosstab) لتحليل العلاقات بين المتغيرات مثل سرطان الرئة والتدخين والجنس.
التحليل الإحصائي: تم تطبيق اختبار كاي-تربيع (chi-square test) على العلاقة بين التدخين وسرطان الرئة. كما تم استخدام معامل بيرسون لقياس الارتباط بين العمر والتدخين.
التصورات البيانية: تم إنشاء مخططات مثل المخططات الشريطية (bar charts) والمخططات المبعثرة (scatter plots) لتوضيح العلاقات بين المتغيرات المختلفة مثل التدخين وسرطان الرئة والعمر.
النتائج:
التدخين وسرطان الرئة: التحليل أظهر وجود علاقة إحصائية ذات دلالة بين التدخين وسرطان الرئة، حيث المدخنين لديهم نسبة أعلى للإصابة.
الجنس وسرطان الرئة: الفروق بين الجنسين ظهرت بشكل ملحوظ في النتائج، حيث كان الذكور أكثر عرضة للإصابة.
العمر وسرطان الرئة: تم اكتشاف أن تقدم العمر مرتبط بزيادة مخاطر الإصابة بسرطان الرئة.
التوصيات المستقبلية:
تحسين دقة البيانات ومعالجة القيم المفقودة والأنماط المتكررة قد يسهم في الحصول على نتائج أكثر موثوقية.
يمكن استخدام هذه النتائج لدعم الجهود الوقائية وزيادة الوعي حول مخاطر التدخين.
اسم المستقل | Maryam A. |
عدد الإعجابات | 0 |
عدد المشاهدات | 5 |
تاريخ الإضافة |