قمت في هذا المشروع بإجراء تحليل إحصائي متقدم لبيانات مرضى سرطان الرئة (Lung Cancer Dataset) لدراسة العوامل المؤثرة على معدلات البقاء على قيد الحياة. تضمن العمل استخدام لغة البرمجة R وتطبيق نماذج إحصائية حيوية دقيقة
وصف المشروع: قمت في هذا المشروع بإجراء تحليل إحصائي متقدم لبيانات مرضى سرطان الرئة (Lung Cancer Dataset) لدراسة العوامل المؤثرة على معدلات البقاء على قيد الحياة. تضمن العمل استخدام لغة البرمجة R وتطبيق نماذج إحصائية حيوية دقيقة.
أبرز المهام التي قمت بها:
تحليل كابلان-ماير (Kaplan-Meier): لتقدير منحنيات البقاء والمقارنة بين الجنسين (ذكور وإناث)، مع استخراج جداول المخاطر (Risk Tables).
نموذج كوكس للمخاطر المتناسبة (Cox Proportional Hazards Model): لدراسة تأثير متغيرات متعددة (الجنس، العمر، وفقدان الوزن) في وقت واحد وتحديد نسبة الخطورة (Hazard Ratio) لكل منها.
اختبار فرضيات النموذج: قمت بإجراء اختبار Schoenfeld residuals للتأكد من جودة وملاءمة النموذج الإحصائي للبيانات.
التصور البياني المتقدم: استخدام حزم مثل survminer و ggplot2 لإنتاج رسوم بيانية احترافية جاهزة للنشر في المجلات العلمية.
النتائج الرئيسية التي أظهرها التحليل:
وجود فرق ذو دلالة إحصائية في معدلات البقاء بناءً على الجنس (p=0.003) والعمر (p=0.038).
عدم وجود تأثير معنوي لمتغير فقدان الوزن على احتمالية البقاء في هذه العينة (p=0.902).