نظام ذكي لكشف الكسور العظمية في صور الأشعة السينية باستخدام تقنيات تعلم الآلة الكلاسيكية، مع تركيز على الشفافية والقابلية للتفسير والتكرار - مناسب للتطبيقات الطبية.
الهدف من المشروع:
تطوير نظام قابل للتفسير والتكرار لكشف الكسور العظمية في صور الأشعة السينية للجهاز العضلي الهيكلي باستخدام تقنيات Computer Vision الكلاسيكية ونماذج تعلم الآلة - بدون استخدام التعلم العميق - مع توفير مقاييس تقييم شاملة ومرئيات واضحة مناسبة للفهم السريري والعروض التقديمية.
قاعدة البيانات:
- MURA Dataset v1.1 من Stanford ML Group
- أكثر من 40,000 دراسة إشعاعية
- 7 أجزاء من الجسم (الكوع، الإصبع، الساعد، اليد، العضد، الكتف، المعصم)
- تصنيف ثنائي: طبيعي / غير طبيعي (وجود كسر)
? المنهجية العلمية:
**المعالجة المسبقة:**
- تغيير حجم الصور إلى 128×128
- معادلة الهيستوجرام (Histogram Equalization) لتحسين التباين
- تطبيق Gaussian Blur لتقليل التشويش
- تطبيع قيم البكسل
**استخراج الخصائص:**
- HOG (Histogram of Oriented Gradients) - تقنية متقدمة لالتقاط الأنماط والحواف
- 9 توجهات، 8×8 بكسل لكل خلية، 2×2 خلية لكل كتلة
- إنتاج متجه خصائص بأكثر من 3000 بُعد لكل صورة
**النماذج المستخدمة:**
- Linear SVM مع StandardScaler
- Logistic Regression مع StandardScaler (الأفضل)
- Random Forest
- K-Nearest Neighbors
- Decision Tree
النتائج والتقييم:
- أفضل نموذج: Logistic Regression
- F1-Score: ~0.53 على مجموعة التحقق
- مقاييس شاملة: Accuracy, Precision, Recall, F1-Score
- مصفوفات الالتباس لجميع النماذج
- منحنى ROC و AUC للنموذج الأفضل
- تحليل هامش القرار (تحليل الثقة)
- مسح العتبة (التوازن الأمثل لـ F1)
- التحقق المتقاطع الطبقي 5 أضعاف
المخرجات البصرية:
- أكثر من 10 رسومات بيانية احترافية
- عينات من قاعدة البيانات
- مصفوفات الالتباس
- مقارنة المقاييس
- أمثلة توضيحية عالية ومنخفضة الثقة
- خط المعالجة المسبقة
- رسوم بيانية لهوامش القرار
- منحنيات ROC
- تحليل العتبات
التقنيات المستخدمة:
- Python 3.8+
- scikit-learn - نماذج تعلم الآلة
- OpenCV - معالجة الصور
- NumPy & Pandas - معالجة البيانات
- Matplotlib & Seaborn - التصورات البيانية
- Joblib - حفظ النماذج
- Jupyter Notebook - بيئة التطوير
المميزات الرئيسية:
- قابل للتفسير: استخدام HOG وتعلم آلة كلاسيكي (بدون صناديق سوداء)
- قابل للتكرار: بذور عشوائية ثابتة، نماذج محفوظة، هيكل دفتر ملاحظات واضح
- مرئي: أكثر من 10 رسوم بيانية بجودة النشر للعروض التقديمية والتقارير
- شامل: تصور المعالجة المسبقة، تحليل الهامش، ضبط العتبة، التحقق المتقاطع
- قابل للتوسع: سهولة إضافة معالجة CLAHE، طرق Ensemble، أو خطوط أساسية للتعلم العميق
التطبيقات العملية:
- المستشفيات والمراكز الطبية
- أنظمة المساعدة في التشخيص
- أدوات الفحص الأولي للأشعة
- البحث الطبي والأكاديمي
- التعليم الطبي
محتويات المشروع:
- Jupyter Notebook شامل (من البيانات → الخصائص → النماذج → التقييم)
- ملف المتطلبات (requirements.txt)
- أفضل نموذج محفوظ (best_model.joblib)
- أكثر من 10 رسومات بيانية محفوظة
المشروع موثق بشكل احترافي، قابل للتكرار، ومناسب للنشر العلمي أو التطبيقات الطبية الحقيقية.