بناء نظام تعلم آلة متكامل (ML Pipeline) وتطبيق ويب للتشخيص الطبي

تفاصيل العمل

قمت بتطوير مسار متكامل لتعلم الآلة (End-to-End ML Pipeline) من الصفر لتوقع احتمالية الإصابة بأمراض الكبد بناءً على الفحوصات المخبرية للمرضى. صُمم المشروع بهيكلة برمجية احترافية ونظيفة (Modular Code) تفصل بين مراحل جلب البيانات، هندسة الميزات، وتدريب النموذج، مما يجعله قابلاً للتطوير والصيانة بسهولة.

تعاملت في هذا المشروع مع التحديات الحقيقية للبيانات؛ حيث عالجت القيم المنحرفة (Skewed Data) باستخدام التحويلات اللوغاريتمية (Log Transform)، وحللت مشكلة عدم توازن فئات البيانات ببراعة باستخدام تقنية (SMOTE) لضمان أقصى درجات الدقة والعدالة لخوارزمية (Random Forest) المستخدمة. ولجعل المشروع ذا قيمة عملية وملموسة، قمت ببرمجة ونشر واجهة ويب تفاعلية تتيح للمستخدمين إدخال البيانات الطبية والحصول على توقع فوري.

أهم مميزات المشروع التقنية:

هندسة مسار البيانات (Pipeline Architecture): بناء نظام آلي يدمج تنظيف البيانات، استخراج الميزات، والتدريب في مسار واحد سلس.

معالجة متقدمة للبيانات: تطبيق تقنيات المعالجة المسبقة (Preprocessing) وتقنية SMOTE لتوليد عينات اصطناعية وموازنة البيانات الطبية الحساسة.

تدريب وتقييم صارم: استخدام تقنية (Stratified K-Fold Cross Validation) لتقييم النموذج بموثوقية عالية والتأكد من عدم حدوث تخصيص زائد (Overfitting).

تطبيق ويب تفاعلي: تطوير واجهة مستخدم سلسة باستخدام إطار عمل (Streamlit) لعرض نتائج النموذج بشكل مباشر وعملي.

هيكلة إنتاجية (Production-Ready): تنظيم ملفات المشروع بشكل قياسي يسهل عملية النشر (Deployment).

التقنيات المستخدمة في المشروع:

لغة البرمجة: Python

تعلم الآلة ومعالجة البيانات: Scikit-Learn (Random Forest), Pandas, SMOTE

تطوير واجهة الويب: Streamlit

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات