نوع العمل: مشروع بحثي وتطبيقي في مجال المعلوماتية الحيوية (Bioinformatics) والذكاء الاصطناعي.مميزات العمل:يعتمد على تحليل بيانات (RNA-Seq) الضخمة لتصنيف عينات سرطان الثدي بدقة إلى أنواعها الجزيئية (PAM50).استخدام تقنيات متقدمة لمعالجة البيانات وتصحيح الفروقات الفنية بين العينات.تحديد مجموعة مصغرة من المؤشرات الحيوية (Biomarkers) التي يمكن استخدامها في التشخيص الطبي المستقبلي.طريقة التنفيذ:معالجة البيانات: تنظيف وتحجيم بيانات التعبير الجيني باستخدام مكتبة (DESeq2).التحليل الاستكشافي: استخدام تحليل المكونات الرئيسية (PCA) والتجميع الهرمي (Hierarchical Clustering) لفهم توزيع العينات.اختيار الميزات: تحديد الجينات الأكثر تأثيراً عبر اختبارات (ANOVA) ومنهجية (SHAP) لتفسير قرارات النموذج.بناء النماذج: المقارنة بين خوارزميات متعددة مثل (Random Forest) و(SVM) و(XGBoost)، حيث حقق نموذج (Random Forest) أفضل أداء.