وصف المشروع :
نهدف في هذا المشروع إلى بناء نظام ذكي لتحليل بيانات السرطان (مثل Leukemia.csv وغيرها من بيانات السرطان الجيني) باستخدام خوارزميات التعلم الآلي وتقنيات اختيار الخصائص وتقليل الأبعاد.
خطوات المشروع:
1. اختيار مجموعتين من البيانات(مثل Leukemia و Breast Cancer) لتجربة الخوارزميات عليها.
2. استخدام مكتبات بايثون الأساسية مثل: `pandas`, `numpy`, `scikit-learn`, مع `tensorflow/keras` لتطبيق الشبكات العصبية.
3. تجربة ثلاث خوارزميات تصنيف مختلفة**:
* KNN
* SVM
* Neural Networks
4. تطبيق تقنيات اختيار الخصائص :
* من نوع Filter: (Variance Threshold, ANOVA F-test)
* من نوع Wrapper: (RFE, Sequential Feature Selection)
5. **تطبيق تقنيات تقليل الأبعاد** مثل:
* PCA
* UMAP أو t-SNE للتصوير البصري.
6. **تجربة أساليب التجميع (Clustering)**:
* K-Means
* Hierarchical Clustering
* DBSCAN
7. **بناء Ensemble** من النماذج السابقة لتحسين الأداء.
8. **إعداد تقرير نهائي** يوضح خطوات العمل، الرسوم التوضيحية، ومقارنة النتائج بين النماذج المختلفة.
مخرجات المشروع:
* كود بايثون منظم وقابل لإعادة الاستخدام.
* رسومات و Visualization للـ PCA و Clustering.
* مقارنة شاملة بين الخوارزميات المختلفة والـ Ensemble.
* تقرير نهائي منسق يوضح المنهجية، النتائج، والتحليل