تم تنفيذ تحليل واستكشاف البيانات (Exploratory Data Analysis - EDA) لمجموعة بيانات الأسماك بهدف فهم العلاقة بين الخصائص الفيزيائية (مثل الطول والعرض والارتفاع) وخصائص السمكة الأخرى مثل الوزن والنوع.
يشمل المشروع مرحلتين رئيسيتين:
التنبؤ بالوزن (Regression Task):
تدريب نماذج Linear Regression وRandom Forest Regressor وSupport Vector Regressor (SVR) للتنبؤ بوزن السمكة اعتمادًا على أبعادها.
تصنيف النوع (Classification Task):
تطبيق نماذج Logistic Regression, Decision Tree, وK-Nearest Neighbors (KNN) لتحديد نوع السمكة من خلال قياساتها الفيزيائية.
كما تم إجراء مقارنة شاملة بين النماذج من حيث الدقة (Accuracy) والخطأ (MAE / RMSE) واختيار النموذج الأفضل لكل مهمة.
- الأدوات والتقنيات المستخدمة:
Python, Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn, Jupyter Notebook