يركز هذا المشروع على تحليل بيانات جودة التفاح بهدف تصنيفها وتحديد العوامل المؤثرة على جودتها. قمت بإجراء تحليل استكشافي للبيانات (EDA) لفهم توزيع الخصائص مثل الحجم، الوزن، درجة الحلاوة، القرمشة، العصارة، ودرجة النضج، واكتشاف العلاقات بينها.
تم تنظيف البيانات ومعالجة القيم المفقودة وتحويل المتغيرات لتكون مناسبة للنماذج. بعد ذلك، تم بناء نموذج Machine Learning لتصنيف جودة التفاح (جيد / غير جيد) اعتمادًا على الخصائص المختلفة، مما يساعد في تحسين جودة المنتجات واتخاذ قرارات دقيقة في عمليات الفرز.