تصنيف وتصور منتجات التجارة الإلكترونية ️
نظرة عامة على المشروع
يقدم قطاع التجارة الإلكترونية المتزايد مجموعة بيانات كبيرة تنتظر أن يتم استخراجها والبحث فيها. تتضمن مجموعة البيانات هذه صور منتجات عالية الدقة تم التقاطها بشكل احترافي، والعديد من السمات الوصفية التي تصف كل منتج، ونصوص وصفية تتعلق بخصائص المنتج.
وصف مجموعة البيانات
يتم التعرف على كل منتج بواسطة معرّف مثل 42431. تتكون مجموعة البيانات من المكونات التالية:
styles.csv: يحتوي على ربط معرّفات المنتجات بسماتها.
images/: يحتوي على صور المنتجات، مثل images/42431.jpg.
محتويات styles.csv:
id: معرّف فريد لكل منتج.
gender: فئة الجنس (مثل: ذكر، أنثى).
masterCategory: فئة المنتج الرئيسية (مثل: ملابس، إكسسوارات).
subCategory: فئة المنتج الأكثر تحديدًا (مثل: ملابس علوية، ملابس سفلية).
articleType: نوع المادة (مثل: قميص، بنطلون).
baseColour: اللون الأساسي للمنتج.
season: الموسم المرتبط بالمنتج (مثل: صيف، شتاء).
usage: الاستخدام المقصود (مثل: غير رسمي، رسمي).
year: سنة إصدار المنتج.
تصور البيانات
نستكشف مجموعة البيانات ونتصور جوانب مختلفة باستخدام أنواع مختلفة من الرسوم البيانية. أدناه أنواع التصويرات التي أنشأناها والصور المقابلة لها:
1. رسم بياني خطي
الوصف: يظهر اتجاه المنتجات الموضة على مر السنين.
الصورة:
2. رسم بياني شريطي
الوصف: يعرض توزيع الفئات الرئيسية.
الصورة:
3. رسم بياني هيستوغرام
الوصف: يوضح توزيع المنتجات حسب السنة.
الصورة:
4. رسم بياني دائري
الوصف: يمثل توزيع المنتجات حسب الجنس.
الصورة:
5. رسم بياني مبعثر
الوصف: يوضح العلاقة بين معرّف المنتج والسنة.
الصورة:
6. رسم بياني صندوقي
الوصف: يظهر توزيع السنوات عبر الفئات الرئيسية المختلفة.
الصورة:
7. رسم بياني للأزواج
الوصف: يوضح العلاقات بين الميزات بشكل زوجي.
الصورة:
تدريب وتقييم النموذج ?
قمنا بتنفيذ نموذج تعلم عميق باستخدام TensorFlow لتصنيف صور المنتجات إلى فئات مختلفة. أدناه نظرة عامة على هيكل النموذج وعملية التدريب.
هيكل النموذج
النموذج الأساسي: استخدمنا ResNet50، وهو شبكة عصبية عميقة مدربة مسبقًا على مجموعة بيانات ImageNet، كنموذج أساسي. يعرف هذا النموذج بدقته في مهام تصنيف الصور.
الطبقات المخصصة: على قمة نموذج ResNet50 الأساسي، أضفنا طبقة تجميع متوسطة عالمية، وطبقة إسقاط لمنع فرط التخصيص، وطبقة كثيفة مع تفعيل Softmax للتصنيف إلى فئات متعددة.
معالجة البيانات
معالجة الصور: تم تغيير حجم الصور إلى 60 × 80 بكسل وتم تطبيعها لتكون قيم البيكسل بين 0 و 1.
زيادة البيانات: تم استخدام تقنيات مثل إعادة القياس لزيادة تنوع بيانات التدريب ومساعدة النموذج على التعميم بشكل أفضل.
عملية التدريب
المحسن: استخدمنا محسن Adam، المعروف بكفاءته في تدريب الشبكات العصبية العميقة.
دالة الخسارة: تم استخدام خسارة كروس انتروبي متعددة الفئات كدالة الخسارة، وهو ما يناسب مشاكل التصنيف متعددة الفئات.
المقاييس: تم تتبع الدقة خلال التدريب لتقييم أداء النموذج.
الفترات الزمنية: تم تدريب النموذج لمدة 15 فترة زمنية.
التقييم
التحقق: تم استخدام مجموعة بيانات تحقق منفصلة لمراقبة أداء النموذج أثناء التدريب ومنع فرط التخصيص.
دقة الاختبار: بعد التدريب، تم تقييم النموذج على مجموعة بيانات الاختبار لتقييم دقته وقدرته على التعميم.
الاختبار والنشر ?
لاختبار النموذج، قمنا بتطوير تطبيق Streamlit يسمح للمستخدمين بتحميل صورة والحصول على تنبؤات مع توصيات.
عملية الاختبار
تحميل النموذج: يتم تحميل النموذج المدرب باستخدام TensorFlow.
تحميل الصورة: يمكن للمستخدمين تحميل صورة من خلال واجهة Streamlit.
المعالجة المسبقة: يتم معالجة الصورة المحملة لتتطابق مع التنسيق المتوقع من قبل النموذج.
التنبؤ: يتنبأ النموذج بفئة الصورة المحملة.
التوصيات: بناءً على الفئة المتوقعة، يقوم التطبيق بجلب وعرض صور منتجات مماثلة.
ميزات تطبيق Streamlit
واجهة المستخدم: واجهة بسيطة وتفاعلية لتحميل الصور وعرض النتائج.
التوصيات: تعرض أعلى 5 صور موصى بها من الفئة المتوقعة.
عرض الاحتمالية: تظهر احتمالية الصورة الأكثر تشابهًا.
الخاتمة
يظهر هذا المشروع تطبيق التعلم العميق في تصنيف منتجات التجارة الإلكترونية وتقديم توصيات بناءً على صور المنتجات. يجمع بين تصور البيانات، وتدريب النموذج، والاختبار التفاعلي، مما يبرز إمكانيات التعلم الآلي في مجال التجارة الإلكترونية.
اسم المستقل | Abdelrahman H. |
عدد الإعجابات | 0 |
عدد المشاهدات | 6 |
تاريخ الإضافة |