توصيف مشروع " توصية المنتجات بناءً على التشابه"
Visual_And_Textual_Products_Similarity
هدف المشروع
يهدف المشروع إلى توصية المنتجات بناءً على تشابهها باستخدام الميزات النصية والبصرية. يتم استخراج الميزات البصرية باستخدام نموذج ResNet-50، بينما يتم استخراج الميزات النصية باستخدام TinyBERT-6L. قبل استخراج الميزات، يتم معالجة الصور لإزالة الخلفيات باستخدام نموذج UNet المدرب على صور أزياء مثل الملابس، الحقائب، والأحذية.
مراحل التنفيذ
1. استيراد بيانات المنتجات
- الوصف: في هذه المرحلة، يتم استيراد بيانات المنتجات التي تحتوي على تفاصيل المنتج مثل اسم المنتج، الوصف النصي، ورابط الصورة.
- الأدوات: ملفات CSV أو JSON.
2. استيراد المكتبات والنماذج
- الوصف: يتم استيراد المكتبات البرمجية الضرورية مثل مكتبات التعلم العميق (TensorFlow, PyTorch)، إلى جانب استيراد النماذج المدربة مثل ResNet-50 وTinyBERT-6L.
- اللغات المستخدمة: لغة البرمجة Python.
3. معالجة البيانات (إزالة الخلفية) segmentation preprocessing using U-net model
- الوصف: يتم إزالة الخلفيات من صور المنتجات باستخدام نموذج UNet. الهدف هو إزالة أي تشويش أو عناصر غير مرغوبة من الصور واستبدالها بخلفية بيضاء، مع الحفاظ على نسبة الأبعاد.
- الأدوات: UNet Model، مكتبات OpenCV أو PIL.
4. استخراج الميزات feature extraction
- الميزات البصرية باستخدام ResNet-50:
يتم استخدام نموذج ResNet-50 المدرب لاستخراج الميزات البصرية من صور المنتجات بعد إزالة الخلفية.
- الميزات النصية باستخدام TinyBERT-6L:
يتم استخدام TinyBERT-6L لاستخراج الميزات النصية من وصف المنتج.
- الأدوات: ResNet-50، TinyBERT-6L، TensorFlow أو PyTorch.
5. تقليل الأبعاد (PCA)
- الوصف: بعد استخراج الميزات النصية والبصرية، يتم تقليل عدد أبعاد هذه الميزات باستخدام خوارزمية تحليل المكونات الرئيسية (PCA) لتحويلها إلى متجهات ذات 512 بعدًا.
- الأدوات: PCA، مكتبة Scikit-learn.
6. التطبيع ودمج الميزات
- الوصف: يتم تطبيع المتجهات المستخرجة من الميزات النصية والبصرية لضمان توافقها، ثم يتم دمجها في متجه واحد.
- الأدوات: Scikit-learn للتطبيع.
7. تخزين المتجهات
- الوصف: يتم تخزين المتجهات النهائية لكل منتج في قاعدة بيانات متجهات ليتم استخدامها لاحقًا في حساب التشابه بين المنتجات.
- الأدوات: Vector Database مثل Pinecone.
8. التصور Find the similar item to the required item
- الوصف: يتم عرض أفضل 7 منتجات مشابهة لمنتج معين بناءً على حساب التشابه باستخدام التشابه الكوني (Cosine Similarity).
- الأدوات: مكتبات للعرض مثل Matplotlib أو Seaborn.
مميزات المشروع
- استخدام ميزات بصرية ونصية متقدمة لزيادة دقة توصيات المنتجات.
- معالجة الصور باستخدام نموذج UNet لضمان عدم تأثر التشابه بعناصر غير مرغوبة.
- دمج الميزات النصية والبصرية لضمان تحليل شامل لكل منتج.
اسم المستقل | Ahmed A. |
عدد الإعجابات | 0 |
عدد المشاهدات | 7 |
تاريخ الإضافة |