توصية المنتجات بناءً على التشابه

تفاصيل العمل

توصيف مشروع " توصية المنتجات بناءً على التشابه"

Visual_And_Textual_Products_Similarity

هدف المشروع

يهدف المشروع إلى توصية المنتجات بناءً على تشابهها باستخدام الميزات النصية والبصرية. يتم استخراج الميزات البصرية باستخدام نموذج ResNet-50، بينما يتم استخراج الميزات النصية باستخدام TinyBERT-6L. قبل استخراج الميزات، يتم معالجة الصور لإزالة الخلفيات باستخدام نموذج UNet المدرب على صور أزياء مثل الملابس، الحقائب، والأحذية.

مراحل التنفيذ

1. استيراد بيانات المنتجات

- الوصف: في هذه المرحلة، يتم استيراد بيانات المنتجات التي تحتوي على تفاصيل المنتج مثل اسم المنتج، الوصف النصي، ورابط الصورة.

- الأدوات: ملفات CSV أو JSON.

2. استيراد المكتبات والنماذج

- الوصف: يتم استيراد المكتبات البرمجية الضرورية مثل مكتبات التعلم العميق (TensorFlow, PyTorch)، إلى جانب استيراد النماذج المدربة مثل ResNet-50 وTinyBERT-6L.

- اللغات المستخدمة: لغة البرمجة Python.

3. معالجة البيانات (إزالة الخلفية) segmentation preprocessing using U-net model

- الوصف: يتم إزالة الخلفيات من صور المنتجات باستخدام نموذج UNet. الهدف هو إزالة أي تشويش أو عناصر غير مرغوبة من الصور واستبدالها بخلفية بيضاء، مع الحفاظ على نسبة الأبعاد.

- الأدوات: UNet Model، مكتبات OpenCV أو PIL.

4. استخراج الميزات feature extraction

- الميزات البصرية باستخدام ResNet-50:

يتم استخدام نموذج ResNet-50 المدرب لاستخراج الميزات البصرية من صور المنتجات بعد إزالة الخلفية.

- الميزات النصية باستخدام TinyBERT-6L:

يتم استخدام TinyBERT-6L لاستخراج الميزات النصية من وصف المنتج.

- الأدوات: ResNet-50، TinyBERT-6L، TensorFlow أو PyTorch.

5. تقليل الأبعاد (PCA)

- الوصف: بعد استخراج الميزات النصية والبصرية، يتم تقليل عدد أبعاد هذه الميزات باستخدام خوارزمية تحليل المكونات الرئيسية (PCA) لتحويلها إلى متجهات ذات 512 بعدًا.

- الأدوات: PCA، مكتبة Scikit-learn.

6. التطبيع ودمج الميزات

- الوصف: يتم تطبيع المتجهات المستخرجة من الميزات النصية والبصرية لضمان توافقها، ثم يتم دمجها في متجه واحد.

- الأدوات: Scikit-learn للتطبيع.

7. تخزين المتجهات

- الوصف: يتم تخزين المتجهات النهائية لكل منتج في قاعدة بيانات متجهات ليتم استخدامها لاحقًا في حساب التشابه بين المنتجات.

- الأدوات: Vector Database مثل Pinecone.

8. التصور Find the similar item to the required item

- الوصف: يتم عرض أفضل 7 منتجات مشابهة لمنتج معين بناءً على حساب التشابه باستخدام التشابه الكوني (Cosine Similarity).

- الأدوات: مكتبات للعرض مثل Matplotlib أو Seaborn.

مميزات المشروع

- استخدام ميزات بصرية ونصية متقدمة لزيادة دقة توصيات المنتجات.

- معالجة الصور باستخدام نموذج UNet لضمان عدم تأثر التشابه بعناصر غير مرغوبة.

- دمج الميزات النصية والبصرية لضمان تحليل شامل لكل منتج.

بطاقة العمل

اسم المستقل Ahmed A.
عدد الإعجابات 0
عدد المشاهدات 2
تاريخ الإضافة