توليد توصيفات قصيرة captions لصور مدخلة

تفاصيل العمل

تم تنفيذ هذا العمل باستخدام نوعين من الشبكات العصبونية الاصطناعية: الشبكات الالتفافية CNNs بهدف إدراك دلالات الصورة واستخراج سماتها - الشبكات التكرارية RNNs بهدف التعبير عن السمات المستخرجة بعبارات قصيرة.

وبهدف زيادة دقة ومتانة النظام، تم استخدام نقل التعلم Transfer Learning وذلك لاستثمار المعرفة التي تمتلكها كل من شبكتي EfficientNet-V2L وXception في ترميز الصور المدخلة.

من أجل الحصول على دقة عالية ونتائج أفضل تم الاعتماد على سمات نموذج GloVe المدرب مسبقاً لتمثيل البيانات النصية في نظامنا حيث ساهم في رفع دقة النظام.

بطاقة العمل

اسم المستقل Nour N.
عدد الإعجابات 1
عدد المشاهدات 26
تاريخ الإضافة
تاريخ الإنجاز