مشروع بناء مصنف معالم باستخدام الشبكات العصبية الالتفافية (CNN)

تفاصيل العمل

في هذا المشروع، قمتُ بتطبيق المهارات التي اكتسبتها في دورة الشبكات العصبية الالتفافية (CNN) لبناء مصنف للمعالم (Landmark Classifier).

تعتمد خدمات مشاركة الصور وتخزينها غالبًا على بيانات الموقع لكل صورة يتم رفعها. فهذه البيانات تمكّنها من تقديم ميزات متقدمة، مثل اقتراح الوسوم المناسبة تلقائيًا أو تنظيم الصور بشكل آلي، مما يحسّن تجربة المستخدم. لكن ليست كل الصور تحتوي على بيانات موقع في بياناتها الوصفية (Metadata). يحدث ذلك عندما لا يحتوي الجهاز على نظام GPS، أو عندما تُحذف البيانات الوصفية لأسباب تتعلق بالخصوصية.

عند غياب بيانات الموقع، يمكن استنتاجه عن طريق اكتشاف وتصنيف معلم ظاهر في الصورة. وبالنظر إلى العدد الهائل من المعالم حول العالم، والحجم الضخم من الصور التي تُرفع إلى هذه الخدمات، فإن الاعتماد على التصنيف اليدوي غير عملي.

للتعامل مع هذه المشكلة، بدأتُ بخطوات أولية من خلال بناء نماذج تتنبأ بمكان الصورة اعتمادًا على المعالم الظاهرة فيها. اتبعت العملية الكاملة لتصميم أنظمة التعلم الآلي: بدءًا من معالجة البيانات، وتصميم وتدريب شبكات CNN، ومقارنة دقة النماذج المختلفة، وصولًا إلى نشر تطبيق يعتمد على أفضل نموذج تم تدريبه.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
المهارات