Implementing VIT transformer from scratch to classify images of mnist dataset

تفاصيل العمل

تنفيذ Vision Transformer (ViT) من الصفر لتصنيف الصور من مجموعة بيانات MNIST. يتضمن هذا المشروع بناء بنية المحول، بما في ذلك آليات الانتباه الذاتي(attention heads) والطبقات التقديمية (feedforward)، المصممة خصيصًا لمعالجة بيانات الصور. عن طريق تقسيم صور MNIST إلى أجزاء ومعالجتها.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
32
تاريخ الإضافة
تاريخ الإنجاز
المهارات