تنفيذ Vision Transformer (ViT) من الصفر لتصنيف الصور من مجموعة بيانات MNIST. يتضمن هذا المشروع بناء بنية المحول، بما في ذلك آليات الانتباه الذاتي(attention heads) والطبقات التقديمية (feedforward)، المصممة خصيصًا لمعالجة بيانات الصور. عن طريق تقسيم صور MNIST إلى أجزاء ومعالجتها.