تطوير نظام للتشكيل الآلي للغة العربية (Arabic Diacritization) باستخدام شبكات عصبية متكررة ثنائية الاتجاه (Bidirectional LSTMs)، لإعادة استعادة الحركات القصيرة (الضمة، الفتحة، الكسرة، إلخ) في النصوص غير المشكولة.
أبرز الإنجازات والنتائج:
دقة عالية (Accuracy): حقق النظام دقة تصل إلى 97.6% على نسبة 36% من بيانات الاختبار، ودقة 93.5% على نسبة 63% من البيانات.
تصنيف متقدم: حصد المشروع المركز الخامس من بين 16 فريقاً منافساً في تحدي تقني متخصص.
هندسة النماذج: استخدام معماريّة Bi-LSTM للتعامل مع السياق الأمامي والخلفي للجملة، مما يضمن دقة التشكيل بناءً على الموقع الإعرابي والمعنى.