قمت بتطوير نظام متكامل للرؤية الحاسوبية (Computer Vision) يهدف إلى التعرف على الرموز الهيروغليفية المصرية القديمة وتصنيفها بدقة عالية، وذلك للمساهمة في رقمنة التاريخ ودمج التكنولوجيا الحديثة مع علم المصريات.
المشروع ليس مجرد تدريب نموذج، بل هو خط إنتاج (Pipeline) كامل للبيانات، بدءاً من المعالجة المسبقة المعقدة وحتى التقييم الدقيق باستخدام أحدث معايير الـ Data Science.
أبرز ما تم إنجازه في هذا المشروع:
1. هندسة البيانات والمعالجة المسبقة (Data Engineering & Preprocessing):
موازنة البيانات (Data Balancing): قمت بكتابة خوارزميات مخصصة (Custom Algorithms) لحل مشكلة تباين البيانات (Imbalanced Data) عن طريق تقنيات الـ Upsampling للصور القليلة والـ Downsampling للفئات الكبيرة لضمان حيادية النموذج.
تعزيز البيانات (Data Augmentation): تطبيق تحويلات هندسية (Rotation, Flipping, Zooming) لزيادة حجم البيانات وتدريب النموذج على كافة الاحتمالات.
تنظيف البيانات: تحويل الصور للتدريج الرمادي (Grayscale) وتوحيد الأبعاد لضمان كفاءة المعالجة.
2. بناء نماذج الذكاء الاصطناعي (Model Architecture):
استخدام تقنية نقل التعلم (Transfer Learning) للاستفادة من أقوى الشبكات العصبية العالمية.
مقارنة وتدريب 3 معماريات مختلفة للوصول للأفضل:
VGG16: للدقة في استخراج الخصائص الأولية.
InceptionV3: للتعامل مع التفاصيل المعقدة داخل الرموز (حقق دقة 87% في الاختبار).
Xception: كخيار حديث يعتمد على Depthwise Separable Convolutions.
إضافة طبقات مخصصة (Custom Head) تشمل L2 Regularization و Dropout لمنع الـ Overfitting.
3. استراتيجيات التدريب والتحسين (Optimization Strategy):
استخدام Early Stopping لإيقاف التدريب في الوقت المثالي وتوفير الموارد.
تطبيق ReduceLROnPlateau لتعديل معدل التعلم (Learning Rate) ديناميكياً أثناء التدريب لتحسين النتائج الدقيقة.
4. التقييم والتحليل (Evaluation & Visualization):
لم أكتفِ بدقة النموذج (Accuracy)، بل قمت بتقييم الأداء باستخدام Precision, Recall, و F1-Score لضمان كفاءة التصنيف لكل رمز.
تصوير النتائج باستخدام Confusion Matrix و منحنيات التعلم (Learning Curves) لتحليل الأداء وكشف نقاط القوة والضعف.
التقنيات والأدوات المستخدمة:
Languague: Python
DL Frameworks: TensorFlow, Keras
Computer Vision: OpenCV, PIL
Analysis & Visualization: Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn