تطوير نظام ذكاء اصطناعي (AI) لتصنيف وتحليل بيانات العملاء آلياً

تفاصيل العمل

مهندس تعلّم آلي وبيانات عملت على مشروع Forcatick لتحسين رضا العملاء عبر تحليل الشكاوى والتعليقات. كنت مسؤولاً عن كل مرحلة من تجميع البيانات وتنظيفها إلى تدريب النماذج ونشر واجهات استدلال جاهزة للاستخدام

جمع البيانات وتنظيمها: جمع وتجميع تعليقات وسائل التواصل (~30,000 تعليق) وبيانات تذاكر مركز الاتصال بصيغ CSV موثّقة.

2. تحضير البيانات (Preprocessing): تنظيف النصوص، إزالة الضوضاء، توحيد الحقول، وتعامل مع اختلافات المنصّات (Facebook, Twitter…).

3. استخراج الميزات: تصميم واستخراج ميزات نصية مناسبة (TF-IDF، تلميحات كلمات، أو تمثيلات مضمونية) لتحسين قدرة النماذج على التمييز.

4. تصميم أنابيب التدريب: بناء أنابيب قابلة لإعادة التشغيل في Jupyter/Colab تشمل التحويلات والتقسيم إلى مجموعات تدريب/اختبار/تقييم.

5. بناء النماذج وتكرار التجارب: تجربة نماذج تصنيف متنوعة، ضبط المعاملات، وتسجيل نتائج التجارب لمقارنة الأداء.

6. التقييم والاختيار: تقييم النماذج باستخدام مقياس Macro F1-Score لاختيار أفضل نموذج لكل تحدّي (التعليقات والتذاكر).

7. إعداد ملفات التقديم: تجهيز ملفات التقديم (submissions) بصيغة متوافقة مع المنصة/المسابقة وكتابة سكربتات إنتاجها.

8. نشر واجهة استدلال (Inference): بناء واجهات REST بسيطة لاستدعاء النموذج من تطبيقات أخرى (نماذج جاهزة للإنتاج).

9. التوثيق والتعاون: توثيق خطوات العمل داخل المستودع (notebooks وREADME)، وتنظيم البيانات في Google Drive، والعمل مع الفريق عبر Cursor/VS Code.

10. ضمان قابلية التكرار: تنظيم الكود والبيانات بحيث يمكن تكرار التجارب وتشغيلها في Google Colab بسهولة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز
المهارات