في هذا المشروع، قمت بتحويل مجموعة بيانات ضخمة (Big Data) لمنصةتعلم عن بعد تضم أكثر من 145 مليون مراجعة و 700 مهارة، إلى نظام تقارير تفاعلي واحترافي. الهدف كان استخراج رؤى دقيقة حول أداء الدورات وتوجهات المتعلمين لمساعدة صناع القرار في تحسين المحتوى التعليمي.
الميزات التقنية :
تحليل المهارات الذكي: تصنيف أكثر من 700 مهارة (Business, Tech, Data, Soft Skills) مع ربطها بمعدلات التقييم.
تتبع مؤشرات الأداء (KPIs): عرض حي لمتوسط التقييمات، حجم المراجعات، وأفضل المواضيع أداءً.
تحليل العمق والانتشار: مقارنة بين مستويات الدورات (Beginner vs Intermediate vs Advanced) لإظهار الفجوة بين حجم التفاعل وجودة المحتوى.
خريطة طريق للتحسين: تحديد "المواضيع التي تحتاج تطوير" (Topics Needing Improvement) بناءً على تحليل إحصائي.
تحليل الارتباط الزمني: دراسة تأثير مدة الدورة على رضا المستخدمين، حيث أظهر التحليل أن الدورات من (3-6 أشهر) هي الأكثر استحواذاً على حجم المراجعات.
طريقة التنفيذ والأدوات المستخدمة:
تنظيف البيانات (Data Cleaning) باستخدام Python: استخدمت مكتبات (مثل Pandas) للتعامل مع حجم البيانات الضخم، وتطهيرها من القيم المفقودة والمتكررة لضمان دقة النتائج.
هيكلة البيانات بـ Power Query: اعتمدت على Power Query في عمليات الـ ETL (استخراج، تحويل، تحميل) لربط الجداول بفعالية وضمان سرعة استجابة الداشبورد.
نمذجة البيانات (Data Modeling): قمت ببناء نموذج بيانات (Star Schema) قوي يربط بين جداول المراجعات، المهارات، والمستويات، مما سمح بإجراء عمليات حسابية معقدة (DAX) بسرعة فائقة رغم ضخامة البيانات.
التصميم والتحليل بـ Power BI: صممت واجهة المستخدم (UI) لتكون تفاعلية بالكامل، مع التركيز على تجربة مستخدم (UX) بسيطة توصل المعلومة المعقدة في ثوانٍ.