قمت بتنفيذ مشروع متكامل لتحليل بيانات كورسات منصة Udemy باستخدام تقنيات الـ Data Analysis وMachine Learning بهدف استخراج Insights مهمة وبناء نموذج للتنبؤ بأسعار الكورسات، بالإضافة إلى إنشاء Dashboard تفاعلية ونشر المشروع كتطبيق ويب باستخدام Streamlit.
فكرة المشروع:
المشروع يعتمد على تحليل بيانات أكثر من 10,000 كورس من منصة Udemy لفهم سلوك الكورسات، معدلات التقييم، عدد المشتركين، والأسعار، واستخدام هذه البيانات في بناء نموذج Machine Learning للتنبؤ بسعر الكورس.
مراحل تنفيذ المشروع:
Data Cleaning & Preprocessing
* تنظيف البيانات ومعالجة القيم المفقودة
* حذف الأعمدة غير المهمة
* Feature Engineering
* تحويل البيانات الفئوية باستخدام Label Encoding
* Scaling للبيانات لتحسين أداء الموديل
Exploratory Data Analysis (EDA)
* تحليل البيانات واستخراج أهم الأنماط والمؤشرات
* تحليل العلاقة بين عدد المشتركين والتقييمات والأسعار
* اكتشاف العوامل المؤثرة في سعر الكورس
Machine Learning
* بناء نموذج Random Forest Regressor للتنبؤ بأسعار الكورسات
* تدريب الموديل وتحسين الأداء
* تقييم النموذج باستخدام Metrics مختلفة لقياس الدقة
Power BI Dashboard
* إنشاء Dashboard تفاعلية باستخدام Power BI
* عرض Insights ورسوم بيانية توضح:
* أفضل الكورسات أداءً
* توزيع الأسعار
* التقييمات وعدد المشتركين
* تحليل الكورسات حسب الدول والفئات
Web Deployment
* نشر المشروع كتطبيق ويب باستخدام Streamlit
* توفير واجهة سهلة للتفاعل مع النموذج وتجربة التنبؤ بالأسعار
التقنيات المستخدمة:
* Python
* Pandas
* NumPy
* Scikit-learn
* Matplotlib
* Seaborn
* Power BI
* Streamlit
نتائج المشروع:
- استخراج رؤى واضحة من بيانات ضخمة
- بناء نموذج تنبؤ فعال لأسعار الكورسات
- إنشاء Dashboard احترافية لعرض البيانات بشكل تفاعلي
- تحويل المشروع إلى Web Application قابل للاستخدام