مشروع تحليل بيانات الكتب باستخدام عملية الـ ETL (Extract – Transform – Load)، يهدف إلى تحويل البيانات الخام من مصادر متعددة إلى بيانات نظيفة وقابلة للتحليل.
في هذا المشروع:
تم استخراج البيانات من مواقع إلكترونية عبر Web Scraping ومن مجموعات بيانات خارجية (CSV/Excel).
تمت معالجتها وتحويلها عبر تنظيف البيانات، إزالة التكرارات، التعامل مع القيم المفقودة، وتوحيد التنسيقات.
تم تحميل البيانات إلى SQL Server و MongoDB لتخزينها بكفاءة ودعم التحليل اللاحق.
تم إنشاء لوحات تحليلية (Dashboards) باستخدام Power BI لعرض رؤى مثل توزيع الكتب حسب المؤلف والفئة والسنة.
الأدوات والتقنيات المستخدمة:
Python (BeautifulSoup, Pandas, Jupyter Notebook)
SQL Server & MongoDB
Power BI
نتيجة المشروع:
تحويل بيانات الكتب الخام إلى بيانات نظيفة ومهيكلة، جاهزة للتحليل وصنع القرارات، مع واجهات تفاعلية توضح الأنماط والاتجاهات في البيانات.