مشروع ETL

تفاصيل العمل

مشروع تحليل بيانات الكتب باستخدام عملية الـ ETL (Extract – Transform – Load)، يهدف إلى تحويل البيانات الخام من مصادر متعددة إلى بيانات نظيفة وقابلة للتحليل.

في هذا المشروع:

تم استخراج البيانات من مواقع إلكترونية عبر Web Scraping ومن مجموعات بيانات خارجية (CSV/Excel).

تمت معالجتها وتحويلها عبر تنظيف البيانات، إزالة التكرارات، التعامل مع القيم المفقودة، وتوحيد التنسيقات.

تم تحميل البيانات إلى SQL Server و MongoDB لتخزينها بكفاءة ودعم التحليل اللاحق.

تم إنشاء لوحات تحليلية (Dashboards) باستخدام Power BI لعرض رؤى مثل توزيع الكتب حسب المؤلف والفئة والسنة.

الأدوات والتقنيات المستخدمة:

Python (BeautifulSoup, Pandas, Jupyter Notebook)

SQL Server & MongoDB

Power BI

نتيجة المشروع:

تحويل بيانات الكتب الخام إلى بيانات نظيفة ومهيكلة، جاهزة للتحليل وصنع القرارات، مع واجهات تفاعلية توضح الأنماط والاتجاهات في البيانات.

معاينة

ملفات مرفقة

- CSV
- Bookmultisourcesclean21.csv
- (319.66KB)
- CSV
- Bookmultisourcesclean21.csv
- (319.66KB)
- SQL
- BookFinalll11.sql
- (4.07KB)
- SQL
- Booksquey-2.sql
- (999)
- XLSX
- mergedbooks.xlsx
- (122.17KB)
- CSV
- samplebooks-1.csv
- (198)

بطاقة العمل

اسم المستقل

Shahd B.

عدد الإعجابات

تاريخ الإضافة

16/10/2025

تاريخ الإنجاز

06/09/2025

تفاصيل العمل

ملفات مرفقة

بطاقة العمل

روابط

تابع مستقل على

وسائل الدفع المتاحة