تفاصيل العمل

وصف المشروع: استخراج بيانات باستخدام Web Scraping

المشروع:

في هذا المشروع، تم تطبيق تقنية Web Scraping لاستخراج البيانات من صفحات الويب التي تحتوي على جداول بيانات باستخدام Python وBeautifulSoup. الهدف من المشروع كان جمع بيانات محددة من عدة صفحات ويب وتنظيمها بشكل صحيح في Excel.

التقنيات والأدوات المستخدمة:

Python: لغة البرمجة الرئيسية التي تم استخدامها.

BeautifulSoup: مكتبة Python المتخصصة في استخراج البيانات من HTML.

Pandas: مكتبة Python لتنظيف وتنظيم البيانات وتحويلها إلى تنسيق مناسب.

Excel: تم حفظ البيانات المستخلصة في ملف Excel من أجل تسهيل التعامل معها وتحليلها.

العملية:

استخراج البيانات:

تم فحص الموقع واكتشاف 11 جدولًا مختلفًا على الصفحة.

تم تحديد الجدول الذي يحتوي على البيانات المطلوبة من بين الجداول العديدة المتاحة.

تنظيف البيانات: تم تنظيف البيانات المستخلصة باستخدام Pandas لإزالة البيانات الغير ضرورية وتنظيمها في تنسيق مناسب.

تخزين البيانات: تم حفظ البيانات في ملف Excel يمكن استخدامه بسهولة للقيام بالتحليل أو لأغراض أخرى.

النتائج:

تم استخراج البيانات بنجاح وتنظيمها بشكل احترافي.

تم حفظ البيانات في ملف Excel يحتوي على البيانات المنظمة والجاهزة للاستخدام.

الهدف:

توفير طريقة فعالة لاستخراج البيانات من الويب وتنظيمها في تنسيق يمكن استخدامه بسهولة في التحليل أو التقارير المستقبلية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
1
عدد المشاهدات
25
تاريخ الإضافة
تاريخ الإنجاز
المهارات