python: سحب صور و البيانات من موقع اخباري وحفظها في ملف اكسيل

تفاصيل العمل

قمتُ بتطوير أداة استخراج بيانات بايثون لجمع المقالات والأخبار من مواقع إخبارية متنوعة. يستخدم البرنامج النصي سيلينيوم للتنقل بين صفحات الويب الديناميكية، واستخراج عناوين المقالات، والمحتوى، وتواريخ النشر، وعناوين URL المرتبطة بها. ثم نُظِّفت هذه البيانات ورُتِّبت باستخدام باندا قبل تخزينها في ملف إكسل لمزيد من التحليل والأرشفة.

الإجراءات الرئيسية

أتمتة استخراج محتوى الأخبار الفوري من مصادر متعددة.

نجحتُ في التعامل مع عناصر الويب الديناميكية وهياكل الصفحات المعقدة باستخدام سيلينيوم.

نظمتُ النصوص غير المنظمة والبيانات الوصفية في مجموعة بيانات إكسل منظمة وقابلة للبحث.

الأدوات المستخدمة

بايثون

سيلينيوم

باندا

إكسل

إذا كنت ترغب في رؤية تمثيل مرئي لعملية استخراج بيانات الويب، فأخبرني!

بطاقة العمل

اسم المستقل
عدد الإعجابات
1
عدد المشاهدات
80
تاريخ الإضافة
تاريخ الإنجاز
المهارات