مشروع استخراج النصوص من موقع باستخدام Python

تفاصيل العمل

قمت بتنفيذ مشروع برمجي باستخدام لغة Python ومكتبتي Requests وBeautifulSoup لاستخلاص بيانات من موقع إلكتروني يحتوي على اقتباسات متعددة الصفحات.

تفاصيل المشروع:

- استخراج الاقتباسات (النص)

- استخراج اسم المؤلف

- استخراج الوسوم المرتبطة بكل اقتباس

يتم حفظ البيانات في ملف CSV منسق يحتوي على ثلاثة أعمدة:

(الاقتباس - المؤلف - الوسوم)

الكود يتعامل تلقائيًا مع جميع الصفحات باستخدام تقنية الـ Pagination.

تمت إضافة رؤوس HTTP (User-Agent) لتجنب حظر الطلبات من الموقع المستهدف.

اسم الملف الناتج يتضمن تاريخ التنفيذ لتسهيل التتبع.

هذا المشروع قابل للتعديل ليعمل على مواقع أخرى مشابهة حسب الطلب.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
16
تاريخ الإضافة
تاريخ الإنجاز
المهارات