تفاصيل العمل

مشروع تقني متقدم يعتمد على البرمجة بلغة Python لتطوير أداة استخراج بيانات (Web Scraper) متخصصة. يهدف المشروع إلى تجميع قاعدة بيانات ضخمة ومنظمة لصيدليات محافظة القاهرة من المصادر التجارية المفتوحة، وتوفيرها في تنسيقات رقمية جاهزة للاستخدام (Excel/CSV) لدعم حملات التسويق الرقمي والبحث التجاري.

الميزات التقنية والمخرجات:

استخراج بيانات ضخمة: نجاح الأداة في فحص أكثر من 7900 صفحة ويب واستخراج بيانات 3844 صيدلية بدقة متناهية.

البيانات المستخرجة: تضمن المشروع سحب (اسم الصيدلية، أرقام التواصل الكاملة "أرضي وموبايل"، العنوان التفصيلي، ورابط الموقع الجغرافي).

الأداء العالي: تم استخدام إطار عمل Scrapy لضمان سرعة السحب (بمعدل يصل إلى 100 صفحة في الدقيقة) مع تجنب حظر السيرفر.

تنظيف وتجهيز البيانات (Data Cleaning): معالجة البيانات المستخرجة لإزالة التكرارات، وتنسيق أرقام الهواتف لتكون جاهزة للاستخدام المباشر في حملات الواتساب والتسويق الهاتفي.

هيكلة البيانات: تقديم النتائج في ملفات منظمة تسمح بالفرز والفلترة حسب المنطقة الجغرافية أو نوع رقم الهاتف.

الأدوات والتقنيات المستخدمة:

اللغة: Python.

إطار العمل الأساسي: Scrapy (Framework).

المكتبات: Pandas (لمعالجة البيانات)، وتنسيقات CSV/Excel.

المنطق البرمجي: تطوير خوارزمية للتنقل التلقائي بين مئات الصفحات (Pagination Handling).

القيمة التجارية للمشروع:

يخدم هذا المشروع شركات توزيع الأدوية، شركات المستلزمات الطبية، ومطوري تطبيقات الخدمات الصحية، حيث يوفر عليهم مئات الساعات من البحث اليدوي ويوفر لهم قاعدة بيانات دقيقة ومحدثة للوصول المباشر إلى أصحاب الصيدليات.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات