قمت بتطوير سكربت احترافي باستخدام لغة Python لاستخراج بيانات الكتب من موقع إلكتروني، بهدف تحويل البيانات غير المنظمة إلى ملف منظم وجاهز للتحليل.
البيانات التي تم جمعها:
اسم الكتاب
اسم المؤلف
التقييم (Rating)
تم استخراج البيانات من صفحتين مختلفتين لضمان القدرة على التعامل مع تعدد الصفحات (Pagination)، مما يعكس القدرة على جمع البيانات من أكثر من مصدر داخل نفس الموقع بكفاءة.
بعد ذلك تم تنفيذ مرحلة تنظيف ومعالجة البيانات باستخدام مكتبة Pandas، حيث شملت العمليات:
دمج البيانات المستخرجة من الصفحتين في ملف واحد
إزالة عمود غير ضروري
تنظيف عمود التقييم من النصوص الزائدة وتحويله إلى قيمة رقمية قابلة للتحليل
إزالة القيم المكررة
التحقق من القيم الفارغة ومعالجتها
ترتيب البيانات تنازليًا حسب أعلى تقييم
وفي النهاية تم تصدير البيانات إلى ملف Excel منظم وجاهز للاستخدام في التحليل، إعداد التقارير، أو إدخاله في نماذج تحليل البيانات.