تفريغ ونقل البيانات من الصور وملفات PDF إلى جداول Excel بدقة

تفاصيل العمل

الفكرة الأساسية للمشروع:

تتمحور فكرة المشروع حول إنهاء عناء إدخال البيانات يدويًا الذي يستغرق ساعات طويلة ويعرض البيانات للخطأ البشري. قمت بتطوير حل برمجي يقوم بسحب "الداتا" من ملفات PDF والصور الممسوحة ضوئياً، ثم إعادة هيكلتها وضخها داخل ملفات Excel منظمة وجاهزة للاستخدام.

ما تم إنجازه في المشروع:

تجاوز عقبة إدخال البيانات: بدلاً من كتابة البيانات حرفاً بحرف، تم استخدام سكربت Python يقوم بـ "قراءة" الجداول آلياً واستخراج محتواها بدقة متناهية.

التعامل مع بيانات متنوعة: شمل المشروع نقل بيانات حقيقية تتكون من (الأسماء، الإيميلات، أرقام الهواتف، وتواريخ التسجيل).

هيكلة الجداول المعقدة: تمت معالجة جداول تحتوي على صفوف وأعمدة متداخلة (مثل جداول الحسابات المالية في ملف sample-tables.pdf) ونقلها بحيث يظل كل بيان في مكانه الصحيح داخل الإكسل.

تحويل الملفات الجامدة إلى "داتا" مرنة: الملفات التي كانت مجرد صور لا يمكن البحث فيها أو التعديل عليها، أصبحت الآن شيتات إكسل احترافية تتيح للعميل الفلترة، البحث، وإجراء العمليات الحسابية بسهولة.

القيمة المضافة (لماذا هذا المشروع مميز؟):

1- دقة 100%: استخدام مكتبة pdfplumber و Pandas ضمن عدم سقوط أي رقم أو حرف أثناء عملية النقل.

2- تنظيم فائق: لم يتم نقل البيانات بشكل عشوائي، بل تم تنسيق الملف النهائي (Structured_Data_Final.xlsx) ليكون مريحاً للعين ومنظماً برؤوس أعمدة واضحة (Headers).

3- توفير الوقت: العملية التي كانت تتطلب يوماً كاملاً من إدخال البيانات يدوياً، أصبحت تنتهي الآن في دقائق معدودة بفضل الأتمتة البرمجية.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات