قمت بتنفيذ مشروع بسيط لتحليل ومعالجة بيانات مدن مصر المخزنة داخل ملف نصي (Text File) باستخدام لغة Python، مع التركيز على قراءة البيانات، تنظيفها، معالجتها، ثم إجراء عمليات تحليل مثل الترتيب واستخراج أعلى وأقل قيمة سكانية.
وصف المشروع:
تم العمل على ملف نصي يحتوي على بيانات مدن مصر، حيث تتضمن كل سطر معلومات عن اسم المدينة، نوعها، وعدد السكان. بعض الصفوف كانت تحتوي على بيانات ناقصة (مثل عدم وجود نوع المدينة)، لذلك تم التعامل مع هذه الحالات برمجياً لضمان اتساق البيانات قبل تحليلها.
أولاً: قراءة ومعالجة البيانات
استخدام open لقراءة الملف النصي.
استخدام read و readlines لاستخراج محتوى الملف.
إزالة محارف السطر الجديد باستخدام replace.
تقسيم البيانات باستخدام split لتحويل كل سطر إلى قائمة تحتوي على عناصر منفصلة.
معالجة الصفوف التي تحتوي على بيانات ناقصة وإدراج قيمة افتراضية مثل "None" لضمان أن كل سجل يحتوي على ثلاثة عناصر (الاسم – النوع – عدد السكان).
هذا يعكس فهم التعامل مع البيانات شبه المنظمة (Semi-Structured Data).
ثانياً: عرض البيانات بشكل منظم
تم استخدام الحلقات التكرارية لطباعة البيانات بصيغة واضحة ومنظمة، مع تنسيق الإخراج باستخدام f-strings لعرض اسم المدينة، نوعها، وعدد السكان بطريقة مقروءة.
ثالثاً: تحليل البيانات وترتيبها
تحويل عدد السكان من نص إلى عدد صحيح باستخدام int حتى يمكن إجراء عمليات مقارنة صحيحة.
استخدام الدالة sorted مع lambda function للترتيب بناءً على عدد السكان ترتيباً تنازلياً.
استخراج أعلى مدينة من حيث عدد السكان.
استخراج أقل مدينة من حيث عدد السكان.
رابعاً: المهارات البرمجية المستخدمة
التعامل مع الملفات (File Handling).
معالجة النصوص (String Manipulation).
القوائم متعددة الأبعاد (Nested Lists).
استخدام Lambda Expressions في الترتيب.
معالجة البيانات الناقصة والتحقق من سلامة المدخلات.
تحويل أنواع البيانات (Type Casting).
أهداف المشروع:
تدريب عملي على تنظيف البيانات قبل تحليلها.
فهم آلية التعامل مع ملفات البيانات النصية.
تطبيق مفاهيم الترتيب واستخراج القيم القصوى والدنيا.
تحسين مهارات التفكير المنطقي في التعامل مع البيانات غير المثالية.
هذا المشروع يوضح القدرة على التعامل مع البيانات الخام (Raw Data)، معالجتها برمجياً، واستخراج معلومات مفيدة منها باستخدام أدوات Python الأساسية دون الاعتماد على مكتبات خارجية، مما يعكس فهماً جيداً لأساسيات تحليل البيانات.