تفاصيل العمل

قمت بتطوير سكربت متكامل باستخدام لغة Python لمعالجة وتجهيز البيانات الضخمة المستخرجة من منصات التواصل الاجتماعي، بهدف تحويلها من بيانات خام غير منظمة إلى قاعدة بيانات مهيأة بدقة لنماذج الذكاء الاصطناعي (AI-Ready Data). شمل العمل النقاط التالية:"

ضمان جودة البيانات (Data Integrity): معالجة القيم المفقودة (Missing Values) وإزالة السجلات المتكررة باستخدام مكتبة Pandas لضمان عدم تضليل الموديل أثناء التدريب.

هيكلة البيانات (Data Normalization): توحيد تنسيق النصوص العربية ومعالجة الحروف لضمان دقة تحليل المشاعر (Sentiment Analysis).

استبعاد القيم الشاذة (Outliers Detection): التعرف على البيانات غير المنطقية واستبعادها لرفع كفاءة ومصداقية النتائج النهائية.

الأدوات والتقنيات المستخدمة:

لغات البرمجة: Python.

المكتبات: Pandas, NumPy.

المفاهيم التقنية: هندسة الميزات (Feature Engineering)، جودة البيانات (Data Quality)، تنظيف النصوص (Text Preprocessing).

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات