تحليل و تجهيز بيانات معمل تحليل طبي لتجهيز التحليل الاحصائي

تفاصيل العمل

كنت اعمل على تنظيف البيانات ومعالجتها باستخدام Python، مع التعامل مع عدة ملفات بيانات.

أحد الملفات الرئيسية كان "HLA B27 Final"، والذي كان يحتوي على بيانات طبية أو جينية تتعلق بـ HLA-B27.

ركزت على تنظيف البيانات، معالجة القيم المفقودة، إزالة التكرارات، وتحسين جودة البيانات لاستخدامها في التحليل أو النمذجة لاحقًا.

استخدمت:

Pandas: لمعالجة الجداول والملفات الكبيرة بكفاءة.

NumPy: للتعامل مع البيانات العددية وإدارة القيم المفقودة.

استخدمت Matplotlib أو Seaborn لإجراء تحليلات بصرية أولية.

excel: لاجراء التعديلات البسيطه علي البيانات

أهم التحديات التي واجهتها:

جوده البيانات كانت سئيه مما تطلب العديد من عمليات التتجهير

تنسيق البيانات غير المتسق بين الملفات المختلفة، مما تطلب توحيدها قبل تحليلها.

التعامل مع القيم المفقودة بطرق مختلفة حسب السياق، مثل التعويض بالقيم المتوسطة أو الحذف الانتقائي.

حجم البيانات الكبير، والذي قد يكون تطلب تحسين الأداء باستخدام تقنيات مثل chunking عند القراءة من الملفات.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
6
تاريخ الإضافة
المهارات