يهدف المشروع إلى معالجة بيانات التعبير الجيني لأشخاص مصابين بالربو وغير مصابين، ليتم إعدادها للتحليل البيولوجي أو نماذج التعلم الآلي. يشمل العمل ترشيح العينات، التطبيع، تلخيص البيانات، وتحليل الجينات المعبر عنها تفاضليًا.
تم استخدام مجموعة بيانات GSE35571 من منصة GPL570، بعد الترشيح شملت 131 عينة (60 مصاب، 64 غير مصاب). تم تحويل بيانات البروبات إلى مستوى الجين، وتحديد الجينات المعبر عنها تفاضليًا باستخدام طرق إحصائية، ثم تم تطبيق نموذج Random Forest للتصنيف بين فئتي الربو وغير الربو.
النتائج:
بيانات نظيفة وجاهزة للتحليل الإحصائي والتعلم الآلي.
تقليل الضوضاء التقنية وتحسين التناسق بين العينات.
تحديد الجينات المهمة ذات الاختلاف الواضح بين المجموعتين.