تحليل آراء العملاء (Sentiment Analysis) لشركات الطيران باستخدام خوارزميات Naive Bayes

تفاصيل العمل

تحليل آراء العملاء (Sentiment Analysis) لشركات الطيران باستخدام خوارزميات Naive Bayes

### **وصف المشروع:**

قمت بتطوير نموذج ذكاء اصطناعي لتحليل المشاعر ومعالجة اللغات الطبيعية (NLP) لتصنيف تغريدات العملاء الموجهة لشركات الطيران العالمية. يهدف المشروع إلى تصنيف تعليقات المستخدمين آلياً إلى (إيجابي أو سلبي) لمساعدة الشركات على فهم مستوى رضا العملاء وتحسين خدماتها بناءً على تحليل البيانات الضخمة من تويتر.

### **خطوات العمل والمنهجية التقنية:**

* **استيراد ومعالجة البيانات:** العمل على مجموعة بيانات **Twitter Airline Sentiment**، وتصفية البيانات للتركيز على التصنيف الثنائي (Positive vs Negative) لرفع دقة النموذج.

* **هندسة الميزات وتجهيز النصوص (Text Preprocessing):**

* تنظيف النصوص من المعرفات (@handles) والروابط والرموز الخاصة.

* تحويل النصوص إلى حروف صغيرة (Lowercasing) وتطبيعيها.

* إزالة الكلمات الشائعة (Stopwords) التي لا تؤثر على المعنى لتقليل الضوضاء في البيانات.

* **تحويل النصوص إلى أرقام (Vectorization):** استخدام تقنية **CountVectorizer** لتحويل الكلمات إلى مصفوفات عددية يمكن للخوارزميات الرياضية معالجتها.

* **بناء وتدريب النموذج:** استخدام خوارزمية **Multinomial Naive Bayes**، وهي واحدة من أقوى الخوارزميات الكلاسيكية في تصنيف النصوص.

* **تقييم الأداء:** تقسيم البيانات إلى مجموعات تدريب واختبار (80/20) مع استخدام تقنية **Stratification** لضمان توازن الفئات.

### **النتائج المحققة:**

* تحقيق دقة إجمالية (Accuracy) تصل إلى **89.2%**.

* قدرة عالية على اكتشاف التعليقات السلبية بدقة (Precision) تصل إلى **91.3%** وحساسية (Recall) تبلغ **95.6%**.

* توفير تقرير تصنيف كامل (Classification Report) ومصفوفة ارتباك (Confusion Matrix) لتحليل الحالات التي قد يختلط فيها الأمر على النموذج.

### **المهارات المستخدمة في هذا المشروع:**

* **Natural Language Processing (NLP):** معالجة اللغات الطبيعية.

* **Machine Learning:** التعلم الآلي باستخدام خوارزميات Naive Bayes.

* **Data Cleaning:** تنظيف البيانات باستخدام مكتبات **Pandas** و **Regex**.

* **Data Visualization:** تقييم النماذج عبر مصفوفات الارتباك وتقارير الأداء.

* **Python Libraries:** استخدام (Scikit-learn, NLTK, Pandas, Pathlib).

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
المهارات