تم في هذا المشروع تحليل بيانات مراجعات الفنادق المكتوبة بالعربية باستخدام مكتبة Pandas وأدوات تحليل البيانات.
بدأ العمل بتحميل البيانات وفحصها لفهم محتواها وتوزيعها.
بعد ذلك تم:
تنظيف النصوص للتأكد من جاهزيتها للتحليل (إزالة الرموز والفراغات).
إعادة تقسيم التقييمات إلى ثلاث فئات رئيسية:
إيجابي (4–5)
حيادي (3)
سلبي (1–2)
تحليل وصفي لتوزيع التقييمات وعدد المراجعات في كل فئة.
تمثيل بياني للتوزيع عبر الرسوم البيانية.
استخراج الكلمات الأكثر شيوعًا في المراجعات باستخدام WordCloud لتحديد أهم الانطباعات الإيجابية والسلبية.
الهدف النهائي من هذا التحليل هو تقديم صورة أوضح عن رضا العملاء وتوقعاتهم، ومساعدة الفنادق على تحديد نقاط القوة والضعف في خدماتها.