Zomato هى مجوعة مطاعم فى الهند تشمل انواع مختلفه وقد قمت بتحميل البيانات من احد المواقع الموثوقة csv ثم انتقلت لتحليلها باستخدام python-pandas-seaborn . f بدات باستكشاف البيانات باستخدامpandas.head(),pa.info(),,وباستخدام sns ثم قمت بتنظيف البيانات باستخدام df['rate']= df['rate'].str.replace('/5','') حتى تصبح الارقام كلها float من نفس النوع وقد تم استخدام sns ,pandasفى استكشاف وتحليل البيانات مثلا value_counts لاظهار عددonline_orderسواء yes or no,وكذلك استخدام cross-tabلاظهار العدد السابق ولكن لكل نوع من المطاعم على حده with order online yes or no ,وكذلك اسم المطعم الذى حصل على اعلى تصويت باستخدام df.groupby('name')['votes'].max().nlargest(1),وغيرها الكثير واضح تماما فى المرفقات ولايحتاج شرح لاننى لااجيد ذلك الامر .
ملحوظه : يوجدفى البداية شغل بسيط على بيانات tipsتم تحميلها مباشرة من sns ,:
Out[1]:
import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips") # ﺑﯿﺎﻧﺎت ﺣﻘﯿﻘﯿﺔ ﻋﻦ اﻹﻛﺮاﻣﯿﺎت
sns.countplot(x="day",data=tips)
يظهر من الرسم ان اكبر tips يوم الاحدثم السبت(weekend)