قبل (الجدول الأيسر):
Tweet Id: أرقام تعريف للتغريدات.
Username (اسم المستخدم): يحتوي على قيم "NaN" (ليس رقمًا)، مما يشير إلى قيم مفقودة.
Content (المحتوى): يحتوي على نصوص التغريدات، وبعضها يحتوي على "NaN"، مما يشير أيضًا إلى قيم مفقودة.
ملاحظات أسفل الجدول:
Duplicate rows removed (تمت إزالة الصفوف المكررة): هذا يشير إلى أن الصفوف المتطابقة أو شبه المتطابقة سيتم حذفها.
Missing values dropped (تم إسقاط القيم المفقودة): هذا يشير إلى أن الصفوف التي تحتوي على قيم "NaN" ستتم إزالتها.
Columns renamed and cleaned (تمت إعادة تسمية الأعمدة وتنظيفها): هذا يشير إلى تغيير أسماء الأعمدة وتنظيف البيانات داخلها.
بعد (الجدول الأيمن):
tweet_id: تم تغيير اسم العمود من "Tweet Id" إلى "tweet_id" (تم توحيد التسمية لجعله بالحروف الصغيرة مع شرطة سفلية، وهي ممارسة شائعة في تنظيف البيانات). لاحظ أن القيم نفسها قد تغيرت أو تم تعديلها بشكل كبير لتصبح أطول.
username: تم استبدال قيم "NaN" بأسماء مستخدمين فعلية ("user5"، "user4")، مما يدل على معالجة القيم المفقودة.
content: تم الاحتفاظ بمحتوى التغريدات، وتم حذف الصف الذي كان يحتوي على "NaN" في المحتوى.
likes (إعجابات): تم إضافة عمود جديد "likes" مع قيم رقمية، مما يشير إلى أنه ربما تم استخلاص هذه البيانات أو إضافتها كجزء من عملية التنظيف أو الإثراء.