تفاصيل العمل

قبل (الجدول الأيسر):

Tweet Id: أرقام تعريف للتغريدات.

Username (اسم المستخدم): يحتوي على قيم "NaN" (ليس رقمًا)، مما يشير إلى قيم مفقودة.

Content (المحتوى): يحتوي على نصوص التغريدات، وبعضها يحتوي على "NaN"، مما يشير أيضًا إلى قيم مفقودة.

ملاحظات أسفل الجدول:

Duplicate rows removed (تمت إزالة الصفوف المكررة): هذا يشير إلى أن الصفوف المتطابقة أو شبه المتطابقة سيتم حذفها.

Missing values dropped (تم إسقاط القيم المفقودة): هذا يشير إلى أن الصفوف التي تحتوي على قيم "NaN" ستتم إزالتها.

Columns renamed and cleaned (تمت إعادة تسمية الأعمدة وتنظيفها): هذا يشير إلى تغيير أسماء الأعمدة وتنظيف البيانات داخلها.

بعد (الجدول الأيمن):

tweet_id: تم تغيير اسم العمود من "Tweet Id" إلى "tweet_id" (تم توحيد التسمية لجعله بالحروف الصغيرة مع شرطة سفلية، وهي ممارسة شائعة في تنظيف البيانات). لاحظ أن القيم نفسها قد تغيرت أو تم تعديلها بشكل كبير لتصبح أطول.

username: تم استبدال قيم "NaN" بأسماء مستخدمين فعلية ("user5"، "user4")، مما يدل على معالجة القيم المفقودة.

content: تم الاحتفاظ بمحتوى التغريدات، وتم حذف الصف الذي كان يحتوي على "NaN" في المحتوى.

likes (إعجابات): تم إضافة عمود جديد "likes" مع قيم رقمية، مما يشير إلى أنه ربما تم استخلاص هذه البيانات أو إضافتها كجزء من عملية التنظيف أو الإثراء.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
14
تاريخ الإضافة