هذا العمل يوضح كيفية تنفيذ عمليةETL (استخراج – تحويل – تحميل) باستخدام لغة بايثون، وذلك من خلال الاتصال بقاعدة بيانات SQL Server وجلب البيانات إلى إطار بيانات (Data Frame) في مكتبة Pandas.
الخطوات الأساسية التي تم تنفيذها:
1.استيراد المكتبات اللازمة
- pyodbc للاتصال بقاعدة البيانات.
-pandas لمعالجة البيانات وتحليلها.
2. إنشاء اتصال بقاعدة البيانات
باستخدام pyodbc.connect مع تحديد السرفر، قاعدة البيانات، وطريقة الاتصال الموثوق (Trusted Connection).
3.تنفيذ استعلام SQL
استعلامSELECT * FROM vcustomer لجلب جميع البيانات من الجدول (أو العرض) vcustomer
4.تحميل البيانات في DataFrame
باستخدام pd.read_sql_query() يتم تخزين النتائج في إطار بيانات Pandas، مما يسهل عرضها وتحليلها.
5.عرض النتائج:
البيانات تظهر في شكل جدول يحتوي على الأعمدة:CustomerID، full_name، City، مع ملاحظة وجود بعض القيم المفقودة في عمود المدينة.
هذا التمرين يوضح كيفية الدمج بين بايثون و SQL Server لإنجاز مهام الهندسة البياناتية (Data Engineering)، حيث يتم استخراج البيانات من قواعد البيانات التقليدية وتحويلها إلى صيغة قابلة للتحليل باستخدام أدوات حديثة مثل Pandas.