المشروع يهدف إلى جمع بيانات من مواقع الويب بشكل آلي ومنظّم، ثم تنظيفها وتحويلها باستخدام DBT، وأخيرًا جدولتها وتشغيلها دوريًا بواسطة Airflow.
بمعنى آخر، المشروع يُنشئ نظام بيانات متكامل (Data Pipeline) يبدأ من الإنترنت وينتهي في قاعدة بيانات نظيفة وجاهزة للتحليل أو العرض في لوحة بيانات (Dashboard).