في هذا المشروع، ستستخدم عدة خوارزميات تعلم خاضع (Supervised Learning) من اختيارك لنمذجة دخل الأفراد بدقة باستخدام بيانات تم جمعها من تعداد الولايات المتحدة لعام 1994. بعد ذلك، ستختار أفضل خوارزمية مرشحة بناءً على النتائج الأولية وتعمل على تحسينها بشكل أكبر للحصول على أفضل نموذج للبيانات.
الهدف من هذا التنفيذ هو بناء نموذج يتنبأ بدقة بما إذا كان دخل الفرد يتجاوز 50,000 دولار سنوياً أم لا. يمكن أن تنشأ مثل هذه المهمة في بيئة المنظمات غير الربحية، حيث تعتمد هذه المنظمات على التبرعات. يساعد فهم دخل الفرد على تكوين صورة أوضح عن حجم التبرع الذي يمكن طلبه، أو ما إذا كان من المناسب التواصل مع الشخص من الأساس.
ورغم أن تحديد المستوى العام لدخل الفرد مباشرة من المصادر العامة قد يكون صعباً، إلا أنه يمكننا (كما سنرى) استنتاج هذا الدخل اعتماداً على ميزات أخرى متاحة للعامة.