مهندس بيانات Backend متقدم لبناء منظومة معالجة وإثراء البيانات Data Processing لمنصة B2B

تفاصيل المشروع

مطلوب مهندس بيانات / مطور Backend متقدم لبناء منظومة معالجة وإثراء البيانات (Data Processing Layers) لمنصة B2B

المهام والطبقات المطلوبة لبرمجتها (Data Processing Layers):

1. طبقة الفرز والتنظيف (Data Cleansing Layer)

: تنظيف البيانات الخام القادمة من الـ APIs، وحذف السجلات الناقصة، وإزالة الفراغات والرموز البرمجية الخبيثة.

2. طبقة توحيد البيانات (Data Normalization Layer)

: توحيد صيغ أرقام الهواتف برمجياً إلى الصيغة الدولية السعودية الموحدة (E.164)، وتوحيد كتابة النصوص والأسماء العربية لتتوافق مع محركات البحث الفائقة.

3. طبقة دمج المصادر وحذف التكرار الذكي (Deduplication & Data Merging)

: منع تكرار المنشآت التقني بالاعتماد على (Google Place ID كـ Unique Key)، مع بناء خوارزمية مطابقة مرنة (Fuzzy Matching Logic) تدمج البيانات وتحدث الحقول الناقصة إذا تشابهت الهواتف أو الروابط بدلاً من تكرار السجل.

4. طبقة إثراء البيانات الذكي (Data Enrichment Layer)

: بمجرد توفر رابط موقع الشركة، يقوم النظام آلياً بتمريره لروبوت كشط خلفي (Scraper) لفحص الـ HTML واستخراج البريد الإلكتروني، حسابات السوشيال ميديا النشطة (X، إنستغرام، لينكد إن)، والتقنيات المستخدمة في الموقع (مثل تتبع منصات سلة أو زد).

5. طبقة التحقق من الجودة (Validation & QA Layer): ربط فلاتر برمجية سريعة للتحقق من صلاحية الإيميلات (SMTP check لمنع الـ Bounce) والتحقق من نشاط أرقام الهواتف والواتساب.

6. طبقة التخزين وجدولة التحديث التلقائي (Storage & Dynamic TTL)

: حفظ البيانات النهائية في قاعدة البيانات، مع برمجة مهام مجدولة (Cron Jobs) تعمل تلقائياً في الخلفية لإعادة تحديث السجلات التي انتهت صلاحيتها الزمنية لضمان أن الداتا "طازجة" دائماً.

الشروط والأنظمة التقنية الإلزامية:

• الخلفية البرمجية: بيئة عمل Node.js باستخدام إطار عمل قوي ومنظم مثل (NestJS).

• قاعدة البيانات: الاعتماد الكلي على PostgreSQL (ويفضل خبرة في الفهرسة المتقدمة B-Tree وعمل الـ Composite Indexes والبحث الجغرافي PostGIS).

• إدارة المهام الخلفية: فصل منظومة المعالجة والكشط تماماً عن الموقع الرئيسي عبر طوابير عمل معزولة (Background Workers) باستخدام Redis + BullMQ.

• أدوات الكشط: استخدام أدوات متطورة ومحمية مثل (Playwright Stealth) لضمان تجاوز الحظر وتدوير البروكسيات السكنية (Rotating Residential Proxies).

المطلوب من المستقل عند التقديم:

1. إرفاق نماذج أعمال سابقة واضحة قمت فيها ببناء (Data Pipelines) أو أنظمة معالجة داتا ضخمة وإثراء (Enrichment).

2. شرح مختصر لآليتك البرمجية المفضلة لتنفيذ خوارزمية حذف التكرار (Deduplication) وإدارة طوابير الـ BullMQ تحت الضغط العالي.

3. التقنيات والخدمات (Services) التي تقترح ربطها لضمان أقل تكلفة تشغيلية للسيرفر والبروكسيات.

المشروع مصمم ليكون مبنياً على كود نظيف وتوثيق هندسي كامل (Clean Architecture & Swagger API Documentation) ليكون حجر الأساس لشراكة طويلة الأمد لتطوير مراحل الذكاء الاصطناعي لاحقاً بميزانيات مستقلة ومجزية.

بالتوفيق للجميع وننتظر عروضكم الهندسية الاحترافية.

حالة المشروع
مفتوح
تاريخ النشر
الميزانية
$1000.00 - $2500.00
مدة التنفيذ
25 يوما
المهارات

صاحب المشروع
Mtawea H.
تاريخ التسجيل
معدل التوظيف
المشاريع المفتوحة 2
مشاريع قيد التنفيذ 0
التواصلات الجارية 6

تقدم للمشروع

العروض المقدمة

أبني أنظمة معالجة بيانات قوية وقابلة للتوسع. لقد طورت نظاما متقدما لمعالجة البيانات حقق نتائج مبهرة في تحسين جودة البيانات وتوفير الوقت من خلال أتمتة العمليات. ...

السلام عليكم ورحمة الله وبركاته، أنا يوسف حسن، مهندس برمجيات Backend، شغال بشكل أساسي بـ Node.js، وعندي خبرة في بناء أنظمة قابلة للتوسع والتعامل مع التكاملات ال...

Sarah S.

مرحبا، اطلعت على تفاصيل المشروع، وفهمي له أنه عبارة عن منظومة معالجة وإثراء بيانات متعددة الطبقات تبدأ من ingesting البيانات الخام من عدة APIs، ثم تمر بمراحل ال...

أهلا أستاذي قرأت تفاصيل المشروع، والمطلوب هنا مش مجرد Data Pipeline، لكن منظومة معالجة وإثراء بيانات متكاملة تعتمد على NestJS PostgreSQL BullMQ مع فصل الـ Worke...

السلام عليكم، أنا Full-Stack / Backend Developer بخبرة تتجاوز 3 سنوات في تطوير الأنظمة المؤسسية (ERP)، منصات SaaS، والأنظمة المعتمدة على APIs ومعالجة البيانات. ...

السلام عليكم، اطلعت على تفاصيل المشروع وأرى أنه مشروع هندسة بيانات متقدم يتطلب بناء Data Pipeline قابلة للتوسع ومعالجة كميات كبيرة من البيانات مع التركيز على جو...

مرحبا أنا احمد مهندس بيانات و لدي خبره كبيره في إنشاء ETL pipelines باستخدام python وخبره قويه في ال postgresql و قمت بتنفيذ مشاريع كثيره سابقه حيث قمت بإنشاء e...

قبولك لهذا العرض يعتبر اتفاقاً بينك وبين المستقل وسيبقى موقع مستقل وسيطاً بينكما حتى تسليم المشروع. لن تتمكن من تغيير العرض أو إلغائه لاحقًا لذلك تأكد من اختيارك للعرض المناسب باتّباع النصائح التالية:

  • راجع صفحة حساب المستقل الذي اخترته واطّلع على أعماله السابقة
  • إن كانت هناك تفاصيل غير مذكورة في المشروع، فتواصل مع المستقل وأخبره بها أولًا
  • بإمكانك أن تتواصل مع المستقل وتسأله عن أية أمور تحتاجها
  • احرص دائمًا على إبقاء التواصل مع المستقل داخل الموقع قدر الإمكان وذلك لضمان حقوقك
  • لا تتردد من التواصل معنا ان احتجت لأي مساعدة، نحن نحب مساعدتك!

المستقل غير متاح حالياً لاستلام مشاريع جديدة. يمكنك إرسال رسالة له لتحديث إعدادات حسابه وتفعيل خيار "متاح للتوظيف"، ثم إعادة المحاولة بعد ذلك، أو اختيار عرض مستقل آخر.