Workflow إدخال البيانات (Data Ingestion Pipeline)

تفاصيل العمل

آلية العمل:

Google Drive Trigger

عند رفع أي ملف جديد (مثل PDF) على Google Drive، يتم تشغيل الـ workflow تلقائيًا.

Edit Fields

تعديل أو تجهيز بيانات الملف (اسم الملف – المسار – الميتاداتا) قبل المعالجة.

Download File

تحميل الملف تلقائيًا من Google Drive.

Extract From File (PDF)

استخراج النص الكامل من ملف الـ PDF.

Text Splitting (Recursive Character Text Splitter)

تقسيم النص الكبير إلى أجزاء صغيرة مناسبة للمعالجة بالذكاء الاصطناعي.

Default Data Loader

تجهيز الأجزاء النصية وتحويلها إلى Documents قياسية.

Embeddings باستخدام Cohere

تحويل كل جزء نصي إلى Vector Embedding.

Supabase Vector Store

تخزين الـ Embeddings داخل قاعدة بيانات Supabase Vector Database

بحيث تصبح جاهزة للبحث والاسترجاع لاحقًا بواسطة الـ AI Agent.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات