هذا الـ workflow الثاني هو نسخة أبسط ومركّزة لوكيل ذكاء اصطناعي على واتساب يقوم بكل شيء من مدخل واحد.
وصف بالعربية
هذا النظام يستقبل رسائل واتساب (نص، صوت، صورة) عبر WhatsApp Trigger ثم:
يستخدم Switch لتحديد نوع الرسالة: نص، تسجيل صوتي، أو صورة.
في مسار النص يتم إرسال المحتوى مباشرة إلى Text Prompt.
في مسار الصوت يتم تحميل الملف، تحويله إلى نص (Transcribe a recording) ثم تمريره إلى الـ Prompt.
في مسار الصورة يتم تحميل الصورة، تحليلها بنموذج رؤية، ثم دمج وصف الصورة مع النص في Text‑Image Prompt.
بعد ذلك يرسل كل شيء إلى AI Agent الذي يمكنه استخدام أدوات مختلفة مثل:
إرسال إيميل عبر Gmail،
إنشاء/تعديل/حذف أحداث في Google Calendar،
البحث في جوجل،
استخدام آلة حاسبة بسيطة.
وأخيراً، يقرر الوكيل هل يرسل الرد للعميل كنص أو كصوت عبر واتساب (Generate audio ثم Respond with Audio / Respond With Text).
باختصار: هذا مخطط لوكيل واتساب ذكي يحوّل أي رسالة (نص، صوت، صورة) إلى رد آلي ذكي، ويقوم بالمهام المتكررة (إيميلات، مواعيد، حسابات، بحث) بشكل أوتوماتيكي لتوفير الوقت.