نبحث عن مستقل موهوب لإنجاز مشروع لمدة يومين يجمع بين إنشاء صورة أفاتار مخصصة باستخدام الذكاء الاصطناعي ودمج استجابات صوتية، مع تصميم واجهة ويب تفاعلية. الهدف هو عرض مساعد ذكاء اصطناعي واقعي يمكنه الرد بالصوت والصورة. مع ضرورة إرسال نماذج لأعمال سابقة.
المهمة الأولى: إنشاء صورة أفاتار مخصصة باستخدام الذكاء الاصطناعي
•الهدف: استخدام أدوات الذكاء الاصطناعي لإنشاء صورة أفاتار مخصصة رقمية بناءً على صورة مقدمة، معدلة لتصوير رجل ملتحٍ في الستينات من عمره.
•المتطلبات:
1.يجب أن تكون الصورة الرمزية مشابهة تمامًا للشخصية المطلوبة.
2.استخدام أدوات مثل D-ID أو Synthesia أو أدوات مشابهة لإنشاء الصورة الرمزية بدقة وسلاسة.
3.ضمان احتواء الصورة الرمزية على تعابير أساسية ومزامنة حركة الشفاه مع الصوت بشكل سلس.
4.السماح بإضافة خلفية قابلة للتخصيص مع الصورة الرمزية.
المهمة الثانية: دمج الرسائل الصوتية
•الهدف: مزامنة الصورة الرمزية مع استجابات صوتية مولدة باستخدام OpenAI Whisper API لخلق تجربة تفاعلية واقعية.
•المتطلبات:
1.استخدام واجهة OpenAI Whisper API لتوليد استجابات صوتية بناءً على إدخالات صوتية من المستخدم.
2.دمج الصوت مع الصورة الرمزية لتقديم حركة شفاه طبيعية وتعابير واقعية.
3.تقديم عرض عملي (مثل ملف فيديو) يُظهر استجابة الصورة الرمزية لطلب عينة.
المهمة الثالثة: تصميم واجهة ويب بسيطة
•الهدف: تطوير صفحة ويب تفاعلية بسيطة تعرض الصورة الرمزية.
•المتطلبات:
1.تضمين شعار الشركة في واجهة الصفحة.
2.وضع الصورة الرمزية مع الخلفية المدمجة في وسط الشاشة.
3.إضافة زر "ابدأ التحدث" أسفل الصورة الرمزية، مع إمكانية تغيير الزر إلى "إيقاف" أثناء التفاعل.
4.التأكد من أن الصفحة متجاوبة وسهلة الاستخدام مع تجربة تفاعلية سلسة.
المخرجات
1.صورة رمزية مخصصة باستخدام الذكاء الاصطناعي (نسختان: ثابتة ومتحركة).
2.عرض عملي يظهر استجابة الصورة الرمزية للصوت بحركة شفاه متزامنة.
3.صفحة ويب تفاعلية تعرض الصورة الرمزية والخلفية والشعار والأزرار التفاعلية.
4.جميع الملفات والأصول والمستندات المستخدمة في المشروع.
الجدول الزمني
•المدة: يجب إنجاز المشروع في غضون يومين من تاريخ البدء.
أنا عمر، متخصص في مشاريع الذكاء الاصطناعي وتصميم الأفاتار التفاعلية، وعندي خبرة كبيرة في استخدام أدوات زي D-ID وWhisper API لتقديم حلول متطورة وسلسة. شغلي بيجمع...