تطوير مساعد ذكي بالصوت والرؤية باستخدام الذكاء الاصطناعي (AI Assistant)

تفاصيل العمل

قمت بتطوير نظام مساعد ذكي متكامل يعمل على الحاسوب باستخدام تقنيات الذكاء الاصطناعي، حيث يجمع بين معالجة الصوت والرؤية الحاسوبية لتقديم تجربة تفاعلية متقدمة.

فكرة المشروع:

إنشاء مساعد ذكي قادر على فهم الأوامر الصوتية، تحليل الصور من الكاميرا، والتفاعل مع المستخدم بشكل طبيعي.

المميزات الرئيسية:

تحويل الصوت إلى نص باستخدام Whisper

تحويل النص إلى صوت (TTS)

Chatbot ذكي باستخدام نماذج LLM

التعرف على الأشياء بالكاميرا (YOLO)

قراءة النصوص من الصور (OCR)

التعرف على الوجوه وتخزينها

تحديد الموقع وعرض الأماكن القريبة

واجهة ويب تفاعلية لعرض النتائج

طريقة التنفيذ:

تم تطوير المشروع باستخدام Python مع FastAPI لبناء Backend، وربطه بواجهة ويب تفاعلية، بالإضافة إلى استخدام مكتبات مثل OpenCV و YOLO و Whisper لتحقيق وظائف الرؤية والصوت.

النتيجة:

نظام ذكي متكامل قابل للتطوير ويمكن استخدامه في مشاريع التخرج أو تطبيقات الذكاء الاصطناعي المختلفة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات