تفاصيل العمل

وصف المشروع:

قمت بتطوير بوت متحدث يعتمد على Python ويستخدم تقنيات Speech Recognition و Speech Processing لتحويل الكلام إلى نص، ثم الرد على المستخدمين باستخدام تقنية النص إلى كلام (Text-to-Speech). يهدف المشروع إلى تحسين التفاعل بين البشر والأجهزة من خلال توفير واجهة صوتية ذكية.

المهام الرئيسية:

تحويل الصوت إلى نص: تم استخدام مكتبة SpeechRecognition لاستخراج النص من الصوت المدخل من الميكروفون، مع دعم اللغة العربية والإنجليزية.

معالجة الصوت: استخدمت تقنيات Speech Processing لتحسين دقة التعرف على الصوت، مثل إزالة الضوضاء وتحسين وضوح الصوت.

النص إلى كلام: تم دمج مكتبة pyttsx3 لتحويل النص إلى كلام (Text-to-Speech)، حيث يقوم البوت بالرد على المستخدمين بشكل صوتي.

واجهة تفاعلية: تم تصميم واجهة تفاعلية تتيح للمستخدمين التفاعل مع البوت عبر الأوامر الصوتية، مع القدرة على فهم الاستفسارات والرد عليها.

التدريب والتحسين: تم تدريب النظام للتعرف على أوامر صوتية محددة وتحسين دقة التعرف على الكلام باستخدام تقنيات التعلم الآلي.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
18
تاريخ الإضافة
تاريخ الإنجاز
المهارات