وصف المشروع:
قمت بتطوير بوت متحدث يعتمد على Python ويستخدم تقنيات Speech Recognition و Speech Processing لتحويل الكلام إلى نص، ثم الرد على المستخدمين باستخدام تقنية النص إلى كلام (Text-to-Speech). يهدف المشروع إلى تحسين التفاعل بين البشر والأجهزة من خلال توفير واجهة صوتية ذكية.
المهام الرئيسية:
تحويل الصوت إلى نص: تم استخدام مكتبة SpeechRecognition لاستخراج النص من الصوت المدخل من الميكروفون، مع دعم اللغة العربية والإنجليزية.
معالجة الصوت: استخدمت تقنيات Speech Processing لتحسين دقة التعرف على الصوت، مثل إزالة الضوضاء وتحسين وضوح الصوت.
النص إلى كلام: تم دمج مكتبة pyttsx3 لتحويل النص إلى كلام (Text-to-Speech)، حيث يقوم البوت بالرد على المستخدمين بشكل صوتي.
واجهة تفاعلية: تم تصميم واجهة تفاعلية تتيح للمستخدمين التفاعل مع البوت عبر الأوامر الصوتية، مع القدرة على فهم الاستفسارات والرد عليها.
التدريب والتحسين: تم تدريب النظام للتعرف على أوامر صوتية محددة وتحسين دقة التعرف على الكلام باستخدام تقنيات التعلم الآلي.