مساعد عربي ذكي - ثورة في التفاعل الصوتي مع الذكاء الاصطناعي
مشروع متكامل يجمع بين أحدث تقنيات الذكاء الاصطناعي والصوت الطبيعي
المميزات الرائعة:
1. محادثة صوتية في الوقت الفعلي
- مكالمة صوتية مباشرة مع الذكاء الاصطناعي عبر WebSocket
- رد صوتي فوري "لحظة من فضلك" للتأكد من عمل الوكيل
- كشف تلقائي للصمت (VAD) - يتوقف عند انتهاء كلامك تلقائياً
- إمكانية المقاطعة (Barge-in) - يمكنك مقاطعة الرد في أي لحظة
- صوت طبيعي جداً باستخدام XTTS-v2 - لا تشعر أنك تتحدث مع روبوت!
2. دردشة نصية ذكية
- واجهة جميلة وسهلة الاستخدام
- ردود متدفقة (Streaming) - تظهر الكلمات تدريجياً أثناء الكتابة
- تسجيل صوتي يدوي - أرسل رسالة صوتية بدلاً من الكتابة
- حفظ تلقائي لتاريخ المحادثات
- دعم توليد الصور باستخدام Stable Diffusion
3. دعم متعدد اللغات
- العربية مع كشف تلقائي للهجة (مصري، خليجي، شامي، مغربي)
- الإنجليزية - English
- الفرنسية - Français
- الإسبانية - Español
4. سياقات مخصصة ذكية
- تعليمي: مساعد تعليمي متخصص في شرح الدروس
- تقني: مساعد برمجي وتقني
- طبي: مساعد صحي (مع تنبيهات طبية)
- أعمال: مساعد تجاري ومالي
- مخصص: ضع أي سياق تريده - دروس كاملة، محتوى تعليمي، أو أي شيء!
5. نظام API Keys متقدم
- إدارة كاملة للمستخدمين و API Keys
- تتبع الاستهلاك (Tokens و Cost)
- Rate Limiting للحماية
- لوحة تحكم إدارية شاملة
6. تقنيات متطورة
- Whisper لتحويل الكلام إلى نص بدقة عالية
- XTTS-v2 لتحويل النص إلى صوت طبيعي جداً
- Ollama مع نماذج Qwen/Llama للذكاء الاصطناعي
- Pipecat Architecture - بنية معمارية احترافية
7. أداء فائق
- معالجة في الوقت الفعلي
- Streaming للردود النصية والصوتية
- تحسينات للأداء والسرعة
- دعم GPU لتسريع المعالجة
الواجهات المتاحة:
1. واجهة الدردشة النصية (/) - دردشة تفاعلية مع واجهة جميلة
2. واجهة الوكيل الصوتي (/voice) - مكالمة صوتية مباشرة
3. لوحة التحكم (/admin) - إدارة API Keys والمستخدمين
التقنيات المستخدمة:
- Backend: FastAPI, Python
- AI Models: Ollama (Qwen/Llama), Whisper, XTTS-v2
- Database: SQLite
- Real-time: WebSocket
- Architecture: Pipecat-style Pipeline
سهولة الاستخدام:
- واجهات ويب جاهزة - لا حاجة لبرمجة
- API كامل للربط مع أي تطبيق
- دعم React/Vue/Angular
- وثائق شاملة مع أمثلة
لماذا هذا المشروع مميز؟
أول مشروع عربي متكامل يجمع بين الصوت الطبيعي والذكاء الاصطناعي
صوت طبيعي جداً - لا تشعر أنك تتحدث مع روبوت
دعم كامل للهجات العربية - يفهم لهجتك ويرد بنفس اللهجة
سياقات مخصصة - يمكنك جعله معلم، طبيب، مبرمج، أو أي شيء
مفتوح المصدر - يمكنك التعديل والتطوير بحرية
سهل التثبيت - خطوات بسيطة وواضحة
مثالي لـ:
- التعليم: معلم صوتي ذكي يشرح الدروس
- الأعمال: مساعد صوتي للعملاء
- الصحة: مساعد طبي صوتي
- التطوير: إضافة ميزات صوتية لتطبيقاتك
- الألعاب: شخصيات ذكية تتحدث بالصوت
جاهز للاستخدام الآن!
المشروع جاهز بالكامل ويمكنك تشغيله فوراً. كل ما تحتاجه:
- Python 3.8+
- Ollama
- ffmpeg
جرب تجربة المحادثة الصوتية مع الذكاء الاصطناعي - ستندهش من النتيجة!