مشروع نظام توصية الأفلام باستخدام تقنيات التصفية المستندة إلى المحتوى
يعتمد هذا المشروع على تقنيات التصفية المستندة إلى المحتوى لتقديم اقتراحات أفلام بناءً على أوصافها وأنواعها. تم بناء النظام باستخدام مجموعة بيانات تضم الأفلام الأعلى تقييمًا من TMDB، حيث يعتمد على CountVectorizer لاستخراج الميزات، وعلى تشابه جيب التمام (Cosine Similarity) لحساب التشابه بين الأفلام.
مراحل التنفيذ والأدوات المستخدمة:
معالجة البيانات وتحليل الميزات: تم استخدام Python وJupyter Notebook لتحليل مجموعة البيانات وتنظيفها، وتم تطبيق CountVectorizer لتحويل الأوصاف النصية إلى ميزات قابلة للقياس.
حساب التشابه: تم استخدام تقنية Cosine Similarity لحساب التشابه بين الأفلام وتحديد الأفلام الأكثر شبهاً بناءً على الفيلم المدخل.
تطوير النموذج وتقديم التوصيات: بعد حساب التشابه، يقوم النظام باقتراح قائمة بالأفلام الأكثر تشابهاً مع الفيلم المدخل. يساعد هذا النظام في تحسين تجربة المشاهد بتقديم توصيات ملائمة.
إمكانية التطوير المستقبلي: تم تصميم المشروع ليكون مرناً لإضافة تحسينات مستقبلية، مثل دمج تقنيات التوصية الهجينة وتطوير واجهة ويب لتقديم توصيات في الوقت الفعلي.