تفاصيل العمل

نظام ذكي لاكتشاف هجمات Prompt Injection في تطبيقات الذكاء الاصطناعي ونماذج اللغة الكبيرة (LLMs)، يعتمد على معمارية متعددة الطبقات لزيادة الدقة وتقليل النتائج الخاطئة.

يتكون النظام من 4 طبقات:

تحليل قياسي باستخدام Regex

تحليل استدلالي يعتمد على كلمات مفتاحية وقواعد سلوكية

تصنيف باستخدام نموذج BERT

فحص أمني إضافي باستخدام نموذج لغوي كبير (LLM)

تم تنفيذ النظام في تطبيق تفاعلي باستخدام Streamlit يعرض قرارًا نهائيًا (آمن / مشبوه) مع نتائج كل طبقة بشكل منفصل.

الحل مناسب لتأمين الشات بوت، واجهات الـ API، وتطبيقات الذكاء الاصطناعي الحساسة ضد هجمات Prompt Injection.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات