نظام تحليل الصور الذكي وكشف العناصر باستخدام Google Gemini AI

تفاصيل العمل

وصف المشروع:

قمت بتطوير تطبيق ويب تفاعلي يعتمد على أحدث تقنيات الذكاء الاصطناعي (Gemini 2.5 Flash) لتحليل الصور بدقة عالية. يقوم النظام بالتعرف على العناصر الموجودة داخل الصورة وتحديد أماكنها (Object Detection) ورسم مربعات توضيحية (Bounding Boxes) حولها مع تسمية دقيقة لكل عنصر.

يهدف المشروع إلى توفير أداة قوية وسهلة الاستخدام للمطورين والشركات التي تحتاج إلى معالجة الصور واستخراج البيانات منها بشكل آلي.

المميزات الرئيسية:

دقة عالية في التعرف: يعتمد على نموذج Gemini 2.5 Flash القوي للتعرف على مختلف الكائنات في بيئات معقدة.

تحديد العناصر (Bounding Boxes): يرسم النظام مربعات دقيقة حول العناصر المكتشفة لسهولة التمييز.

ملصقات ذكية (Smart Labeling): لا يكتفي النظام بذكر اسم العنصر فقط، بل يمكنه وصف خصائصه (مثل اللون، الحالة) بناءً على الـ Prompt.

واجهة مستخدم عصرية: تم بناء الواجهة باستخدام Gradio بتصميم زجاجي (Glassmorphism) جذاب وسهل الاستخدام.

أمثلة جاهزة: يتضمن النظام أمثلة مسبقة (مثل تحليل سلة فواكه، حركة المرور، مكاتب العمل) لتجربة الأداة فوراً.

التقنيات المستخدمة:

لغة البرمجة: Python

الذكاء الاصطناعي: Google Gemini API (Generative AI)

واجهة المستخدم: Gradio Web Framework

معالجة الصور: مكتبة Pillow (PIL)

الاستضافة: Hugging Face Spaces

سيناريوهات الاستخدام (Use Cases):

المتاجر الإلكترونية: تصنيف المنتجات تلقائياً من الصور.

الأمن والمراقبة: تحليل صور الكاميرات للتعرف على الأشخاص أو المركبات.

إدارة المخزون: عد وفرز العناصر في المستودعات.

مجال العقارات والديكور: تحليل صور الغرف وتحديد الأثاث.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
المهارات