أداة توليد وصف تلقائي للصور باستخدام نموذج Gemini من Google
تم تطوير هذه الأداة كواجهة رسومية (GUI) تفاعلية باستخدام لغة Python، تسمح للمستخدم باختيار مجلد رئيسي يحتوي على صور موزعة في مجلدات فرعية، ثم توليد وصف نصي لكل صورة باستخدام نماذج الذكاء الاصطناعي من Google (Gemini).
تتضمن الأداة المميزات التالية:
تحديد عدد الصور المراد معالجتها من كل مجلد فرعي.
استثناء الصور المسماة "thumb".
دعم اختيار النموذج المناسب من Google Gemini مع إمكانية إدخال اسم النموذج يدويًا.
واجهة رسومية احترافية تشمل شريط تقدم، وإمكانية الإلغاء أثناء التنفيذ.
حفظ المسارات والقيم المستخدمة لسهولة الاستخدام لاحقًا.
إمكانية التحويل إلى ملف تنفيذي (EXE) للتشغيل دون الحاجة لتثبيت Python.
تصلح هذه الأداة لمشاريع التصنيف التلقائي، أو بناء مجموعات بيانات Annotated، أو إدارة الأصول الإعلامية.