عنوان المشروع: إعداد نظام مراقبة وتنبيهات متقدم للبنية التحتية باستخدام Prometheus
وصف المشروع:
قمت بتصميم وتجهيز نظام مراقبة (Monitoring System) متكامل لمراقبة أداء الخوادم وضمان استمرارية الخدمة. المشروع يركز على تتبع استهلاك الموارد الحيوية (مثل القرص الصلب، المعالج، والذاكرة) وإرسال تنبيهات فورية عند تجاوز الحدود المسموح بها لتفادي توقف النظام.
ما قمت بإنجازه في هذا المشروع:
كتابة قواعد التنبيه (Alerting Rules): قمت بصياغة استعلامات PromQL معقدة لحساب نسبة استهلاك الأقسام (Partitions) في نظام Linux.
مثال من المشروع: إنشاء تنبيه DiskUsageAbove80Percent الذي يقوم بعملية حسابية لمقارنة المساحة المتاحة بالمساحة الكلية واستخراج النسبة المئوية.
إدارة حالات التنبيه (Alert Lifecycle):
إعداد خاصية for: 2m لضمان عدم إرسال تنبيهات كاذبة إلا بعد استمرار المشكلة لمدة دقيقتين.
التعامل مع حالات التنبيه من مرحلة الانتظار (PENDING) وحتى مرحلة الإطلاق (FIRING) كما هو موضح في الصور المرفقة.
تخصيص الرسائل (Templating): تخصيص محتوى رسالة التنبيه (Summary & Description) لتشمل متغيرات ديناميكية مثل عنوان الـ IP الخاص بالخادم المتضرر وقيمة الاستهلاك بدقة تقريبية (printf "%.2f").
المراقبة الدقيقة: تتبع الأجهزة والمجلدات المحددة (مثل /dev/nvme0n1p1 المربوط بـ /) لضمان مراقبة ملفات النظام الحيوية.