تفاصيل العمل

هذا المشروع عبارة عن منصة خلفية (Backend) متطورة تعتمد على Django و الذكاء الاصطناعي بهدف أتمتة عملية معالجة السير الذاتية. يقوم النظام بتحويل ملفات PDF غير المنظمة إلى بيانات منظمة (Structured Data) بدقة عالية باستخدام نماذج اللغة الكبيرة (LLMs).

الهدف من المشروع

تسهيل عمل مسؤولي التوظيف وأنظمة إدارة المتقدمين (ATS) عبر استخراج المعلومات الأساسية من السير الذاتية تلقائياً، مما يلغي الحاجة للإدخال اليدوي للبيانات ويقلل من الأخطاء البشرية.

التقنيات المستخدمة (Tech Stack)

Django & Django REST Framework: لإدارة الواجهات البرمجية (APIs) والتعامل مع قاعدة البيانات.

LangChain: لربط وتوجيه تدفق البيانات بين النظام ونموذج الذكاء الاصطناعي.

Groq API (LLM): لاستخدام نماذج لغة متقدمة تتميز بالسرعة والدقة العالية في فهم سياق السير الذاتية.

PyMuPDF (fitz): لاستخراج النصوص الخام من ملفات الـ PDF.

PostgreSQL: لتخزين الملفات والبيانات المستخرجة (باستخدام JSONField).

Pydantic: لضمان جودة وصحة البيانات المستخرجة ومطابقتها للهيكلية المطلوبة.

آلية العمل (Workflow)

مرحلة الرفع (Upload): يقوم المستخدم برفع ملف السيرة الذاتية بصيغة PDF عبر الـ API.

مرحلة الاستخراج (Extraction): يقوم النظام بقراءة محتوى الملف وتحويله إلى نص خام.

المعالجة بالذكاء الاصطناعي (AI Parsing): يتم إرسال النص إلى نموذج Groq عبر LangChain مع تعليمات محددة (Prompt Engineering) لاستخراج:

المعلومات الشخصية (الاسم، البريد، الهاتف).

الخلفية التعليمية (الجامعات، التخصصات، الدرجات العلمية).

الخبرات العملية (الشركات، المسميات الوظيفية، الفترات الزمنية).

المهارات التقنية واللغات.

التحقق والتخزين (Validation & Storage): يتم التحقق من صحة البيانات الناتجة وتخزينها كـ JSON في قاعدة البيانات، مع تحديث حالة الملف إلى PARSED.

أبرز المميزات

فهم السياق: لا يعتمد على البحث عن كلمات مفتاحية فحسب، بل يفهم سياق الخبرات والمهارات بفضل الذكاء الاصطناعي.

تتبع الحالة: يوفر النظام حالات واضحة للملفات (تم الرفع، تم التحليل، فشل التحليل).

أمان مدمج: يستخدم نظام JWT Authentication لحماية البيانات وضمان وصول المستخدمين المصرح لهم فقط.

قابلية التوسع: مصمم ليكون محركاً أساسياً يمكن دمجه مع تطبيقات التوظيف أو لوحات التحكم الإدارية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة