ذا الكود هو محاولة لبناء وسم آلي (Tagger) للكلمات في اللهجة المصرية أو اللغة العربية باستخدام مكتبة nltk وتحديداً الاعتماد على تعبيرات النمط (Regular Expressions).