Proje Tanıtım Videosu'na buradan ulaşabilirsiniz
Gelen tüm mesajları "Acil" ve "Acil Değil" olarak sınıflandırarak tehlike veya önem içeren mesajları ön plana çıkarıp hızlıca fark edilmesini sağlar.
Not: Bu repository içerisindeki tüm mesajlar örnek teşkil etmesi amacıyla ekibimiz tarafından gerçek mesajlara benzer şekilde oluşturulmuştur.
Her bir satır aşağıdaki gibi noktalama işaretlerinden, özel karakterlerden temizlendi ve varsa link, mail adresi gibi bağlantılar kaldırıldı.
Java ile yazılmış türkçe nlp kütüphanesi olan Zemberek bilgisayarımızdaki JVM(java virtual machine) çalıştırarak ve gerekli dosyaları import edilerek kullanıldı. Bu doslayarı buradaki linkte bulabilirsiniz. Dosyaların görünümü şu şekilde:
Zemberek java kodu içerisindeki TurkishMorphology, TurkishSpellChecker, TurkishSentenceNormalizer classlarının methodları kullanıldı. Zemberek sonucundaki çıktı:
Datayı etiketleme aşamasında kullanabilmek için desktop/mobile olarak geliştirdiğimiz 2 uygulama.
Geliştirilen üç farklı model ile ortalama %85 doğruluk puanı (Accuracy score) elde edilmiştir.