Skip to content

Kodluyoruz-DSPG/NLP-Text-Classification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 

Repository files navigation

NLP- Aciliyet Sınıflandırması

Proje Tanıtım Videosu'na buradan ulaşabilirsiniz

Priorist Nedir?

Gelen tüm mesajları "Acil" ve "Acil Değil" olarak sınıflandırarak tehlike veya önem içeren mesajları ön plana çıkarıp hızlıca fark edilmesini sağlar.



Not: Bu repository içerisindeki tüm mesajlar örnek teşkil etmesi amacıyla ekibimiz tarafından gerçek mesajlara benzer şekilde oluşturulmuştur.

PreProcessing

Her bir satır aşağıdaki gibi noktalama işaretlerinden, özel karakterlerden temizlendi ve varsa link, mail adresi gibi bağlantılar kaldırıldı.

Zemberek

Java ile yazılmış türkçe nlp kütüphanesi olan Zemberek bilgisayarımızdaki JVM(java virtual machine) çalıştırarak ve gerekli dosyaları import edilerek kullanıldı. Bu doslayarı buradaki linkte bulabilirsiniz. Dosyaların görünümü şu şekilde:




























Zemberek java kodu içerisindeki TurkishMorphology, TurkishSpellChecker, TurkishSentenceNormalizer classlarının methodları kullanıldı. Zemberek sonucundaki çıktı:














Labeling

Datayı etiketleme aşamasında kullanabilmek için desktop/mobile olarak geliştirdiğimiz 2 uygulama.



ML Model Results

Naive Bayes

SVM

Logistic Regression

Comparison

Geliştirilen üç farklı model ile ortalama %85 doğruluk puanı (Accuracy score) elde edilmiştir.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published