Hatvani, Péter, Yang, Zijian Győző (2025) Automated detection of toxic comments in Hungarian Annales Mathematicae et Informaticae. 61. pp. 108-117. ISSN 1787-6117 (Online)
| 
              
pdf
 108_117_hatvani.pdf Download (903kB) [error in script]  | 
          
Absztrakt (kivonat)
Moderating toxic online comments in Hungarian remains a challenging NLP task. We introduce the first openly available Hungarian corpus for toxic comment classification, though limited in size (n = 655), sourced from social media and political news forums. We fine-tuned three BERTbased classifiers (huBERT, multilingual BERT, and huBERT-SetFit) and applied data augmentation techniques to expand the training dataset. The best-performing model, huBERT-SetFit, achieved an F1 score of 93.7%. Our results demonstrate the effectiveness of transformer-based models for toxicity detection in low-resource, linguistically complex settings.
| Mű típusa: | Folyóiratcikk - Journal article | 
|---|---|
| Szerző: | Szerző neve Email MTMT azonosító ORCID azonosító Közreműködés Hatvani, Péter NEM RÉSZLETEZETT NEM RÉSZLETEZETT NEM RÉSZLETEZETT Szerző Yang, Zijian Győző NEM RÉSZLETEZETT NEM RÉSZLETEZETT NEM RÉSZLETEZETT Szerző  | 
        
| Kapcsolódó URL-ek: | |
| Kulcsszavak: | toxicity, online hate, nlp, classification, logistic regression | 
| Folyóirat alcíme: | Selected papers of the International Conference on Formal Methods and Foundations of Artificial Intelligence | 
| Nyelv: | angol | 
| Kötetszám: | 61. | 
| DOI azonosító: | 10.33039/ami.2025.10.007 | 
| ISSN: | 1787-6117 (Online) | 
| Felhasználó: | Tibor Gál | 
| Dátum: | 29 Okt 2025 12:33 | 
| Utolsó módosítás: | 29 Okt 2025 12:33 | 
| URI: | http://publikacio.uni-eszterhazy.hu/id/eprint/8829 | 
![]()  | 
        Tétel nézet | 
        