Building machine reading comprehension model from scratch

Yang, Zijian Győző, Ligeti-Nagy, Noémi (2023) Building machine reading comprehension model from scratch Annales Mathematicae et Informaticae. 57. pp. 107-123. ISSN 1787-6117 (Online)

[thumbnail of 107_123.pdf] pdf
107_123.pdf

Download (1MB) [error in script]
Hivatalos webcím (URL): https://doi.org/10.33039/ami.2023.03.001

Absztrakt (kivonat)

In this paper, we introduce a machine reading comprehension model and how we built this model from scratch. Reading comprehension is a crucial requisite for artificial intelligence applications, such as Question-Answering systems, chatbots, virtual assistants etc. Reading comprehension task requires the highest complexity of natural language processing methods. In recent years, the transformer neural architecture could achieve the ability to solve high complexity tasks. To make these applications available in Hungarian as well it is inevitable to design a Hungarian corpus of reading comprehension so that the pretrained models can be fine-tuned on this dataset. In our research, we have created the HuRC (Hungarian Reading Comprehension) corpus, which is the first dataset in Hungarian aiming to train, test and evaluate language models on a reading comprehension task. We built such a dataset based on the English ReCoRD corpus. This is a dataset of 120,000 examples consisting of news articles containing a passage and a close-style query, where a named entity is masked and the reference answer has to be found in a list. Using the evaluated dataset and transformers’ question-answering library, we have built the first neural machine reading comprehension models in commonsense reasoning task for Hungarian.

Mű típusa: Folyóiratcikk - Journal article
Szerző:
Szerző neve
Email
MTMT azonosító
ORCID azonosító
Közreműködés
Yang, Zijian Győző
NEM RÉSZLETEZETT
NEM RÉSZLETEZETT
NEM RÉSZLETEZETT
Szerző
Ligeti-Nagy, Noémi
NEM RÉSZLETEZETT
NEM RÉSZLETEZETT
NEM RÉSZLETEZETT
Szerző
Kapcsolódó URL-ek:
Nyelv: angol
Kötetszám: 57.
DOI azonosító: 10.33039/ami.2023.03.001
ISSN: 1787-6117 (Online)
Felhasználó: Tibor Gál
Dátum: 10 Már 2023 13:12
Utolsó módosítás: 11 Aug 2023 06:59
URI: http://publikacio.uni-eszterhazy.hu/id/eprint/7615
Műveletek (bejelentkezés szükséges)
Tétel nézet Tétel nézet