Ujhelyi, Gábor (2024) Interaktív hangoskönyvek az oktatásban In: Agria Média 2023. Eger, Eszterházy Károly Katolikus Egyetem Líceum Kiadó. pp. 49-56.
pdf
49_Ujhelyi.pdf Download (280kB) [error in script] |
Absztrakt (kivonat)
A hangoskönyvek oktatási alkalmazására már sok esetben tettek próbálkozásokat, azonban egyelőre nem épült be szervesen a módszerekbe. Annak ellenére, hogy létrejöttük nem újkeletű, kevés fejlődésen mentek keresztül, azonban az utóbbi évek technológiai fejlesztései számos új alkalmazási, bővítési lehetőséget nyitnak meg. Az írott ismeretanyagok hangon keresztül befogadhatóságához több út vezet. Ebből a megközelítésből a figyelem középpontjába elsősorban a tudományos, ismeretterjesztő, szak- illetve tankönyvek kerülnek. Ebben az esetben arányaiban kisebb jelentősége van az audio előadás módjának, stílusának, hangszínének, dominánsabb az információ jól érthető átadásának szándéka, aminek köszönhetően a maga hiányosságaival együtt is van létjogosultsága a gépi felolvasásnak, beszédszintézisnek. Kutatásom célja annak igazolása, hogy a jelenleg széles körben elérhető és egyre fejlettebb nagy nyelvi modellek, valamint felhő szolgáltatásokon keresztül elérhető text-to-speech (gépi felolvasó) és speech-to-text (leiratozó) megoldások segítségével megvalósítható, hogy egy digitálisan rendelkezésre álló írott könyv automatikusan előállhat hangoskönyvként úgy, hogy ne csak felolvastatható és meghallgatható, de gépileg interaktívvá tehető, öszszefoglaltatható, magyaráztatható és kérdezhető legyen, ami nagy mértékben hozzájárulhat ahhoz, hogy az oktatási anyagok az auditív tanulótípusokhoz is közelebb kerüljenek és segítsék az anyag megértését és elmélyülését, valamint segítséget nyújthat az olvasási nehézségekkel küzdő tanulók számára. A kutatás megvalósítása során a jelenleg elérhető fejlett felhő alapú és helyben futtatható nagy nyelvi modellek tulajdonságait, finomhangolhatóságát, különböző méretű dokumentumok feldolgozhatóságát és azokról egy minta alkalmazásban írott vagy szóbeli formában természetes nyelven feltett kérdésekre általuk adott válaszok tartalmi validitását vizsgálom. ----- INTERACTIVE AUDIOBOOKS IN EDUCATION Attempts have already been made to use audio books in education in many cases, but so far it has not been integrated organically into the methods. Despite the fact that their creation is not new, they have undergone little development, however, the technological developments of recent years open up many new application and expansion possibilities. There are several ways to absorb written knowledge materials through sound. From this approach, the focus of attention is primarily on scientific, informative, specialist and textbooks. In this case, the method, style, and timbre of the audio presentation are relatively less important, the intent of the easy-tounderstand transfer of information is more dominant, thanks to which even with its shortcomings, machine reading and speech synthesis have a right to exist. The aim of my research is to prove that with the help of currently widely available and increasingly advanced large language models, as well as text-to-speech (machine reading) and speech-to-text (transcribing) solutions available through cloud services, it is possible to implement a digitally available written book to automatically appear as an audio book in such a way that it can not only be read aloud and listened to, but also automatically made interactive, summarized, explained and asked questions, which can greatly contribute to bringing educational materials closer to auditory types of students and helping them to understand and deepen the material, and can help students with reading difficulties. During the implementation of the research, I am examining the properties, fine-tuning, document processing capabilites of currently available large lannguage models of different sizes and the content validity of the answers they give to questions asked in natural language in a sample application.
Mű típusa: | Könyvrészlet - Book section |
---|---|
Szerző: | Szerző neve Email MTMT azonosító ORCID azonosító Közreműködés Ujhelyi, Gábor NEM RÉSZLETEZETT NEM RÉSZLETEZETT NEM RÉSZLETEZETT Szerző |
Kapcsolódó URL-ek: | |
Kulcsszavak: | hangoskönyv, interaktivitás, mesterséges intelligencia, nagy nyelvi modellek, auditív tanulótípus, olvasási nehézségek ----- audiobook, interactivity, artificial intelligence, large language models, auditory learner type, reading difficulties |
Nyelv: | magyar |
DOI azonosító: | 10.17048/AM.2023.49 |
Felhasználó: | Tibor Gál |
Dátum: | 24 Szep 2024 10:46 |
Utolsó módosítás: | 29 Nov 2024 08:05 |
URI: | http://publikacio.uni-eszterhazy.hu/id/eprint/8191 |
Tétel nézet |