Jelenlegi hely

Rangos konferencián mutatták be a levéltár működő gyakorlatát

2025.09.22.
Idén 15. alkalommal rendezték meg Várnában (Bulgária) a Recent Advances in Natural Language Processing 2025-ös konferenciáját. A nagy múltra visszatekintő rendezvény központi témája a természetes nyelvfeldolgozás, vagyis az a régóta kutatott és folyamatos fejlesztés alatt álló technológia, amely lehetővé teszi a számítógépek számára az emberi nyelv megértését és értelmezését. Ez az innováció áll a háttérben annak, hogy gépekkel beszélgethetünk, szövegelemzést végezhetünk, vagy fordíthatunk.

A rendezvény gerincét adó konferenciát szeptember 8. és 10. között rendezték meg, amelyet egy nyári iskola és további workshopok követtek. A részletes program itt érhető el. 

A konferencián a levéltár képviseletében a Digitális Szolgáltatásfejlesztési Osztályának munkatársa, Szűcs Kata Ágnes vett részt, aki a poszterszekcióban mutatta be kollégáival közös munkáját, amely az állami anyakönyvek feldolgozásának munkafolyamatához kapcsolódik. Az előadás cikkének összeállításában Vadász Noémi és Záros Zsolt is részt vett. A poszter az alábbi linken megtekinthető.

A konferencia idei fókuszában a nagy nyelvi modellek (Large Language Model – LLM) nyelvészeti szempontú felhasználása állt. Az előadások során számos érdekes téma került felszínre, például az LLM-ek szerepe a hamis információgyártásban, illetve az is, hogy milyen feladatokra lehet mégis hatékonyan felhasználni. 

Több előadás is felvetette a problémát, hogy milyen metrikák mentén mérhető jól össze az LLM-ek működése, milyen módszerekkel válnak kiértékelhetővé. Bemutatták a DiBiMIT (Disambiguation Biases in Machine Translation) referencia szöveggyűjteményt is, amely a gépi fordítás és a szövegértelmezés kiértékelésére szolgál. 

A vezérgondolat és a panelelőadások alatt körvonalazódott, hogy a jelenlegi trendek értelmezése alapján a jövőben a kisebb, specializált feladatokra feltanított nyelvi modellek kerülhetnek előtérbe. A teljesítménynövekedés lassulását várják, és új technikákra lesz szükség a modellek teljesítményének javításához. 

A levéltár számára, ahol több százezer alapvetően írott szöveget őrzünk, kiemelkedő jelentőséggel bír, hogy a nyelvi modellek és a mesterséges intelligencia révén elindul egy olyan folyamat, amely lehetővé teszi ezen dokumentumok hatékonyabb feldolgozását. Ez a technológiai fejlődés nemcsak a kutatók munkáját segíti elő, hanem hozzájárul ahhoz is, hogy a levéltár elérhetőbbé váljon olyan érdeklődők számára, akikhez korábban nem jutott el, így szélesebb közönség számára nyújtva hozzáférést a fontos történelmi és kulturális anyagokhoz. 

Szűcs Kata Ágnes úgy értékelt, hogy a mostani konferencia ismét egy nagyszerű lehetőség volt a résztvevők számára, hogy megosszák kutatásaikat és kapcsolatokat teremtsenek, amiért valamennyien hálásak a szervezőknek.

 

Utolsó frissítés:

2025.09.22.

Új hozzászólás

A hozzászóláshoz regisztráció és bejelentkezés szükséges