Predavanje JOTA (maj 2026)
Vabimo vas na predavanje JOTA, na katerem bo Jaka Čibej predstavil svoje delo z Digitalno slovarsko bazo za slovenščino.
Predavanje bo potekalo v ponedeljek, 18. maja 2026 ob 15h na Institutu Jožef Stefan (Teslova 30) v 1. nadstropju, predavalnici 39.
ponedeljek, 18. maj ob 15:00
Institutu Jožef Stefan (Teslova 30, Ljubljana)
predavalnica 39, 1. nadstropje
Naslov predavanja: Uporaba računalniškojezikoslovnih metod za urejanje oblikoslovnih podatkov v Digitalni slovarski bazi za slovenščino
Jaka Čibej
Povzetek predavanja: Strojno berljivi oblikoslovni in izgovorni podatki so med drugim koristni ne le za ljudi, temveč tudi za jezikovne tehnologije, kot so npr. označevalniki korpusov in razpoznavalniki govora. Ročno širjenje podatkovnih množic s tovrstnimi podatki je zlasti pri visoko pregibnih jezikih, kot je slovenščina, zamudno in z vidika človeških virov nevzdržno. Leksikografsko delo lahko olajšamo z uporabo drugih strojno berljivih virov, modelov strojnega učenja in velikih jezikovnih modelov. V predavanju si bomo ogledali nekaj primerov uporabe različnih metod za urejanje oblikoslovnih in izgovornih podatkov v Digitalni slovarski bazi za slovenščino, največji odprto dostopni podatkovni bazi z informacijami o slovenskih besedah. Do kolikšne mere lahko raziskovalce razbremenimo rutinskega pregledovanja napačno označenih besed iz korpusov?
