Predavanje Korpusi parlamentarnih razprav
V ponedeljek, 24. 4., ob 16:00 bo v okviru Podiplomske šole ZRC SAZU potekalo predavanje z naslovom Korpusi parlamentarnih razprav, v katerem bo izr. prof. dr. Tomaž Erjavec predstavil različne korpuse parlamentarnih razprav, s posebnim poudarkom na korpusih projekta ParlaMint. Več o vsebini in samem predavanju si lahko preberete v nadaljevanju.
Vljudno vabljeni!
Podiplomska šola ZRC SAZU, doktorski modul Leksikologija, leksikografija, slovničarstvo.
Ponedeljek, 24. 4. 2023 ob 16:00
Sejna soba podiplomske šole, Novi trg 2, 1. nadstropje
Predavanje: Korpusi parlamentarnih razprav
Tomaž Erjavec
Korpusi parlamentarnih razprav niso zanimivi samo za jezikoslovce, temveč tudi za družboslovce, zgodovinarje in vse ostale, ki bi hoteli analizirati politično dogajanje v svoji državi. Za razliko od ostalih virov je take korpuse mogoče tudi opremiti s podrobnimi osebnimi podatki govorcev, s čimer postanejo ti korpusi toliko bolj uporabni. Predavanje bo predstavilo zgodovino izdelave parlamentarnih korpusov v Sloveniji in delo na takih korpusih v okviru infrastrukture CLARIN, nato pa se osredotočilo na projekt ParlaMint, ki ga sofinancira CLARIN ERIC in v katerem imamo slovenski raziskovalci ključno vlogo. V prvi, že zaključeni fazi projekta, smo izdelali 17 korpusov razprav v parlamentih evropskih držav v obdobju 2015-2021. Korpusi so odprto dostopni, opremljeni z bogatimi meta-podatki in jezikoslovno označeni, dostopni pa so tudi na konkordančnikih CLARIN.SI. V drugi fazi, ki še poteka, bomo obstoječe korpuse osvežili z razpravami do sredine 2022, izdelali 13 novih (tudi regionalnih) korpusov, dodali nove metapodatke in korpuse avtomatsko prevedli v angleščino.
Tomaž Erjavec je zaposlen na Odseku za tehnologije znanja na Institutu »Jožef Stefan« in na Inštitutu za slovenski jezik Frana Ramovša na ZRC SAZU ter je nacionalni koordinator slovenske raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN.SI. Glavna področja njegovega dela so razvoj jezikovnih virov ter standardov in metod za njihovo kodiranje in označevanje. Sodeloval je v številnih slovenskih in mednarodnih projektih in je najbolj citiran raziskovalec s področja jezikoslovja v Sloveniji.