Slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije
Common Language Resources and Technology Infrastructure, Slovenia

Partnerji CLARIN.SI

Alpineon, d.o.o.

Alpineon, d.o.o., je slovensko visokotehnološko podjetje (MSP), ki se ukvarja z raziskavami in  razvojem na področju računalniškega vida in informacijsko-komunikacijskih tehnologij (IKT). Alpineon ima bogate izkušnje z razvojem strojne in programske opreme, ki vključuje aplikacije za integracijo telefona in  računalnika, storitve in naprave za IP-telefonijo, biometrične tehnologije (prepoznavanje govorcev in prepoznavanje obrazov), slikovne tehnologije (3D- strojni vid) in govorne tehnologije (sinteza govora v slovenščini (STT), samodejna prepoznava govora (ASR), strojno prevajanje govora (STS), aplikacije za govorne portale, ipd.).

Alpineon je vključen v več mednarodnih in domačih raziskovalnih projektov s področja jezikovnih tehnologij, obdelave slik in biometrike. Združuje 14 raziskovalcev in razvijalcev, med katerimi je 7 doktorjev znanosti. Alpineon je prejemnik nagrade za tehnološke inovacije za osebe s posebnimi potrebami (2003) in nagrade za izjemne dosežke (2013), ki jo podeljuje Javna agencija za raziskovalno dejavnost RS (ARRS), poleg tega je leta 2013 postal dvakratni zmagovalec mednarodnega tekmovanja ICB v kategoriji prepoznave obraza in govorca, leta 2014 pa je prejel tudi nagrado Ambasador zasebnosti, ki jo podeljuje informacijski pooblaščenec RS za najboljše ukrepe na področju varovanja zasebnosti.

Alpineon je član evropske infrastrukture CLARIN od leta 2007 in je eden ustanovnih članov centra CLARIN.SI. Alpineon v infrastrukturo CLARIN prispeva predvsem jezikovne in govorne tehnologije.

Zastopnica: Jerneja Žganec Gros
Namestnik: Boštjan Vesnicer

Amebis, d.o.o.

Podjetje Amebis je bilo ustanovljeno leta 1991 za razvoj in izdelavo programske opreme s področja jezikovnih tehnologij in elektronskega založništva. Cilj podjetja je ustvarjanje tako jedrnih tehnologij (modulov) kot proizvodov za široko rabo.

Glavna področja delovanja so:

  • Korpusi: gradnja besedilnih in govornih korpusov ter izdelava konkordančnikov (npr. Gigafida, Gos).
  • Jezikovne obdelave: različni jezikovni moduli za slovenščino in nekatere druge jezike, ki so na voljo kot vtičniki za različne programske pakete (MS Office, Lotus Notes, SAS itd.): črkovalniki, delilniki, lematizatorji, generatorji besednih oblik, slovnični pregledovalniki.
  • Strojno prevajanje: razvoj programa Presis, na pravilih temelječega sistema za strojno prevajanje za slovenščino.
  • Sinteza govora: sintetizator govora Govorec (razvit skupaj z IJS) in visokokvalitetni sintetizator govora eBralec (razvit skupaj z Alpineonom in IJS) za slovenski jezik.
  • Sistemi dialoga: platforma SecondEgo, namenjena ustvarjanju in delu z virtualnimi asistenti (boti), ki poenostavljajo komunikacijo s končnimi uporabniki v različnih naravnih jezikih.
  • Elektronski slovarji: priprava več kot 160 elektronskih in 80 knjižnih slovarjev, pa tudi slovarskih portalov, med katerimi sta najbolj znana Termania and Fran.

Amebis je bil tudi partner v nekaj projektih EU in je eden ustanovnih članov CLARIN.SI.

Zastopnik: Miro Romih
Namestnika: Peter Holozan, Iztok Grilc

Institut “Jožef Stefan”

Institut “Jožef Stefan” (IJS) je vodilna slovenska raziskovalna ustanova na področju bazičnih in aplikativnih raziskav v naravoslovju in tehnologiji, ki ima več kot 900 zaposlenih. Na IJS so v razvoj in vzdrževanje infrastrukture CLARIN.SI vključene tri organizacijske enote:

  • Odsek za tehnologije znanja izvaja raziskave naprednih informacijskih tehnologij. Uveljavljena področja dela vključujejo inteligentno podatkovno analitiko, tekstovno in spletno rudarjenje, jezikovne tehnologije in računalniško jezikoslovje, podporo odločanju ter upravljanje znanja. Na področju jezikovnih tehnologij je odsek eden izmed vodilnih (in najstarejših) slovenskih centrov za razvoj jezikovnih virov in orodij za jezikoslovno označevanje, še posebno v povezavi s standardizacijo kodiranja besedil in jezikovnih formalizmov ter odprtim dostopom do jezikovnih virov. Odsek je tudi ena prvih ustanov, ki je v Sloveniji začela razvijati in promovirati digitalno humanistiko.  
  • Področje dela Laboratorija za umetno inteligenco so informacijske tehnologije s poudarkom na tehnologijah umetne inteligence. Najpomembnejša področja raziskav in razvoja so: (a) analiza podatkov s poudarkom na tekstovnih, spletnih, večpredstavnih in dinamičnih podatkih, (b) tehnike za analizo velikih količin podatkov v realnem času, (c) vizualizacija kompleksnih podatkov, (d) semantične tehnologije in (e) jezikovne tehnologije. Na ravni Evropske unije laboratorij deluje kot partner v številnih projektih na področju analitike in obdelave besedil. Pokriva predvsem izdelavo tehnologij za luščenje znanja iz besedil in za strojno prevajanje. Poseben poudarek daje tudi promociji znanosti. V sodelovanju s Centrom za prenos znanja na področju informacijskih tehnologij (CT3) vzdržuje večkrat nagrajeni izobraževalni portal VideoLectures.NET in prireja državno tekmovanje v znanju računalništva, ki je del krovnega tekmovanja združenja ACM.
  • Center za mrežno infrastrukturo upravlja infrastrukturo omrežij in strojne opreme na IJS. Dejaven je predvsem na področju avtentikacije zaupanja vrednih virov, med drugim vzdržuje storitev IdP na IJS in aktivno sodeluje pri mreži EduGain ter drugih tovrstnih prizadevanjih na ravni EU.

IJS je gostitelj raziskovalne infrastrukture CLARIN.SI. Koordinira delo infrastrukture, vzdržuje in nadgrajuje njen repozitorij in storitve, razvija jezikovne vire in orodja itd.

Zastopnik: Tomaž Erjavec (nacionalni koordinator)
Namestniki: Simon Krek,  Jan Jona Javoršek, Nikola Ljubešić, Katja Meden, Taja Kuzman

Inštitut za novejšo zgodovino

Inštitut za novejšo zgodovino (INZ) je osrednja nacionalna ustanova za zgodovinopisne raziskave obdobja od 19. stoletja do danes. Inštitut je ena najpomembnejših ustanov na področju digitalne humanistike v Sloveniji in je nacionalna koordinacijska ustanova DARIAH-SI, članice infrastrukturnega konzorcija DARIAH-ERIC.

Eden od treh raziskovalnih programov Inštituta je Raziskovalna infrastruktura slovenskega zgodovinopisja, ki vzdržuje portal Zgodovina Slovenije – SIstory. Raziskovalna infrastruktura izvaja digitalizacijo zgodovinsko pomembnega gradiva in upravlja izvorno digitalne vsebine. Druga naloga je spletno objavljanje literature in virov za zgodovinopisne raziskave, ne glede na njihovo obliko ali formate, s čimer se ne omejuje samo na besedilne vire. Ker tekstovne datoteke predstavljajo večino njihovega digitalnega arhivskega gradiva, se osredotočajo na napredno označevanje besedil v skladu s Smernicami TEI in uporabo ustreznih XML tehnologij. Na ta način nastajajo obsežni besedilni korpusi, ki temeljijo predvsem na stenografskih zapisih različnih slovenskih zakonodajnih teles.

INZ je bil eden izmed ustanovnih članov CLARIN.SI in prispeva k delovanju infrastrukture CLARIN predvsem s tem, da omogoča dostop do svojih velikih in bogato kodiranih zbirk besedil iz novejših slovenskih historičnih virov in da deluje kot kot primarna zveza z DARIAH(-SI).

Zastopnica: Darja Fišer
Namestniki: Jakob Lenardič, Andrej Pančur, Mojca Šorn

Narodna in univerzitetna knjižnica Slovenije

Narodna in univerzitetna knjižnica (NUK) je slovenska nacionalna knjižnica, osrednja državna knjižnica in univerzitetna knjižnica Univerze v Ljubljani, nacionalni agregator e-vsebin za Europeano in dom Digitalne knjižnice Slovenije.

NUK zbira, dokumentira, hrani in arhivira pisno kulturno in znanstveno dediščino slovenskega naroda. Omogoča enostaven dostop do znanja in kulture preteklih in sedanjih slovenskih generacij. V sodelovanju z nacionalnimi in mednarodnimi knjižnicami omogoča dostop do svetovne pisne kulturne in znanstvene dediščine. V procesu ustvarjanja novega znanja uporabnikom pomaga iskati, izbirati, vrednotiti in uporabljati informacijske vire v različnih formatih, oblikah in jezikih. Njegove zbirke in storitve podpirajo znanstveno in znanstveno delo Univerze v Ljubljani in drugih visokošolskih ustanov. Knjižnica je središče znanja, namenjenega vseživljenjskemu izobraževanju Slovencev ter dvigovanju njihove kulturne in izobrazbene ravni ter informacijske pismenosti. Z raziskovalno, razvojno in izobraževalno dejavnostjo na področju knjižničarstva. Knjižnica aktivno sooblikuje slovenski knjižnični sistem ter pomembno prispeva k teoretičnim in praktičnim spoznanjem bibliotekarstva in informacijske znanosti.

Predstavnica: Ines Vodopivec

Slovensko društvo za jezikovne tehnologije

Slovensko društvo za jezikovne tehnologije (SJDT) je bilo ustanovljeno leta 1998 in združuje okrog 120 strokovnjakov, ki uporabljajo jezikovne tehnologije kot znanstveniki, pedagogi ali splošni uporabniki. Dejavnosti SDJT-ja so usmerjene v promocijo razvoja jezikovnih tehnologij za slovenski jezik. Leta 2011 je društvo prejelo poseben status raziskovalne ustanove, katere delovanje je v javnem interesu. 

Glavni dejavnosti SDJT-ja sta serija rednih mesečnih jezikovnotehnoloških predavanj JOTA in organizacija konference Jezikovne tehnologije, ki poteka vsako drugo leto. Društvo (so)prireja tudi izobraževalne dogodke, kot so poletna šola “ESSLLI Summer School on Language, Logic and Information”, poletna šola TransTech o prevajalskih tehnologijah ter seminarji za osnovnošolske in srednješolske učitelje na temo uporabe korpusov in spletnih jezikovnih virov za slovenščino. 

SDJT je ustanovni član konzorcija CLARIN.SI in prispeva k ciljem evropskega združenja za jezikovne vire in tehnologije CLARIN predvsem z dejavnostmi, namenjenimi uporabnikom, tj. s seminarji, delavnicami in organizacijo konferenc. 

Zastopnik: Slavko Žitnik
Namestnica:  Kaja Dobrovoljc

Univerza v Ljubljani

Univerza v Ljubljani je največja in najstarejša slovenska univerza. Delo na področju korpusnega jezikoslovja in jezikovnih tehnologij koordinira Center za jezikovne vire in tehnologije (CJVT UL). Center je je enota Univerze v Ljubljani namenjena znanstvenemu raziskovanju in vzpostavljanju ter vzdrževanju temeljnih digitalnih jezikovnih virov in jezikovnotehnoloških orodij za sodobni slovenski jezik. Namen centra je, da so ti viri in orodja praktično uporabni in preko spleta dostopni vsem uporabnikom slovenskega jezika v svetu.

Med raziskovalnimi nalogami sta izpostavljeni predvsem: i) opis sodobnega slovenskega jezika z vseh vidikov: deskriptivnega, normativnega, terminološkega, jezikovnotehnološkega, didaktičnega itd., s poudarkom na upoštevanju potreb različnih končnih uporabnikov jezikovnih virov, opisov in orodij; ii) računalniško podprto učenje in poučevanje slovenščine in tujih jezikov.

Praktične naloge obsegajo predvsem stalen, brezplačen in uporabniško prijazen dostop do korpusnih, leksikalnih, terminoloških in drugih zbirk Centra, vzpostavljanje in vzdrževanje spletnih učnih okolij za učenje in poučevanje slovenščine in tujih jezikov ter  distribucija javno financiranih in javno dostopnih jezikovnih virov in orodij za slovenščino.

Pomembna naloga Centra je omogočiti javno dostopnost informacij o jezikovnih virih in tehnologijah za slovenščino z namenom informiranja javnosti in razširjanja jezikovnih virov in orodij. Ta naloga je močno povezana s cilji infrastrukture CLARIN.

Zastopnica: Monika Kalin Golob
Namestniki: Špela Arhar Holdt, Simon Dobrišek, Nataša Logar, Karmen Pižorn, Marko Robnik Šikonja, Tadeja Rozman, Špela Vintar

Univerza v Mariboru

Univerza v Mariboru je druga največja in druga najstarejša univerza v Sloveniji s približno 18.000 vpisanimi. Združuje sedemnajst univerz z dodiplomskimi in podiplomskimi programi. Univerza v Mariboru pomembno prispeva k razvoju regije, njene fakultete pa niso zgolj v Mariboru, ampak tudi v drugih delih Slovenije. Na področju razvoja in uporabe jezikovnih tehnologij in orodij so izjemno dejavni člani naslednji dveh fakultet UM:

Poslanstvo Fakultete za elektrotehniko, računalništvo in informatiko je posredovanje znanja in spodbujanje raziskovanja na področju elektrotehnike, računalništva, informacijskih tehnologij, medijskih komunikacij, telekomunikacije in mehatronike. Njeni člani so pri številnih projektih sodelovali z razvojem jezikovnih virov in orodij za obdelavo naravnega jezika za slovenščino.

Filozofska fakulteta, ustanovljena 2006, je najmlajša članica Univerze v Mariboru, vendar imajo njeni programi in oddelki, ki so se najprej razvijali v okviru Pedagoške fakultete, že dolgo zgodovino. S svojim delovanjem pokriva področja slovanskih jezikov, anglistike in amerikanistike, germanistike in madžarskega jezika, pa tudi področja zgodovine, geografije, filozofije, sociologije, psihologije in pedagogike.

Univerza v Mariboru je vodila številne jezikovnotehnološke projekte oziroma pri njih sodelovala in tako z razvojem jezikovnih virov, kot so zbirke podatkov za prepoznavo govora in jezikovnotehnološka orodja, prispevala k razvoju infrastrukture CLARIN. Raziskave jezikovnih in govornih tehnologij na Univerzi v Mariboru potekajo predvsem na Fakulteti za elektrotehniko, računalništvo in informatiko, v okviru Inštituta za elektroniko in telekomunikacije in Inštituta za računalništvo (Laboratorij za heterogene računalniške sisteme). Člani Filozofske fakultete pa so potencialni uporabniki storitev infrastrukture CLARIN.

Zastopnica: Darinka Verdonik
Namestnika: Milan Ojsteršek, Andrej Žgank

Univerza v Novi Gorici

Univerza v Novi Gorici je mlada (ust. 1995, univerzitetna akreditacija 2005) nejavna raziskovalno usmerjena univerza, ki jo sestavlja 7 fakultet in 12 raziskovalnih centrov. Je članica Evropske zveze univerz (European University Association), vključno s članstvom v Svetu za doktorsko izobraževanje (EUA Council for Doctoral Education). Kljub relativni majhnosti (med zaposlenimi ca. 100 doktorjev znanosti) je Univerza izvajala že vrsto nacionalno in evropsko financiranih projektov – med drugim tudi leta 2011 podeljeni, 4 mio. EUR vredni projekt iz razpisa FP7-REGPOT –, sodeluje s preko 40 evropskimi in mednarodnimi univerzami in raziskovalnimi ustanovami, sodeluje v študijskih in raziskovalnih izmenjavnih programih (ERASMUS, COST) in v enem Erasmus Mundus skupnem študijskem programu. Od leta 2015 je tudi članica mreže CLARIN.SI.

Dejavnosti povezane z mrežo CLARIN.SI potekajo v UNG-jevem Centru za kognitivne znanosti jezika. Enota trenutno zaposluje 6 doktorjev znanosti, ki se primarno osredotočajo na formalno teoretično in eksperimentalno jezikoslovje, hkrati pa se ukvarjajo tudi z uporabnojezikoslovnimi raziskavami, od jezikovnonačrtovalnih elaboratov za Ministrstvo za kulturo RS do izvajanja spletnega jezikovnega svetovanja (ŠUSS, JeSv). Prek Centra za kognitivne znanosti jezika Univerza v Novi Gorici prispeva v infrastrukturo CLARIN svoje jezikovne vire.

Zastopnik: Rok Žaucer
Namestnik: Franc Marušič

Univerza na Primorskem

Sedež Univerze na Primorskem je v slovenskem Primorju, njene fakultete in inštituti pa so v Kopru, Izoli in Portorožu. Na Univerzi se izobražuje približno 5000 študentov, med raziskovalnimi področji, s katerimi se ukvarja, pa so tudi jezikovne tehnologije in viri.
 
Fakulteta za matematiko, naravoslovje in informacijske tehnologije dodiplomsko in podiplomsko izobražuje ter raziskuje na področjih matematike, računalništva, naravoslovje in biotehničnih ved. Z jezikovnimi tehnologijami, predvsem s strojnim prevajanjem in ekstrakcijo znanja, se ukvarjajo na Oddelku za informacijske vede in tehnologije.
 
Fakulteta za humanistične študije dodiplomsko in podiplomsko izobražuje ter raziskuje na področjih jezikoslovja, humanistike in družboslovje in raziskovanje. Z jezikovnimi tehologijami, predvsem s korpusnim jezikoslovjem, se ukvarjajo na Oddelku za uporabno jezikoslovje, Oddelku za slovenistiko in Oddelku za italijanistiko.
 
Univerza na Primorskem sodeluje v različnih raziskovalnih projektih s področja jezikovnih tehnologij. V konzorcij CLARIN je prispevala nekaj področnih korpusov in slovarjev in je uporabnica virov in storitev infrastrukture CLARIN.
 
Zastopnik: Jernej Vičič

ZRC SAZU

Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti (ZRC SAZU) je vodilno slovensko raziskovalno središče na področju humanistike in sodi med vrhunske akademske ustanove v Srednji, Vzhodni in Jugovzhodni Evropi.

Multidisciplinarnost ZRC SAZU se kaže v raziskovanju tako humanistike kot tudi naravoslovnih in družboslovnih znanosti. Raziskovalna pozornost je med drugim usmerjena v mnogo tem, povezanih s slovensko naravno in kulturno dediščino. Raziskovalno mrežo ZRC SAZU sestavlja 18 inštitutov s skupaj več kot 300 raziskovalci in tehničnimi sodelavci.

Največji med inštituti je Inštitut za slovenski jezik Frana Ramovša, ki je nacionalno središče za sistematično spremljanje in opis slovenskega jezikovnega gradiva. Inštitut je bil ustanovljen leta 1945 z namenom, da zbira jezikovno gradivo in ga uporablja za izdelavo temeljnih del slovenskega jezikoslovja, predvsem slovarjev, kot so pravopisni slovar, slovar knjižnega jezika, terminološki slovarji, etimološki slovarji, zgodovinski slovarji, dialektološki slovarji, lingvistični atlasi, prav tako pa tudi opisne in zgodovinske slovnice in druge jezikoslovne raziskave. Na Inštitutu za slovenski jezik Frana Ramovša so nastali vsi pomembnejši enojezični razlagalni slovarji slovenskega jezika. Od leta 2000 je Inštitut objavil 38 slovarjev na 18.402 straneh, 73 monografij na 21.102 straneh in 36 številk jezikoslovnih revij na 7785 straneh. Večina teh del je elektronsko prosto ali tudi odprto dostopnih.

Zastopnica: Mateja Jemec Tomazin
Namestnice: Helena Dobrovoljc, Jerneja Fridl, Nina Ledinek

Znanstveno-raziskovalno središče Koper

Znanstveno-raziskovalno središče (ZRS) Koper deluje na izrazito interdisciplinarnem področju, znotraj katerega se prepletajo humanistične, družboslovne in naravoslovne vede, poseben poudarek pa je na preučevanju tematik Sredozemlja in zgornjejadranskega območja. Osrednje dejavnosti središča vključujejo temeljno in aplikativno raziskovanje, izobraževanje in izdelavo ekspertiz ter svetovanje. Središče se aktivno vključuje v mednarodno znanstveno sodelovanje in se povezuje s sorodnimi organizacijami po svetu.

Del ZRS Koper je tudi Inštitut za jezikoslovne študije, katerega poslanstvo je slediti dinamikam in vprašanjem na jezikoslovnem in literarnovednem področju s posebno pozornostjo do stičnih prostorov. Inštitut že od ustanovitve izvaja temeljne, aplikativne in razvojne projekte na področju jezikov, kultur in literatur v stiku, medkulturnih študij, družbenega in kontaktnega jezikoslovja, dialektologije, uporabnega jezikoslovja ter didaktike jezikov. Inštitut predstavlja eno od referenčnih točk za medkulturne in medjezikovne raziskave, pri katerih izhajajo iz sodobnih odnosov med posameznikom in družbo ter družbenimi skupinami. Jezikoslovne in literarnovedne raziskave inštituta so usmerjene v prenos znanstvenih rezultatov širši javnosti na nacionalni in mednarodni ravni.

Vsi inštituti ZRS Koper na področju humanistike in družboslovja si v okviru svoje raziskovalne dejavnosti prizadevajo razvijati trajne in javno dostopne podatkovne baze. Delovanje Inštituta za jezikoslovne študije ZRS Koper je že dolgo usmerjeno tudi v razvoj besedilnih korpusov in korpusne raziskave. Poleg prosto dostopnega turističnega korpusa TURK smo izdelali več manjših delovnih korpusov, kot so korpus Cankarjevih besedil in drugi literarni korpusi, korpusi medijskih besedil na temo pandemije, korpus slengovskih besedil na FB. Poleg vključitve obstoječih korpusov v raziskovalno infrastrukturo CLARIN.SI načrtujemo sestavo novih korpusnih zbirk.

Zastopnica: Vesna Mikolič
Namestnica: Tina Čok