Slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije
Common Language Resources and Technology Infrastructure, Slovenia

O repozitoriju CLARIN.SI

Eden izmed osnovnih namenov infrastrukture CLARIN je zagotavljanje zanesljivega arhiviranja in dostopa do jezikovnih virov, kot so korpusi, leksikoni, avdio- in videoposnetki, slovnice, jezikovni modeli itd.

CLARIN.SI vzdržuje certificiran repozitorij, v katerem je trenutno deponiranih prek 200 jezikovnih virov in orodij oz. približno 200 GB podatkov za 80 jezikov, pri čemer je večinski del namenjen slovenščini, ki ji sledita hrvaščina in srbščina. Repozitorij vsebuje širok nabor večjih korpusov (tj. urejenih zbirk besedil), primernih za raziskovanje slovenščine, pa tudi več vzporednih in ročno označenih korpusov ter leksikonov in jezikovnih modelov za uporabo v jezikovnih orodjih.

Repozitorij je redno vzdrževan, certificiran po standardih Core Trust Seal in nudi deponiranje in prevzem jezikovnih virov v skladu z jasno določenimi tehničnimi in pravnimi standardi. Podpira enostavno overjanje in pooblaščanje uporabnikov ter dodeljevanje stalnih spletnih identifikatorjev virom. Viri in orodja so v repozitoriju hranjeni po načelih FAIR in pod izrecnimi pogoji uporabe v skladu z določili izbrane licence. Repozitorij zagotavlja dolgoročno arhiviranje, saj bi celo v primeru popolne prekinitve financiranja centra CLARIN.SI arhivirane vire lahko enostavno prenesli v repozitorije drugih nacionalnih centrov CLARIN, pri čemer bi trajni identifikatorji ostali isti.

Repozitorij CLARIN.SI je vpisan v več katalogov, ki popisujejo repozitorije raziskovalnih podatkov, kot so OpenAIRE in re3data. Evropska raziskovalna infrastruktura CLARIN pa omogoča tudi združeno iskanje po vseh repozitorijih centrov CLARIN prek pregledovalnika VLO.

V repozitorij CLARIN.SI

Za podrobnejše informacij sledite naslednjih povezavam: