Slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije

O repozitoriju CLARIN.SI

Eden izmed osnovnih namenov infrastrukture CLARIN je zagotavljanje zanesljivega arhiviranja in dostopa do jezikovnih virov, kot so korpusi, leksikoni, avdio- in videoposnetki, slovnice, jezikovni modeli itd.

CLARIN.SI vzdržuje repozitorij, v katerem je deponiranih prek 150 jezikovnih virov in orodij oz. približno 200 GB podatkov za 80 jezikov, pri čemer je večinski del namenjen slovenščini, kot tudi hrvaščini in srbščini. Repozitorij vsebuje širok nabor večjih korpusov (tj. urejenih zbirk besedil), primernih za raziskovanje slovenščine, pa tudi več vzporednih in ročno označenih korpusov ter leksikonov in jezikovnih modelov za uporabo v jezikovnih orodjih.

Repozitorij je redno vzdrževan, certificiran po standardih Core Trust Seal in nudi ustvarjanje in prevzem jezikovnih virov v skladu z jasno določenimi tehničnimi in pravnimi standardi: podpira enostavno overjanje in pooblaščanje uporabnikov ter dodeljevanje stalnih spletnih identifikatorjev virom. Viri in orodja so v repozitoriju hranjeni po načelih FAIR in pod izrecnimi pogoji uporabe v skladu z določili izbrane licence. Repozitorij zagotavlja dolgoročno arhiviranje, saj bi celo v primeru popolne prekinitve financiranja centra CLARIN.SI arhivirane vire lahko enostavno prenesli v repozitorije drugih nacionalnih centrov CLARIN, pri čemer bi trajni identifikatorji ostali isti.

Repozitorij CLARIN.SI je vpisan v več katalogov, ki popisujejo repozitorije raziskovalnih podatkov, kot so OpenAIRE in re3data. Evropska raziskovalna infrastruktura CLARIN pa omogoča tudi združeno iskanje po vseh repozitorijih nacionalnih centrov CLARIN prek pregledovalnika VLO.

V repozitorij CLARIN.SI

Za podrobnejše informacij sledite naslednjih povezavam: