Slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije
Common Language Resources and Technology Infrastructure, Slovenia

Storitve

CLARIN.SI poleg repozitorija in spletnih konkordančnikov zagotavlja tudi naslednje storitve.

Samodejno označevanje besedil

CLARIN.SI ponuja dve spletni storitvi za strojno jezikovno označevanje besedil. Novejša storitev je Označevalnik CLASSLA, ki temelji na cevovodu za jezikovno označevanje CLASSLA-Stanza in omogoča jezikovno označevanje standardne bolgarščine, hrvaščine, makedonščine, slovenščine in srbščine, ter nestandardne (pogovorne) hrvaščine, slovenščine in srbščine. Označevalnik pripiše besedilu informacije o lemah, oblikoskladenjskih oznakah, skladnji, imenskih entitetah in pri nekaterih jezikih podpira tudi označevanje udeleženskih vlog. Za več podrobnosti si oglejte opis spletnega vmesnika za označevanje.

Starejša storitev za označevanje besedil je ReLDIanno, ki omogoča obdelavo treh južnoslovanskih jezikov: slovenskega, hrvaškega in srbskega. Na voljo sta dva osnovna načina uporabe storitve ReLDIanno: prek spletne storitve ali prek knjižnice Python. Več o tej storitvi si lahko preberete na strani središča znanja CLASSLA.

Ročno označevanje besedil

CLARIN.SI gosti orodje za ročno označevanje korpusov na spletu WebAnno. Če želite izvedeti več o orodju WebAnno, obiščite domačo stran projekta. Če želite ustvariti račun na WebAnno@CLARIN.SI, nam na info@clarin.si pošljite e-poštno sporočilo, v katerem pojasnite, kdo ste in zakaj potrebujete dostop.

Hranjenje in sodelovalni razvoj

CLARIN.SI ima na platformi GitHub svojo virtualno organizacijo CLARINSI, ki gosti številne projekte v zvezi z jezikovnimi viri in tehnologijami, kot so oblikoskladenjski označevalniki in označevalniki imenskih entitet, besedni normalizatorji, standardi za jezikoslovne zapise in konverzije med jezikovnimi formalizmi.

CLARIN.SI tudi gosti strežnik GitLab, ki nudi platformo razvijalcem jezikovnih orodij in virov. Njegova prednost v primerjavi s platformo GitHub je, da omogoča brezplačno ustvarjanje zasebnih projektov, poleg tega pa se skrbništvo za programe ne prenese na podjetja v ZDA. Če želite ustvariti račun na GitLab@CLARIN.SI, nam na info@clarin.si pošljite e-poštno sporočilo, v katerem pojasnite, kdo ste in zakaj potrebujete dostop.

Poenostavljanje in analiza besedil

CLARIN.SI prek partnerja CJVT UL gosti storitev za poenostavljanje in analizo slovenskih besedil SENTA. Posebna pozornost pri izdelavi orodja je bila posvečena dostopnosti za uporabnike s posebnimi potrebami. Če želite preizkusiti orodje SENTA in izvedeti kaj več o njem, obiščite stran storitve.

Povzemanje korpusnih podatkov

CLARIN.SI prek partnerja CJVT UL gosti storitev za povzemanje korpusnih podatkov Korpusnik, ki na uporabniku prijazen način prikaže statistične in besedilne podatke iz petih korpusov slovenskega jezika. Posebna pozornost pri izdelavi orodja je bila posvečena dostopnosti za uporabnike s posebnimi potrebami. Več o Korpusniku si lahko preberete na spletni strani orodja.

Prenos znanja

CLARIN.SI podpira snemanje in arhiviranje predavanj JOTA, ki jih organizira Slovensko društvo za jezikovne tehnologije in so dostopna na portalu VideoLectures. Na portalu VideoLectures so na voljo tudi posnetki nekaterih drugih dogodkov v povezavi z infrastrukturo CLARIN.