Obvestilo o prekinitvi delovanja CLARIN.SI storitev
Zaradi načrtovanega vzdrževanja bodo storitve CLARIN.SI v petek, 26. septembra 2025, začasno nedostopne, in sicer predvidoma med 13.00 in 21.00.
Hvala za vaše razumevanje in potrpežljivost.
![]() |
Slovenska raziskovalna infrastruktura za jezikovne vire in tehnologije Common Language Resources and Technology Infrastructure, Slovenia |
---|
Kategorija, povezana z Themify widgetom, ki prikazuje obvestila na desni strani (sidebar) spletne strani.
Zaradi načrtovanega vzdrževanja bodo storitve CLARIN.SI v petek, 26. septembra 2025, začasno nedostopne, in sicer predvidoma med 13.00 in 21.00.
Hvala za vaše razumevanje in potrpežljivost.
Z veseljem sporočamo, da je bila v preteklem tednu uspešno zaključena konferenca SyntaxFest 2025, ki je tudi s podporo CLARIN.SI od 26. do 29. avgusta na Pravni fakulteti v Ljubljani gostila kar 135 udeležencev iz 34 držav. V okviru konference in številnih spremljevalnih dogodkov je bilo predstavljenih več kot 80 znanstvenih prispevkov s področja s skladnjo povezanih jezikovnih virov, tehnologij in raziskav.
V okviru konference so bili predstavljeni tudi viri in storitve, ki domujejo na CLARIN.SI, med njimi STARK, ComparaTree, ELEXIS-WSD, Šolar, Učbeniki, SUK/ROG.
Utrinke s konference in raziskave si lahko ogledate na spletni strani konference.
Z veseljem sporočamo, da je izšla nova različica korpusov ParlaMint 5.0, ki so na voljo za prenos v treh oblikah: večjezični primerljivi korpusi parlamentarnih razprav ParlaMint 5.0, korpusi z jezikoslovnimi oznakami in s strojnim prevodom v angleščino. Korpusi so vključeni tudi v konkordančnik CLARIN.SI noSketch Engine.
V primerjavi s prejšnjo različico, različica 5.0 prinaša dodatne informacije o avtomatsko izračunani temi vsakega govora po modelu CAP (Comparative Agendas Project) ter oceno sentimenta na ravni stavkov za vse korpuse, poleg tega pa odpravlja tudi nekatere napake v posameznih korpusih.
Vljudno vabljeni k udeležbi na mednarodnem simpoziju SyntaxFest 2025, v okviru katerega se bo od 26. do 29. avgusta 2025 v Ljubljani odvilo pet konferenc s področja empirične skladnje in računalniške obdelave jezika (IWPT, UDW, TLT, DepLing, QUASY) in dve delavnici evropske mreže COST UniDive.
Rok za zgodnje prijave je 15. julij 2025.
Na UL FRI je začel delovati Center odličnosti za umetno inteligenco v digitalni humanistiki, ki bo raziskovalcem s področja humanistike in družboslovja omogočal dostop in podporo pri uporabi računalniške infrastrukture, naprednih modelov umetne inteligence, orodij in podatkovnih zbirk ter različnih izobraževalnih aktivnosti.
Del izobraževalnih aktivnosti bodo tudi mikrodokazila – krajša usposabljanja, za katera udeleženci pridobijo 1 do 2 kreditni točki (ECTS). Za oblikovanje uporabne ponudbe mikrodokazil vas vabimo k izpolnitvi kratke ankete.
Vljudno vas vabimo na predavanje JOTA, na katerem bosta Timotej Knez (UL FRI) in izr. prof. dr. Slavko Žitnik (UL FRI) predstavila aktivnosti za prilagoditve slovenskega jeziovnega modela, ki bo zares poznal slovenščino. Predavanje bo v četrtek, 12. junija 2025 ob 16:00 na UL FRI (Večna pot 113, Ljubljana) v predavalnici P21.
Več o predavanju si lahko preberete v nadaljevanju.
V okviru članstva v središču znanja LLMs4SSH smo objavili pregled aktualnih raziskovalnih dejavnosti na področju velikih jezikovnih modelov (VJM) v Sloveniji.
V pregledu so zbrane ključne informacije o pomembnih projektih, povezanih z velikimi jezikovnimi modeli, obstoječih ogrodjih za evalvacijo VJM v slovenščini, ogrodjih za evalvacijo in zbirkah besedil našega središča znanja CLASSLA za vrednotenje VJM v južnoslovanskih in drugih jezikih in odprto dostopnih velikih jezikovnih modelih in drugih jezikovnih tehnologijah za slovenščino.
Z veseljem sporočamo, da je repozitorij CLARIN.SI uspešno ponovno pridobil certifikat CoreTrustSeal, kar potrjuje njegov status zaupanja vrednega repozitorija podatkov in skladnost z mednarodnimi standardi za upravljanje raziskovalnih podatkov.
Več informacij lahko najdete na naslednji povezavi.
V zadnjih tednih se pojavljajo težave z dostopom do portala CLARIN.SI. Povzroča jih agresivno zbiranje podatkov s strani večjih AI podjetij, ki masovno prenašajo vse vsebine na domeni www.clarin.si, pri tem pa ignorirajo naše nastavitve v datoteki robots.txt, ki takšno zbiranje izrecno prepovedujejo. To zbiranje vključuje tudi naše storitve (npr. konkordančnike), kjer obdelava vsake zahteve traja nekaj časa. Ker takšne zahteve prihajajo večkrat na sekundo, celotna infrastruktura postane preobremenjena in neodzivna, podobno kot pri napadih vrste DDoS.
Pri CLARIN.SI sicer aktivno blokiramo njihove IP-naslove, vendar se neprestano pojavljajo novi. Z različnimi ukrepi se trudimo omiliti težave, a bo reševanje žal trajalo še nekaj časa.
Zahvaljujemo se vam za razumevanje in se iskreno opravičujemo za nevšečnosti!
Ekipa CLARIN.SI
Delavnice CLASSLA-Express so nazaj!
Z veseljem napovedujemo novo izvedbo delavnic CLASSLA-Express, v katerih bomo raziskovali spletne korpuse za južnoslovanske jezike CLASSLA-web s pomočjo orodij CLARIN.SI in velikih jezikovnih modelov.
Delavnice so brezplačne, namenjene pa so predvsem jezikoslovcem ter raziskovalcem s področja digitalne humanistike.
Več informacij najdete na spletni strani CLASSLA-Express, celotni prispevek pa si lahko preberete v nadaljevanju.