• Repozitorij
  • O repozitoriju
  • Kontakt
  • CLARIN
  •  Prijava
  • English Slovenščina
  • Repozitorij CLARIN.SI
  • Iskanje
  • CLARIN logo
  •   Brskanje  
    •    Celoten repozitorij  
      •   Datum izdaje
      •   Avtor
      •   Naslov
      •   Ključne besede
      •   Izdajatelj
      •   Jezik
      •   Vrsta
      •   Oznaka pravic
  •   Moj račun  
    •    Prijava
  •   Splošne informacije  
    •    O vnosu v repozitorij
    •    Citiranje
    •    Življenjski ciklus vnosa
    •    Pogosta vprašanja
    •    O repozitoriju
    •    Pomoč uporabnikom
 

 
Izbrani filtri
 Ključna beseda : tokenisation     Počisti vse
Napredno iskanje

Filtri

Uporabite filtre za omejitev rezultatov iskanja.

Trenutni filtri:
Novi filtri:

Omejite svoje iskanje

Avtor  
    • Erjavec, Tomaž (17)
    • Dobrovoljc, Kaja (12)
    • Ljubešić, Nikola (10)
    • Arhar Holdt, Špela (9)
    • Čibej, Jaka (8)
    • Batanović, Vuk (7)
    • Samardžić, Tanja (7)
    • Krsnik, Luka (6)
    • Terčon, Luka (6)
    • Zupan, Katja (6)
    • Fišer, Darja (5)
    • Gantar, Polona (4)
    • Holz, Nanika (4)
    • Jezeršek, Lucija (4)
    • Kavčič, Teja (4)
    • Krek, Simon (4)
    • Kuzman, Taja (4)
    • Ledinek, Nina (4)
    • Marko, Dafne (4)
    • Miličević, Maja (4)
    • ... poglejte več
Ključna beseda  
    • part-of-speech tagging (20)
    • manual annotation (18)
    • TEI (16)
    • named entities (15)
    • parsing (14)
    • lemmatisation (13)
    • computer-mediated communication (9)
    • dependency treebank (9)
    • word normalisation (8)
    • feature prediction (6)
    • language model (6)
    • semantic role labelling (6)
    • sentence segmentation (6)
    • CONLL-U (4)
    • corpus annotation (4)
    • dependency parsing (4)
    • verbal multiword expressions (4)
    • coreference resolution (2)
    • abbreviations (1)
    • ... poglejte več
Jezik (ISO)  
    • Slovenian (16)
    • Croatian (4)
    • Serbian (4)
Vrsta  
    • corpus (18)
    • text (18)
    • toolService (6)

Prikazovanje 1–10 od 24 zadetkov

  • 1
  • 2
  • 3
  •  
  •    
    • Razvrsti vnose po
    •  Ustreznost
    • Naslov (naraščajoče)
    • Naslov (padajoče)
    • Datum izdaje (naraščajoče)
    • Datum izdaje (padajoče)
    •  
    • Rezultati/stran
    • 5
    •  10
    • 20
    • 40
    • 60
    • 80
    • 100

  • corpus
    CLARIN.SI data & tools
    corpus
    CMC training corpus Janes-Tag 3.0
    (Jožef Stefan Institute / 2022-12-06)
    
    Avtorji:
    Lenardič, Jakob ; et al.prikaži vse Lenardič, Jakob ; Čibej, Jaka ; Arhar Holdt, Špela ; Erjavec, Tomaž ; Fišer, Darja ; Ljubešić, Nikola ; Zupan, Katja ; Dobrovoljc, Kaja
     Ta vnos vsebuje 2 datotek(e) (8.63 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • corpus
    CLARIN.SI data & tools
    corpus
    CMC training corpus Janes-Norm 3.0
    (Jožef Stefan Institute / 2022-12-06)
    
    Avtorji:
    Lenardič, Jakob ; Čibej, Jaka ; Arhar Holdt, Špela ; Erjavec, Tomaž and Fišer, Darja
     Ta vnos vsebuje 2 datotek(e) (12.16 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • corpus
    CLARIN.SI data & tools
    corpus
    Training corpus SUK 1.1
    (Centre for Language Resources and Technologies, University of Ljubljana / 2024-08-22)
    
    Avtorji:
    Arhar Holdt, Špela ; et al.prikaži vse Arhar Holdt, Špela ; Krek, Simon ; Dobrovoljc, Kaja ; Erjavec, Tomaž ; Gantar, Polona ; Čibej, Jaka ; Pori, Eva ; Terčon, Luka ; Munda, Tina ; Žitnik, Slavko ; Robida, Nejc ; Blagus, Neli ; Može, Sara ; Ledinek, Nina ; Holz, Nanika ; Zupan, Katja ; Kuzman, Taja ; Kavčič, Teja ; Škrjanec, Iza ; Marko, Dafne ; Jezeršek, Lucija ; Zajc, Anja
     Ta vnos vsebuje 2 datotek(e) (45.1 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • toolService
    CLARIN.SI data & tools
    toolService
    The Trankit model for linguistic process of standard written Slovenian 1.1
    (Centre for Language Resources and Technologies, University of Ljubljana / 2024-08-29)
    
    Avtorji:
    Krsnik, Luka ; Dobrovoljc, Kaja and Terčon, Luka
     Ta vnos vsebuje 1 datoteko (143.34 MB).
     
    Publicly Available

  • corpus
    CLARIN.SI data & tools
    corpus
    Croatian linguistic training corpus hr500k 2.0
    (Jožef Stefan Institute / 2023-04-13)
    
    Avtorji:
    Ljubešić, Nikola and Samardžić, Tanja
     Ta vnos vsebuje 7 datotek(e) (49.59 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • corpus
    CLARIN.SI data & tools
    corpus
    Croatian Twitter training corpus ReLDI-NormTagNER-hr 3.0
    (Jožef Stefan Institute / 2023-04-07)
    
    Avtorji:
    Ljubešić, Nikola ; Erjavec, Tomaž ; Batanović, Vuk ; Miličević, Maja and Samardžić, Tanja
     Ta vnos vsebuje 4 datotek(e) (8.54 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • corpus
    CLARIN.SI data & tools
    corpus
    Serbian linguistic training corpus SETimes.SR 2.0
    (Regional Linguistic Data Initiative Centre ReLDI; Jožef Stefan Institute / 2023-06-13)
    
    Avtorji:
    Batanović, Vuk ; Ljubešić, Nikola ; Samardžić, Tanja and Erjavec, Tomaž
     Ta vnos vsebuje 4 datotek(e) (9.4 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • toolService
    CLARIN.SI data & tools
    toolService
    The Trankit model for linguistic processing of written and spoken Slovenian 1.2
    (Centre for Language Resources and Technologies, University of Ljubljana / 2024-12-06)
    
    Avtorji:
    Krsnik, Luka ; Dobrovoljc, Kaja and Terčon, Luka
     Ta vnos vsebuje 1 datoteko (145.51 MB).
     
    Publicly Available

  • toolService
    CLARIN.SI data & tools
    toolService
    Trankit model for SST 2.15 1.1
    (Centre for Language Resources and Technologies, University of Ljubljana / 2024-12-06)
    
    Avtorji:
    Krsnik, Luka ; Dobrovoljc, Kaja and Terčon, Luka
     Ta vnos vsebuje 1 datoteko (138.81 MB).
     
    Publicly Available

  • corpus
    CLARIN.SI data & tools
    corpus
    Serbian Twitter training corpus ReLDI-NormTagNER-sr 3.0
    (Jožef Stefan Institute / 2023-04-07)
    
    Avtorji:
    Ljubešić, Nikola ; Erjavec, Tomaž ; Batanović, Vuk ; Miličević, Maja and Samardžić, Tanja
     Ta vnos vsebuje 4 datotek(e) (8.81 MB).
     
    Publicly Available Distributed under Creative Commons Attribution Required Share Alike

  • 1
  • 2
  • 3
  •  
  •    
    • Razvrsti vnose po
    •  Ustreznost
    • Naslov (naraščajoče)
    • Naslov (padajoče)
    • Datum izdaje (naraščajoče)
    • Datum izdaje (padajoče)
    •  
    • Rezultati/stran
    • 5
    •  10
    • 20
    • 40
    • 60
    • 80
    • 100
 

Partnerji

  • Alpineon, d.o.o.
  • Amebis, d.o.o.
  • Inštitut za novejšo zgodovino
  • Institut "Jožef Stefan"
  • Narodna in univerzitetna knjižnica Slovenije
  • Slovensko društvo za jezikovne tehnologije

Partnerji

  • Univerza v Ljubljani
  • Univerza v Mariboru
  • Univerza v Novi Gorici
  • Univerza na Primorskem
  • ZRC SAZU
  • ZRS Koper

Repozitorij

  • Domača stran
  • Kontakt
  • Življenski ciklus vnosa
  • Pogosta vprašanja
  • O repozitoriju in pravilih uporabe

Repozitorij uporablja programsko opremo, ki je bila razvita za LINDAT/CLARIAH-CZ jezikoslovni repozitorij in je dostopna na GitHubu.

CLARIN.SI podpira Ministrstvo za izobraževanje, znanost in šport
v okviru programa "Raziskovalne infrastrukture".