ssj500k v2.1
This action may take several minutes for large corpora, please wait.

ssj500k v2.1

Ročno označeni korpus ssj500k v2.1 (oblikoskladnja, skladnja, imenske entitete, glagolske večbesedne enote, udeleženske vloge) // Slovene manually annotated corpus ssj500k v2.0 (morphosyntax, syntax, named entities, verbal multiword expressions, semantic roles)

Counts
Tokens586248
Words492385
Sentences27829
Paragraphs8137
Documents1655
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled06/12/2018 07:58:57
Tagset Description
Lexicon sizes
word
lempos
tag_en
tag
id
dep_en
dep
dep_head_lemma
dep_head_tag_en
dep_head_tag
dep_head_id
mwe_type
mwe_words
mwe_lemmas
lc
norm
lemma
lemma_lc
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u