Janes Tag (ročno označen)
This action may take several minutes for large corpora, please wait.

Janes Tag (ročno označen)

Besedila družbenih omrežij z ročno normaliziranimi (standardiziranimi), oblikoskladenjsko označenimi in lematiziranimi besedami in imenskimi entitetami Janes Tag v2.0 // User generated texts with manualy normalised (standardised), morphosyntactically tagged and lemmatised words and named entities Janes Tag v2.0

Counts
Tokens75276
Words59053
Sentences7784
Documents2958
General info
Corpus description Document
LanguageSlovenian
EncodingUTF-8
Compiled11/03/2017 12:29:07
Tagset Description
Lexicon sizes
word20082
norm17418
lempos13106
tag_en960
tag960
diff5
lc 18818
lemma12613
lemma_lc12249
Tags legend
samostalnikS.*
glagolG.*
pridevnikP.*
prislovR.*
zaimekZ.*
predlogD.*
veznikV.*
členekL.*
medmetM.*
števnikK.*
okrajšavaO.*
neuvrščenoN.*
ločiloU.*
Lempos suffixes
samostalnik-s
glagol-g
pridevnik-p
prislov-r
zaimek-z
predlog-d
veznik-v
členek-l
medmet-m
števnik-k
okrajšava-o
neuvrščeno-n
ločilo-u

Structures and attributes