This action may take several minutes for large corpora, please wait.
DSI (informatika)
Korpus informatike, ki vključuje zbornik 'Dnevi slovenske informatike' (2003-2016), zbornik 'Informatika v javni upravi' (2015-2016) in revijo 'Uporabna informatika' (2010-2016) // Corpus of informatics containing the Proceedings 'Dnevi slovenske informatike' (2003-2016) and 'Informatika v javni upravi' (2015-2016), and the journal 'Uporabna informatika' (2010-2016)
Counts |
Tokens | 5000708 |
Words | 4139220 |
Sentences | 247760 |
Paragraphs | 111888 |
Documents | 1723 |
General info |
Corpus description |
Document |
Language | Slovenian |
Encoding | UTF-8 |
Compiled | 10/28/2017 18:26:53 |
Tagset |
Description |
Lexicon sizes |
word | 162721 |
norm | 133873 |
lempos | 100530 |
tag_en | 998 |
tag | 998 |
lc
| 133872 |
lemma | 91791 |
lemma_lc | 79853 |
Tags legend |
samostalnik | S.* |
glagol | G.* |
pridevnik | P.* |
prislov | R.* |
zaimek | Z.* |
predlog | D.* |
veznik | V.* |
členek | L.* |
medmet | M.* |
števnik | K.* |
okrajšava | O.* |
neuvrščeno | N.* |
ločilo | U.* |
Lempos suffixes |
samostalnik | -s |
glagol | -g |
pridevnik | -p |
prislov | -r |
zaimek | -z |
predlog | -d |
veznik | -v |
členek | -l |
medmet | -m |
števnik | -k |
okrajšava | -o |
neuvrščeno | -n |
ločilo | -u |
Structures and attributes