Datoteke v tem vnosu

 Prenesi vse datoteke v vnosu (1.38 MB)
Icon
Ime
frequency-list-from-textbook-corpus-diachronic.txt
Velikost
1.38 MB
Format
Besedilna datoteka
Opis
Frequency list in text format
MD5
9fac168c226aee97d6e1e0251f528c5a
 Prenesi datoteko  Predogled
 Predogled datoteke  
Lema	Lema (male črke)	Besedna vrsta	Skupna absolutna pogostost leme	Skupna relativna pogostost (na milijon pojavitev)	Absolutna pogostost (1. razred)	Relativna pogostost (1. razred)	Absolutna pogostost (2. razred)	Relativna pogostost (2. razred)	Absolutna pogostost (3. razred)	Relativna pogostost (3. razred)	Absolutna pogostost (4. razred)	Relativna pogostost (4. razred)	Absolutna pogostost (5. razred)	Relativna pogostost (5. razred)	Absolutna pogostost (6. razred)	Relativna pogostost (6. razred)	Absolutna pogostost (7. razred)	Relativna pogostost (7. razred)	Absolutna pogostost (8. razred)	Relativna pogostost (8. razred)	Absolutna pogostost (9. razred)	Relativna pogostost (9. razred)	Absolutna pogostost (1. letnik)	Relativna pogostost (1. letnik)	Absolutna pogostost (2. letnik)	Relativna pogostost (2. letnik)	Absolutna pogostost (3. letnik)	Relativna pogostost (3. letnik)	Absolutna pogostost (4. letnik)	Relativna pogostost (4. letnik)	Absolutna pogostost (1.-4. letnik)	Relativna pogos . . .
                                            
Icon
Ime
README.txt
Velikost
1.84 KB
Format
Besedilna datoteka
Opis
README file
MD5
8df9248e571f9ce83993f73ca8175d94
 Prenesi datoteko  Predogled
 Predogled datoteke  
***************

SLO: Podatkovni niz vsebuje seznam 11.906 besed (s podatkom o besedni vrsti) in njihove pogostosti v učbeniškem korpusu, ki vsebuje učbenike iz osnovne šole (od 1. do 9. razreda) in srednje šole (od 1. do 4. letnika).
ENG: The dataset contains a list of 11906 words (lemmas with part of speech information) and their frequency of occurrence in a corpus of Slovenian textbooks, covering elementary school (Grade 1 to 9) and secondary school (Year 1 to 4).

Kosem, Iztok; Pori, Eva; Arhar Holdt, Špela, 2023, Frequency list of textbook vocabulary by level of education in elementary and secondary schools, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1719.

***************

"Lema": SLO: Lema besede iz učbeniškega korpusa. ENG: Lemma of the word from the textbook corpus.

"Lema (male črke)": SLO: Lema besede z malimi črkami. ENG: Lemma of the word in lower case.

"Besedna vrsta": SLO: Podatek o besedni vrsti besede (po . . .