Files in this item

 Download all files in item (1.38 MB)
Icon
Name
frequency-list-from-textbook-corpus-diachronic.txt
Size
1.38 MB
Format
Text file
Description
Frequency list in text format
MD5
9fac168c226aee97d6e1e0251f528c5a
 Download file  Preview
 File Preview  
Lema	Lema (male črke)	Besedna vrsta	Skupna absolutna pogostost leme	Skupna relativna pogostost (na milijon pojavitev)	Absolutna pogostost (1. razred)	Relativna pogostost (1. razred)	Absolutna pogostost (2. razred)	Relativna pogostost (2. razred)	Absolutna pogostost (3. razred)	Relativna pogostost (3. razred)	Absolutna pogostost (4. razred)	Relativna pogostost (4. razred)	Absolutna pogostost (5. razred)	Relativna pogostost (5. razred)	Absolutna pogostost (6. razred)	Relativna pogostost (6. razred)	Absolutna pogostost (7. razred)	Relativna pogostost (7. razred)	Absolutna pogostost (8. razred)	Relativna pogostost (8. razred)	Absolutna pogostost (9. razred)	Relativna pogostost (9. razred)	Absolutna pogostost (1. letnik)	Relativna pogostost (1. letnik)	Absolutna pogostost (2. letnik)	Relativna pogostost (2. letnik)	Absolutna pogostost (3. letnik)	Relativna pogostost (3. letnik)	Absolutna pogostost (4. letnik)	Relativna pogostost (4. letnik)	Absolutna pogostost (1.-4. letnik)	Relativna pogos . . .
                                            
Icon
Name
README.txt
Size
1.84 KB
Format
Text file
Description
README file
MD5
8df9248e571f9ce83993f73ca8175d94
 Download file  Preview
 File Preview  
***************

SLO: Podatkovni niz vsebuje seznam 11.906 besed (s podatkom o besedni vrsti) in njihove pogostosti v učbeniškem korpusu, ki vsebuje učbenike iz osnovne šole (od 1. do 9. razreda) in srednje šole (od 1. do 4. letnika).
ENG: The dataset contains a list of 11906 words (lemmas with part of speech information) and their frequency of occurrence in a corpus of Slovenian textbooks, covering elementary school (Grade 1 to 9) and secondary school (Year 1 to 4).

Kosem, Iztok; Pori, Eva; Arhar Holdt, Špela, 2023, Frequency list of textbook vocabulary by level of education in elementary and secondary schools, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1719.

***************

"Lema": SLO: Lema besede iz učbeniškega korpusa. ENG: Lemma of the word from the textbook corpus.

"Lema (male črke)": SLO: Lema besede z malimi črkami. ENG: Lemma of the word in lower case.

"Besedna vrsta": SLO: Podatek o besedni vrsti besede (po . . .