Datoteke v tem vnosu

 Prenesi vse datoteke v vnosu (15.45 MB)
Icon
Ime
Frequency-list-of-language-problems-from-Solar-3.0.tsv
Velikost
14.61 MB
Format
Neznano
Opis
Dataset in TSV
MD5
f19b3e606d0715bb2d8685d97ef9a973
 Prenesi datoteko
Icon
Ime
README.txt
Velikost
2.22 KB
Format
Besedilna datoteka
Opis
Information on the dataset in TXT
MD5
8b226231bd3d27fa83c8579a52155f34
 Prenesi datoteko  Predogled
 Predogled datoteke  
***************

SLO: Podatkovni niz vsebuje povedi z jezikovnimi napakami in popravljene povedi, kakor tudi dodatne informacije o značilnostih izvornega besedila. Za več informacij gl. vnos korpusa Šolar 3.0 na repozitoriju in priložene označevalne smernice.
ENG: The dataset comprises sentences with language errors and corresponding corrected sentences, together with additional information on the text features. Please refer to the original corpus dataset and the annotaion guidelines for detailed information.

Arhar Holdt, Špela; et al., 2022, Developmental corpus Šolar 3.0, Slovenian language resource repository CLARIN.SI, ISSN 2820-4042, http://hdl.handle.net/11356/1589.

***************

"ID_besedila_s": SLO: ID izvornega besedila v korpusu Šolar 3.0. ENG: An ID of the source text in the Šolar 3.0 corpus.

"ID_odstavka_s": SLO: ID izvornega odstavka v korpusu Šolar 3.0. ENG: An ID of the source paragraph in the Šolar 3.0 corpus.

"ID_stavka_s": SLO: ID izvorne povedi v korpusu Šolar . . .
                                            
Icon
Ime
Smernice-za-oznacevanje-korpusa-Solar_V1.1.pdf
Velikost
856.9 KB
Format
PDF
Opis
Error annotation guidelines (in Slovenian)
MD5
c8b8b68fd1be51e1edadb7dd249b3ab4
 Prenesi datoteko