corpus
Author(s):
Erjavec, Tomaž
; et al.show everyone
Erjavec, Tomaž
;
Kopp, Matyáš
;
Ogrodniczuk, Maciej
;
Osenova, Petya
;
Agirrezabal, Manex
;
Agnoloni, Tommaso
;
Aires, José
;
Albini, Monica
;
Alkorta, Jon
;
Antiba-Cartazo, Iván
;
Arrieta, Ekain
;
Barcala, Mario
;
Bardanca, Daniel
;
Barkarson, Starkaður
;
Bartolini, Roberto
;
Battistoni, Roberto
;
Bel, Nuria
;
Bonet Ramos, Maria del Mar
;
Calzada Pérez, María
;
Cardoso, Aida
;
Çöltekin, Çağrı
;
Coole, Matthew
;
Darģis, Roberts
;
de Libano, Ruben
;
Depoorter, Griet
;
Diwersy, Sascha
;
Dodé, Réka
;
Fernandez, Kike
;
Fernández Rei, Elisa
;
Frontini, Francesca
;
Garcia, Marcos
;
García Díaz, Noelia
;
García Louzao, Pedro
;
Gavriilidou, Maria
;
Gkoumas, Dimitris
;
Grigorov, Ilko
;
Grigorova, Vladislava
;
Haltrup Hansen, Dorte
;
Iruskieta, Mikel
;
Jarlbrink, Johan
;
Jelencsik-Mátyus, Kinga
;
Jongejan, Bart
;
Kahusk, Neeme
;
Kirnbauer, Martin
;
Kryvenko, Anna
;
Ligeti-Nagy, Noémi
;
Ljubešić, Nikola
;
Luxardo, Giancarlo
;
Magariños, Carmen
;
Magnusson, Måns
;
Marchetti, Carlo
;
Marx, Maarten
;
Meden, Katja
;
Mendes, Amália
;
Mochtak, Michal
;
Mölder, Martin
;
Montemagni, Simonetta
;
Navarretta, Costanza
;
Nitoń, Bartłomiej
;
Norén, Fredrik Mohammadi
;
Nwadukwe, Amanda
;
Ojsteršek, Mihael
;
Pančur, Andrej
;
Papavassiliou, Vassilis
;
Pereira, Rui
;
Pérez Lago, María
;
Piperidis, Stelios
;
Pirker, Hannes
;
Pisani, Marilina
;
Pol, Henk van der
;
Prokopidis, Prokopis
;
Quochi, Valeria
;
Rayson, Paul
;
Regueira, Xosé Luís
;
Rii, Andriana
;
Rudolf, Michał
;
Ruisi, Manuela
;
Rupnik, Peter
;
Schopper, Daniel
;
Simov, Kiril
;
Sinikallio, Laura
;
Skubic, Jure
;
Tungland, Lars Magne
;
Tuominen, Jouni
;
van Heusden, Ruben
;
Varga, Zsófia
;
Vázquez Abuín, Marta
;
Venturi, Giulia
;
Vidal Miguéns, Adrián
;
Vider, Kadri
;
Vivel Couso, Ainhoa
;
Vladu, Adina Ioana
;
Wissik, Tanja
;
Yrjänäinen, Väinö
;
Zevallos, Rodolfo
;
Fišer, Darja
Description:
ParlaMint 4.1 is a set of comparable corpora containing transcriptions of parliamentary debates of 29 European countries and autonomous regions, mostly starting in 2015 and extending to mid-2022. The individual corpora ...
This item contains 30 files (5.87
GB).
Publicly Available
corpus
Description:
The hr500k training corpus contains about 500,000 tokens manually annotated on the levels of tokenisation, sentence segmentation, morphosyntactic tagging, lemmatisation and named entities. About half of the corpus is also ...
This item contains 3 files (91.53
MB).
corpus
Author(s):
Erjavec, Tomaž
; et al.show everyone
Erjavec, Tomaž
;
Kopp, Matyáš
;
Ogrodniczuk, Maciej
;
Osenova, Petya
;
Agerri, Rodrigo
;
Agirrezabal, Manex
;
Agnoloni, Tommaso
;
Aires, José
;
Albini, Monica
;
Alkorta, Jon
;
Antiba-Cartazo, Iván
;
Arrieta, Ekain
;
Barcala, Mario
;
Bardanca, Daniel
;
Barkarson, Starkaður
;
Bartolini, Roberto
;
Battistoni, Roberto
;
Bel, Nuria
;
Bonet Ramos, Maria del Mar
;
Calzada Pérez, María
;
Cardoso, Aida
;
Çöltekin, Çağrı
;
Coole, Matthew
;
Darģis, Roberts
;
de Does, Jesse
;
de Libano, Ruben
;
Depoorter, Griet
;
Depuydt, Katrien
;
Diwersy, Sascha
;
Dodé, Réka
;
Fernandez, Kike
;
Fernández Rei, Elisa
;
Frontini, Francesca
;
Garcia, Marcos
;
García Díaz, Noelia
;
García Louzao, Pedro
;
Gavriilidou, Maria
;
Gkoumas, Dimitris
;
Grigorov, Ilko
;
Grigorova, Vladislava
;
Haltrup Hansen, Dorte
;
Iruskieta, Mikel
;
Jarlbrink, Johan
;
Jelencsik-Mátyus, Kinga
;
Jongejan, Bart
;
Kahusk, Neeme
;
Kirnbauer, Martin
;
Kryvenko, Anna
;
Ligeti-Nagy, Noémi
;
Ljubešić, Nikola
;
Luxardo, Giancarlo
;
Magariños, Carmen
;
Magnusson, Måns
;
Marchetti, Carlo
;
Marx, Maarten
;
Meden, Katja
;
Mendes, Amália
;
Mochtak, Michal
;
Mölder, Martin
;
Montemagni, Simonetta
;
Navarretta, Costanza
;
Nitoń, Bartłomiej
;
Norén, Fredrik Mohammadi
;
Nwadukwe, Amanda
;
Ojsteršek, Mihael
;
Pančur, Andrej
;
Papavassiliou, Vassilis
;
Pereira, Rui
;
Pérez Lago, María
;
Piperidis, Stelios
;
Pirker, Hannes
;
Pisani, Marilina
;
Pol, Henk van der
;
Prokopidis, Prokopis
;
Quochi, Valeria
;
Rayson, Paul
;
Regueira, Xosé Luís
;
Rii, Andriana
;
Rudolf, Michał
;
Ruisi, Manuela
;
Rupnik, Peter
;
Schopper, Daniel
;
Simov, Kiril
;
Sinikallio, Laura
;
Skubic, Jure
;
Tamper, Minna
;
Tungland, Lars Magne
;
Tuominen, Jouni
;
van Heusden, Ruben
;
Varga, Zsófia
;
Vázquez Abuín, Marta
;
Venturi, Giulia
;
Vidal Miguéns, Adrián
;
Vider, Kadri
;
Vivel Couso, Ainhoa
;
Vladu, Adina Ioana
;
Wissik, Tanja
;
Yrjänäinen, Väinö
;
Zevallos, Rodolfo
;
Fišer, Darja
Description:
ParlaMint 4.1 is a set of comparable corpora containing transcriptions of parliamentary debates of 29 European countries and autonomous regions, mostly starting in 2015 and extending to mid-2022. The individual corpora ...
This item contains 31 files (65.97
GB).
Publicly Available