{"id":3393,"date":"2017-07-14T11:11:05","date_gmt":"2017-07-14T11:11:05","guid":{"rendered":"http:\/\/www.clarin.si\/info\/?p=3393"},"modified":"2024-02-29T10:43:21","modified_gmt":"2024-02-29T10:43:21","slug":"empiricni-podatki-v-jezikoslovju","status":"publish","type":"post","link":"https:\/\/www.clarin.si\/info\/empiricni-podatki-v-jezikoslovju\/","title":{"rendered":"Empiri\u010dni podatki v jezikoslovju"},"content":{"rendered":"<p style=\"text-align: left;\"><em>Avtorica prispevka <a href=\"https:\/\/innorenew.eu\/sl\/employee\/ana-slavec\/\">Ana Slavec<\/a><\/em><\/p>\n<p>Od 21. do 23. junija 2017 je na Fakulteti za elektrotehniko potekal 5. ReLDI <a href=\"https:\/\/reldi.spur.uzh.ch\/hr-sr\/seminari\/seminar-5\/#slovenscina\" target=\"_blank\" rel=\"noopener noreferrer\">seminar o empiri\u010dnih podatkih v jezikoslovju<\/a>, ki se ga je udele\u017eilo 50 udele\u017eencev iz petih dr\u017eav nekdanje Jugoslavije. Udele\u017eila sem se ga tudi Ana Slavec (ADP), ki sem \u017eelela poglobiti svoje znanje o jezikoslovnih podatkih, saj so korpusi spletne sloven\u0161\u010dine (<a href=\"http:\/\/nl.ijs.si\/janes\/\" target=\"_blank\" rel=\"noopener noreferrer\">JANES<\/a>) ena izmed \u0161tudij primera, ki jih obravnavamo v \u0161esti delovni skupini v okviru projekta <a href=\"http:\/\/www.adp.fdv.uni-lj.si\/projekti\/seriss\/\" target=\"_blank\" rel=\"noopener noreferrer\">SERISS (Obzorje 2020)<\/a>.<\/p>\n<p><a href=\"https:\/\/reldi.spur.uzh.ch\/\">ReLDI<\/a> (Regional Linguistic Data Initiative) je dvoletno institucionalno partnerstvo med raziskovalnimi organizacijami na podro\u010dju jezikoslovnih poodatkov v \u0160vici, Srbiji in na Hrva\u0161kem, ki ga financira <a href=\"http:\/\/www.snf.ch\/en\/Pages\/default.aspx\" target=\"_blank\" rel=\"noopener noreferrer\">\u0160vicarska nacionalna znanstvena fundacija<\/a> v okviru programa SCOPES. Spletna stran ReLDI je repozitorij za<a href=\"https:\/\/reldi.spur.uzh.ch\/resources-and-tools\/\"> vire in orodja za analizo jezikoslovnih podatkov<\/a> in<a href=\"https:\/\/reldi.spur.uzh.ch\/data-collection-instruments\/\"> instrumente za zbiranje podatkov<\/a>, v prihodnosti pa bo gostila tudi <a href=\"https:\/\/reldi.spur.uzh.ch\/online-courses\/\" target=\"_blank\" rel=\"noopener noreferrer\">spletne te\u010daje<\/a> na temo eksperimentalnih in korpusnih metod, programiranja in statistike v jezikoslovnem raziskovanju.<\/p>\n<p>To so bile tudi teme, ki smo jih obravnavali na seminarju v Ljubljani, ki sta ga vodili <a href=\"http:\/\/www.spur.uzh.ch\/de\/impressum\/tanjasamardzic.html\">Tanja Samard\u017ei\u0107<\/a> in <a href=\"https:\/\/www.unibo.it\/sitoweb\/maja.milicevic2\/en\">Maja Mili\u010devi\u0107<\/a>. Seminar je potekal v angle\u0161kem jeziku, vendar so bile prosojnice in materiali \u00a0<a href=\"https:\/\/reldi.spur.uzh.ch\/hr-sr\/seminari\/seminar-5\/#srpski\" target=\"_blank\" rel=\"noopener noreferrer\">v srbskem jeziku<\/a> (vsi so dostopni na spletni strani seminarja). Prvi dan dopoldne smo poslu\u0161ali predavanji o podatkih in <a href=\"https:\/\/reldi.spur.uzh.ch\/hr-sr\/wp-content\/uploads\/sites\/6\/2017\/06\/ReldiSi.pdf\">napovedovanju v jezikoslovju<\/a> ter o <a href=\"https:\/\/drive.google.com\/file\/d\/0B1MhLix-CW0xRHR3UDZaNWZ0cVE\/view\" target=\"_blank\" rel=\"noopener noreferrer\">korpusno zasnovanih jezikoslovnih raziskavah<\/a>. Tako kot v drugih vedah, se tudi v jezikoslovju lahko na podlagi empiri\u010dnih podatkov napoveduje dogodke, na primer slovni\u010dne lastnosti ali obstoj dolo\u010denega elementa v besedilu. Pri tem so empiri\u010dni podatki najpogosteje besedilni korpusi.<\/p>\n<blockquote><p><i>Besedilni korpusi so obse\u017ene zbirke realnih besedil v elektronski obliki, ki so zajeta iz razli\u010dnih virov na na\u010din, da predstavljajo vzorec jezikovne rabe dolo\u010dene vrste. (Vir: <\/i><a href=\"http:\/\/www.jezikovna-politika.si\/opremljenost\/jezikovni-opis\/korpusi\/\" target=\"_blank\" rel=\"noopener noreferrer\"><i>Jezikovna Slovenija<\/i><\/a><i>)<\/i><\/p><\/blockquote>\n<div id=\"attachment_4726\" class=\"wp-caption alignleft\">\n<figure id=\"attachment_3395\" aria-describedby=\"caption-attachment-3395\" style=\"width: 300px\" class=\"wp-caption alignnone\"><a href=\"http:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0140.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-3395\" src=\"http:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0140-300x225.jpg\" alt=\"\" width=\"300\" height=\"225\" srcset=\"https:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0140-300x225.jpg 300w, https:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0140-768x576.jpg 768w, https:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0140-1024x768.jpg 1024w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><figcaption id=\"caption-attachment-3395\" class=\"wp-caption-text\">Delo v skupinah (foto: Darja Fi\u0161er)<\/figcaption><\/figure>\n<\/div>\n<p>V popoldanskem delu pa smo se na vajah u\u010dili pridobivanja korpusnih podatkov preko poizvedb in jezika CQL (corpus query language) v programu <a href=\"https:\/\/the.sketchengine.co.uk\/login\/\" target=\"_blank\" rel=\"noopener noreferrer\">SketchEngine<\/a> oz. v njegovi brezpla\u010dni omejeni razli\u010dici <a href=\"http:\/\/nl.ijs.si\/noske\/index-en.html\" target=\"_blank\" rel=\"noopener noreferrer\">NoSketchEngine<\/a>. Na koncu smo se razdelili v skupine in dobili navodila za prakti\u010dno delo. Sama sem na primer sodelovala v skupini, kjer smo morale udele\u017eenke zasnovati raziskavo, ki bi prou\u010devala zamenljivost veznikov DA in KER v vzro\u010dnem razmerju pri glagolskih zvezah, ki izra\u017eajo pozitivno ali negativno \u010dustvovanje\/ob\u010dutenje.<\/p>\n<p>Drugi dan smo poslu\u0161ali predavanji <a href=\"https:\/\/drive.google.com\/file\/d\/0B1MhLix-CW0xam5hWlhVZXppMkE\/view\" target=\"_blank\" rel=\"noopener noreferrer\">o vlogi eksperimentiranja v jezikoslovju<\/a>, ki je pomembno, saj omogo\u010da raziskovanje \u0161ir\u0161ega nabora jezikoslovnih pojavov, vi\u0161jo stopnjo kontrole nad raziskavo ter ugotavljanje vzro\u010dno-posledi\u010dnih odnosov. V popoldanskem delu pa smo se u\u010dili o pripravi podatkov za statisti\u010dno analizo v <a href=\"https:\/\/www.r-project.org\/\" target=\"_blank\" rel=\"noopener noreferrer\">programu R<\/a> ter nadaljevali s skupinskim delom. Postavili smo hipotezo, izbrali metodo ter pripravili raziskovalni na\u010drt. V moji skupini smo se odlo\u010dile za korpusno metodo in podatke pridobile iz <a href=\"http:\/\/www.korpus-kres.net\/Support\/About\" target=\"_blank\" rel=\"noopener noreferrer\">korpusa KRES<\/a>.<\/p>\n<div id=\"attachment_4727\" class=\"wp-caption alignright\">\n<figure id=\"attachment_3396\" aria-describedby=\"caption-attachment-3396\" style=\"width: 300px\" class=\"wp-caption alignnone\"><a href=\"http:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0128.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-3396\" src=\"http:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0128-300x225.jpg\" alt=\"\" width=\"300\" height=\"225\" srcset=\"https:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0128-300x225.jpg 300w, https:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0128-768x576.jpg 768w, https:\/\/www.clarin.si\/info\/wp-content\/uploads\/2017\/07\/IMG_0128-1024x768.jpg 1024w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><figcaption id=\"caption-attachment-3396\" class=\"wp-caption-text\">Dr. Maja Mili\u010devi\u0107 predava (foto: Darja Fi\u0161er)<\/figcaption><\/figure>\n<\/div>\n<p>Zadnji dan smo poslu\u0161ali predavanji <a href=\"https:\/\/drive.google.com\/file\/d\/0B1MhLix-CW0xRnN4N013LUxJc0E\/view\" target=\"_blank\" rel=\"noopener noreferrer\">o opisni statistiki, statisti\u010dni inferenci in statisti\u010dnih testih ter o analizi in vizualizaciji podatkov v R<\/a>, v popoldanskem delu pa smo nadaljevali s prakti\u010dnim delom. Tabelo podatkov, ki je nastala na podlagi CQL poizvedb na korpusu KRES preko orodja NoSketchEngine, smo uvozile v R in podatke prikazale v obliki grafikona kvantilov (boxplot). Na koncu je vsaka skupina predstavila rezultate tega dela.<\/p>\n<p>Seminar je bil namenjen predvsem raziskovalcem na podro\u010dju jezikoslovja, ki imajo manko znanja s podro\u010dja metodologije in raziskovanja in uporabe statistike. Ve\u010dina udele\u017eencev je prvi\u010d delala empiri\u010dno raziskavo in uporabljala program R, zato smo za\u010deli pri osnovah. Kot dru\u017eboslovni metodologinji in statisti\u010darki so mi bile te vsebine \u017ee precej dobro poznane, zato je bilo zame dodana vrednost seminarja povsem drugje \u2013 v spoznavanju korpusne metodologije in v uvidu, kako se statistika uporablja na podro\u010dju jezikoslovja. Predvsem sem poglobila znanje uporabe CQL v Sketch Engine, ki sem ga \u017ee uporabljala, vendar doslej le za osnovne poizvedbe.<\/p>\n<p>Interdisciplinarnost je v sodobni znanosti izjemno pomembna, saj dolo\u010denih problemov ni mo\u017eno re\u0161evati le v okviru ene same discipline. Zato upam, da bo v prihodnosti \u0161e ve\u010d tovrstnih dogodkov, ki omogo\u010dajo interdisciplinarno izobra\u017eevanje in povezovanje znanstvenikov.<\/p>\n<div>Ve\u010d na: <a href=\"http:\/\/www.adp.fdv.uni-lj.si\/blog\/2017\/blog\/empiricni-podatki-v-jezikoslovju\/#ixzz4mnmSndQE\">http:\/\/www.adp.fdv.uni-lj.si\/blog\/2017\/blog\/empiricni-podatki-v-jezikoslovju\/#ixzz4mnmSndQE<\/a><\/div>\n<div id=\"themify_builder_content-3393\" data-postid=\"3393\" class=\"themify_builder_content themify_builder_content-3393 themify_builder\">\n    <\/div>\n<!-- \/themify_builder_content -->\n","protected":false},"excerpt":{"rendered":"<p>Avtorica prispevka Ana Slavec Od 21. do 23. junija 2017 je na Fakulteti za elektrotehniko potekal 5. ReLDI seminar o empiri\u010dnih podatkih v jezikoslovju, ki se ga je udele\u017eilo 50 udele\u017eencev iz petih dr\u017eav nekdanje Jugoslavije. Udele\u017eila sem se ga tudi Ana Slavec (ADP), ki sem \u017eelela poglobiti svoje znanje o jezikoslovnih podatkih, saj so [&hellip;]<\/p>\n","protected":false},"author":8,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[41],"tags":[45,47,49,51],"class_list":["post-3393","post","type-post","status-publish","format-standard","hentry","category-obvestila","tag-clarin","tag-jezikoslovje","tag-jezikovni-korpusi","tag-seriss","has-post-title","has-post-date","has-post-category","has-post-tag","has-post-comment","has-post-author",""],"_links":{"self":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/posts\/3393","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/users\/8"}],"replies":[{"embeddable":true,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/comments?post=3393"}],"version-history":[{"count":12,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/posts\/3393\/revisions"}],"predecessor-version":[{"id":7107,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/posts\/3393\/revisions\/7107"}],"wp:attachment":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/media?parent=3393"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/categories?post=3393"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/tags?post=3393"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}