{"id":2413,"date":"2014-08-12T20:23:13","date_gmt":"2014-08-12T18:23:13","guid":{"rendered":"http:\/\/nl.ijs.si\/clarin\/?page_id=2413"},"modified":"2025-05-29T11:53:01","modified_gmt":"2025-05-29T11:53:01","slug":"konkordance","status":"publish","type":"page","link":"https:\/\/www.clarin.si\/info\/konkordance\/","title":{"rendered":"Spletni konkordan\u010dniki"},"content":{"rendered":"<p>Konkordan\u010dniki so ra\u010dunalni\u0161ki programi, ki omogo\u010dajo iskanje, prikaz in statisti\u010dno obdelavo podatkov v velikih besedilnih zbirkah (korpusih).<\/p>\n\n<p>&nbsp;<\/p>\n<h2>Konkordan\u010dniki CLARIN.SI<\/h2>\n<p>CLARIN.SI vzdr\u017euje ve\u010d konkordan\u010dnikov, s katerimi je mogo\u010de iskati po preko 100 korpusih v 30 jezikih, skupaj pa vsebujejo ve\u010d kot 20 milijard besed. Omogo\u010dajo kompleksna iskanja po metapodatkih besedil in po jezikoslovnih oznakah, izpis in sortiranje konkordanc, izdelavo frekven\u010dnih leksikonov, izra\u010dun kolokacij, shranjevanje rezultatov poizvedb itd. Konkordan\u010dnika noSketch Engine in KonText uporabljata enak zaledni program, razlikujeta pa se v uporabni\u0161kih vmesnikih in na\u010dinu prijave.<\/p>\n<h3><strong>noSketch Engine<br \/>\n<\/strong><\/h3>\n<p>noSketch Engine je odprtokodna razli\u010dica komercialnega konkordan\u010dnika <a href=\"https:\/\/www.sketchengine.co.uk\/\" target=\"_blank\" rel=\"noopener noreferrer\">Sketch Engine<\/a> podjetja <a href=\"https:\/\/www.lexicalcomputing.com\/\">Lexical Computing<\/a>. Navodila za uporabo so dostopna na <a href=\"https:\/\/www.sketchengine.eu\/\">njihovih straneh<\/a>. Velja opozorilo, da korpusi, ki jih ponuja CLARIN.SI prek noSketch Engine niso enaki, kot korpusi, ki jih ponuja Lexical Computing prek Sketch Engine.<\/p>\n<p>CLARIN.SI ponuja dve instalaciji noSketch Engine:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/\">https:\/\/www.clarin.si\/ske<\/a> &#8211; prijava ni potrebna niti mogo\u010da, kar olaj\u0161a uporabo manj zahtevnim uporabnikom<\/li>\n<li><a href=\"https:\/\/www.clarin.si\/skelog\/\">https:\/\/www.clarin.si\/skelog<\/a> &#8211; prijava je nujna, vendar se lahko vsak registrira sam; prijava omogo\u010da izdelavo podkorpusov in osebne nastavitve prikazov.<\/li>\n<\/ul>\n<p>CLARIN.SI se zahvaljuje sodelavcem podjetja <a href=\"https:\/\/www.lexicalcomputing.com\/\">Lexical Computing<\/a>, predvsem Janu Bu\u0161ti in Tom\u00e1\u0161u Svobodi, za pomo\u010d pri instalaciji konkordan\u010dnika Sketch Engine Crystal v okviru CLARIN.SI.<\/p>\n<h3><strong>KonText<\/strong><\/h3>\n<p>Konkordan\u010dnik KonText je bil razvit za namene <a href=\"https:\/\/kontext.korpus.cz\" target=\"_blank\" rel=\"noopener noreferrer\">\u010ce\u0161kega nacionalnega korpusa<\/a> in je odprto dostopen na platformi <a href=\"https:\/\/github.com\/czcorpus\/kontext\">GitHub<\/a>. Navodila za uporabo so dostopna <a href=\"https:\/\/wiki.korpus.cz\/doku.php\/en:manualy:kontext:index\" target=\"_blank\" rel=\"noopener noreferrer\">tukaj<\/a>.<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/kontext\">https:\/\/www.clarin.si\/kontext<\/a><\/li>\n<\/ul>\n<p>Vsi korpusi na KonTextu so prosto dostopni, vendar je za uporabo naprednih funkcij potrebna prijava prek sistema AAI. Podobno kot pri noSketch Engine omogo\u010da prijava prilagoditev nastavitev zaslona, tudi za posamezne korpuse, izdelavo lastnih podkorpusov, hranjenje poizvedb itd. Za razliko od noSketch Engine konkordan\u010dnik KonText omogo\u010da tudi neposredno povezavo do govornih posnetkov pri govorjenih korpusih, zato pa ne podpira izra\u010duna klju\u010dnih besed korpusa.<\/p>\n<p>CLARIN.SI se zahvaljuje sodelavcem <a href=\"https:\/\/kontext.korpus.cz\">\u010ce\u0161kega nacionalnega korpusa<\/a>, predvsem Tom\u00e1\u0161u Mach\u00e1leku, za pomo\u010d pri instalaciji KonTexta v okviru CLARIN.SI.<\/p>\n<h3><strong>Stari noSketch Engine<br \/>\n<\/strong><\/h3>\n<p>Konkordan\u010dnik noSketch Engine &#8220;Bonito&#8221; je stara razli\u010dica programa noSketch Engine, ki ima bistveno druga\u010den uporabni\u0161ki vmesnik, kot pa je sedaj, in ima tudi starej\u0161ni zaledni programu. Lexical Computing ga ne vzdr\u017euje ve\u010d, niti nima ve\u010d na voljo uporabni\u0161ke dokumentacije.<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/noske\/\">https:\/\/www.clarin.si\/noske<\/a><\/li>\n<\/ul>\n<p>Pri CLARIN.SI <strong>odsvetujemo<\/strong> uporabo tega konkordan\u010dnika, saj ga bomo morali po\u010dasi izklopiti, tudi zaradi tega, ker postaja tar\u010da vedno ve\u010dih napadov, ki posledi\u010dno upo\u010danujejo delovanje celotnega spleti\u0161\u010da CLARIN.SI.<\/p>\n<p>Se pa na to instalacijo sklicujejo nekateri jezikovni viri (npr. <a href=\"https:\/\/lexonomy.cjvt.si\/slovar-tviterscine\/\">Slovar tviter\u0161\u010dine<\/a> ali <a href=\"http:\/\/nl.ijs.si\/imp\/imp25k\/html-s\/\">Besedi\u0161\u010de IMP<\/a>), poleg tega pa omogo\u010da dostop to rezultatov poizvedb v formatu XML; tu zado\u0161\u010da, da na konec URL-ja poizvedbe dodamo parameter &#8220;format=XML&#8221;.<\/p>\n<p>CLARIN.SI se zahvaljuje direktorjem podjetja <a href=\"https:\/\/www.lexicalcomputing.com\/\">Lexical Computing<\/a>, Milo\u0161u Jakub\u00ed\u010dku in Pavlu Rychl\u00fdju, da sta omogo\u010dila odprt dostop do konkordan\u010dnika in predvsem zalednega program Manatee.<\/p>\n<h2>Drugi slovenski konkordan\u010dniki in korpusi<\/h2>\n<p>Za nekatere slovenske referen\u010dne korpuse lahko, poleg mo\u017enosti iskanja prek konkordan\u010dnikov CLARIN.SI, uporabimo tudi njihove namenske konkordan\u010dnike, dostopne na <a href=\"https:\/\/www.cjvt.si\/\">Centru za jezikovne vire in tehnologije Univerze v Ljubljani<\/a>:<\/p>\n<ul>\n<li><a href=\"http:\/\/viri.cjvt.si\/gigafida\/\">Korpus Gigafida<\/a> je referen\u010dni korpus sodobne pisne standardne sloven\u0161\u010dine, ki vsebuje besedila najrazli\u010dnej\u0161ih zvrsti. Prva razli\u010dica je bila razvita v okviru projekta <em>Sporazumevanje v slovenskem jeziku<\/em>, ki je potekal od 2007 do 2013, posodobljena razli\u010dica pa je bila pripravljena v okviru projekta nadgradnje korpusa in izdana 2019.<\/li>\n<li><a href=\"http:\/\/ssj.slovenscina.eu\/korpusi\/kres\">Korpus Kres<\/a> je uravnote\u017eeni podkorpus, vzor\u010den iz <a href=\"http:\/\/ssj.slovenscina.eu\/korpusi\/gigafida\">prve razli\u010dice korpusa Gigafida<\/a>, ki je bil ustvarjen v okviru projekta <em>Sporazumevanje v slovenskem jeziku.<\/em><\/li>\n<li><a href=\"https:\/\/viri.cjvt.si\/gos\/\">Korpus Gos<\/a> je korpus govorjene sloven\u0161\u010dine, ki je nastal v okviru projekta <em>Sporazumevanje v slovenskem jeziku.<\/em><\/li>\n<\/ul>\n<p>Za sloven\u0161\u010dino so prek svojih konkordan\u010dnikov na voljo tudi naslednji korpusi:<\/p>\n<ul>\n<li><a title=\"Evrokorpus\" href=\"https:\/\/evroterm.vlada.si\/evrokorpus?clang=sl\" target=\"_blank\" rel=\"noopener noreferrer\">Evrokorpus<\/a> je zbirka vzporednih dvojezi\u010dnih korpusov slovenskih prevodov zakonodaje EU in je povezan s terminolo\u0161ko bazo <a href=\"https:\/\/evroterm.vlada.si\/evroterm\" target=\"_blank\" rel=\"noopener noreferrer\">Evroterm<\/a>.<\/li>\n<li>Turisti\u010dni korpus <a href=\"https:\/\/turk.upr.si\/turk12\/index.html\">TURK<\/a> je ve\u010djezi\u010dni korpus turisti\u010dnih besedil v slovenskem, italijanskem in angle\u0161kem jeziku, ki je nastal v okviru <a href=\"https:\/\/www.zrs-kp.si\/\">Znanstveno raziskovalnega sredi\u0161\u010da Univerze na Primorskem<\/a>.<\/li>\n<li><a title=\"Nova beseda\" href=\"http:\/\/bos.zrc-sazu.si\/s_beseda.html\" target=\"_blank\" rel=\"noopener noreferrer\">Nova beseda<\/a> je korpus s 380 milijoni besed <a href=\"http:\/\/isjfr.zrc-sazu.si\/sl#v\">In\u0161tituta za slovenski jezik Frana Ramov\u0161a ZRC SAZU<\/a>.<\/li>\n<\/ul>\n<div id=\"themify_builder_content-2413\" data-postid=\"2413\" class=\"themify_builder_content themify_builder_content-2413 themify_builder\">\n    <\/div>\n<!-- \/themify_builder_content -->\n","protected":false},"excerpt":{"rendered":"<p>Konkordan\u010dniki so ra\u010dunalni\u0161ki programi, ki omogo\u010dajo iskanje, prikaz in statisti\u010dno obdelavo podatkov v velikih besedilnih zbirkah (korpusih). &nbsp; Konkordan\u010dniki CLARIN.SI CLARIN.SI vzdr\u017euje ve\u010d konkordan\u010dnikov, s katerimi je mogo\u010de iskati po preko 100 korpusih v 30 jezikih, skupaj pa vsebujejo ve\u010d kot 20 milijard besed. Omogo\u010dajo kompleksna iskanja po metapodatkih besedil in po jezikoslovnih oznakah, izpis [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-2413","page","type-page","status-publish","hentry","has-post-title","has-post-date","has-post-category","has-post-tag","has-post-comment","has-post-author",""],"_links":{"self":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/pages\/2413","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/comments?post=2413"}],"version-history":[{"count":140,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/pages\/2413\/revisions"}],"predecessor-version":[{"id":8213,"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/pages\/2413\/revisions\/8213"}],"wp:attachment":[{"href":"https:\/\/www.clarin.si\/info\/wp-json\/wp\/v2\/media?parent=2413"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}