O metapodatkih
Tukaj boste našli informacije o tem, katere metapodatke potrebujemo in kako jih razširjamo. Metapodatki so prosto dostopni in v javni lasti (pod licenco CC0). Pridržujemo si pravico do obveščenosti o komercialni rabi metapodatkov iz repozitorija CLARIN.SI in namenu njihove uporabe, ki jih sporočite na Pomoč uporabnikom.
Formati metapodatkov
Med postopkom vnašanja v repozitorij uporabniki izpolnijo metapodatkovna polja, ki se shranijo kot del zapisa. Metapodatke vnosov lahko razširjamo v različnih formatih, vključno s (vendar ne omejeno na) formatoma CMDI in oai_dc. Oglejte si seznam vseh podprtih formatov, vendar bodite pozorni, saj pri določenih vnosih nekaterih formatov ni možno uporabiti. Različni formati pomagajo pri promoviranju podatkov v številnih agregatorjih (in/ali spletnih iskalnikih)
CMDI
Za več informacij si preberite CLARIN-ov uvod v komponentne metapodatke.
Trenutni vnosi v repozitorij sledijo profilu/shemi clarin.eu:cr1:p_1403526079380.
Ta profil je dobro opremljen s povezavami do registra pojmov.
oai_dc
Uporabo formata oai_dc zahteva protokol OAI-PMH. O tem, kako vnose preslikamo v ta format, lahko preberete v poglavju o preslikavi metapodatkov.
Vneseni metapodatki
Spodnji seznam prikazuje vsa polja, ki se pojavijo med postopkom vnašanja v repozitorij. Seznam se bo zelo verjetno še spreminjal. Metapodatki se vnašajo v angleščini. Različni formati vsebujejo različno ustvarjene metapodatke (na primer imena v človeku razumljivem jeziku, ki spremljajo oznake ISO, identifikatorje ali druge podatke).
Ime polja | Opis | Status |
---|---|---|
Vrsta | Vrsta vira: »Korpus" zajema besedilne, govorne in multimodalne korpuse. »Leksikalnokonceptualni vir« obsega leksikone, ontologije, slovarje, sezname besed itd. "Jezikovni opis" pokriva jezikovne modele in slovnice. "Tehnologija/orodje/storitev" se uporablja za orodja, sisteme, komponente sistemov itd. | obvezno |
Naslov | Glavni naslov vnosa. | obvezno |
URL projekta | Naslov URL vira/projekta, povezanega z vnosom (na primer spletna stran projekta). Nadzorovano z regularnimi izrazi (regexp, začne se s http/https). | nadzorovano z regexp |
Demo URL | Demo, vzorci ali pri orodjih URL vzorčnega izhoda. Nadzorovano z regularnimi izrazi (regexp, začne se s http/https). | nadzorovano z regexp |
Datum objave | Datum morebitne objave vnesenih podatkov, na primer 2014-01-21 ali vsaj leto. | obvezno |
Avtor | Imena avtorjev vnosa. V primeru zbirk (na primer korpusov ali drugih večjih besedilnih baz) je priporočljivo vnesti imena ljudi, ki so sodelovali pri pripravi celotne zbirke, in ne avtorjev posameznih del. Osebna imena se shranjujejo na način priimek, vejica, ime (na primer "Smith, John Jr."). | obvezno ponavljajoče |
Založnik | Ime organizacije/organa, ki je objavila katerokoli predhodno različico vnosa, ali ime matične institucije. | obvezno ponavljajoče |
Kontaktna oseba | Oseba, na katero se obrnete v primeru težav z vnosom. Nekdo, ki lahko priskrbi informacije o viru, na primer eden izmed avtorjev vira ali avtor vnosa. Shranjeno kot strukturiran niz, ki zajema ime, priimek, e-poštni naslov in matično institucijo. | obvezno ponavljajoče |
Financiranje | Sponzorji, ki so financirali delo, opisano v vnosu. Shranjeno kot strukturiran niz, ki zajema ime projekta, oznako projekta, financerja, vrsto sredstev (lastna/državna/evropska) in identifikator OpenAIRE (ta se shrani tudi v dc.relation) | ponavljajoče |
Opis | Besedilni opis vnosa. | obvezno |
Jezik | Jezik(i) glavne vsebine vnosa. Shranjeno kot oznaka ISO 639-3. Obvezno za korpuse, leksikalnokonceptualne vire in jezikovne opise. | ponavljajoče obvezno glede na vrsto vira |
Ključne besede | Ključne besede, povezane z vsebino vnosa. | ponavljajoče obvezno |
Velikost | Obseg vnesenih podatkov, na primer število pojavnic ali datotek. | ponavljajoče |
Vrsta medija | Medij glavne vsebine vnosa, na primer besedilo ali zvočni zapis. Spustni seznam, obvezno za korpuse, jezikovne opise in leksikalnokonceptualne vire. | spustni seznam obvezno glede na vrsto vira |
Podrobneje o vrsti | Podrobnejša klasifikacija vrste vira. Spustni seznam, obvezno za orodja, jezikovne opise in leksikalne konceptualne vire. | spustni seznam obvezno glede na vrsto vira |
Odvisnost od jezika | Boolova vrednost, ki prikazuje, ali je določeno orodje/storitev odvisna od jezika. Obvezno za orodja. | obvezno glede na vrsto orodja |
Preslikava metapodatkov
Spodnja tabela prikazuje preslikavo vnosa v format oai_dc. Navedena so tudi nekatera pomembnejša polja, ki se ustvarijo samodejno.
Polje vnosa | Preslikano polje |
---|---|
Vrsta | dc.type |
Naslov | dc.title |
URL projekta | dc.source |
Demo URL | ni preslikano |
Datum objave | dc.date |
Avtor | dc.creator |
Založnik | dc.publisher |
Kontaktna oseba | ni preslikano |
Financiranje | ni preslikano |
Opis | dc.description |
Jezik | dc.language |
Ključne besede | dc.subject |
Velikost | ni preslikano |
Vrsta medija | ni preslikano |
Podrobneje o vrsti | ni preslikano |
Samodejno ustvarjeno polje | Opis |
---|---|
dc.identifier | PID vira (trenutno handle). |
dc.rights | Ponavljajoče polje, ki lahko vsebuje ime licence, s katero so določeni pogoji distribucije vira, naslov URL do celotnega besedila licence in tako imenovano oznako (PUB, ACA, RES). |