ebooksgratis.com

See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Metatieto – Wikipedia

Metatieto

Wikipedia

Metatieto (metadata, liitännäistieto, kuvailutieto) on tietoa tiedosta, eli kuvailevaa ja määrittävää tietoa jostakin tietovarannosta tai sisältöyksiköstä. Esimerkiksi tyypillistä metatietoa ovat CD-levyn tiedot (levyn nimi, esittäjä, säveltäjä, päivämäärä) tai tekstidokumentin tiedot (viimeksi tallennettu, omistaja, versio, sijainti, julkaisupäivämäärä, jne.).

Metatietojen kehittämisellä pyritään tehostamaan jonkin tietovarannon käyttöä. Metatiedot voivat helpottaa tietojärjestelmien välisiä tiedonsiirtoja ja eri paikoissa olevien sisältöjen yhdistämistä. Laadukkaat metatiedot voivat myös parantaa informaation löydettävyyttä, niin että hakukoneet pystyvät etsimään tietoa tarkemmin ja monipuolisemmin.

Metatiedon merkitys on kasvanut World Wide Webin myötä. Metatiedon merkitys esimerkiksi tiedon automaattisessa järjestelyssä on olennainen. Metatietoja parantamalla voidaan kehittää monia asioita, esimerkiksi versionhallintaa, prosessien toimintaa, asiankäsittelyä tai tietojen arkistointia. Metatietoa voi olla tallennettuna myös jostain tiedosta jota ei enää ole olemassa.

Sisällysluettelo

[muokkaa] Metatiedot käytännössä

Tyypillisin metatieto johon tietokoneen käyttäjä yleensä törmää on tiedostonimi jossain tiedostojärjestelmässä. Toinen tyypillinen päivittäisessä käytössä esiintyvä metatieto on tiedostojen tiedostopääte joka määrittelee minkä tyyppinen tiedosto on kyseessä ja millaisella ohjelmalla tiedostoa voi käsitellä. Perinteisten tiedostojärjestelmien "metatietojärjestelmä" perustuu yleensä juuri hakemistorakenteisiin ja kuvaaviin tiedostonimiin. Tiedostojärjestelmissä käytettävien tiedostonimien käyttöä voi vakioida esimerkiksi sopimalla nimeämiskäytänteistä. Esimerkiksi yleinen tyyli on vuosi-asiayhteys-kirjoittaja-tiedostotunniste (esim. "2002-kuusamonkokous-virtanen-antti.odf"). Lisätarkkuutta tiedostojärjestelmään voidaan saada esimerkiksi koostekansioilla ja kategorisoinneilla.

Tyypillisesti tiedostoihin liittyvä metatieto on tallennettuna sisälle tiedostoon tai metatiedot on tallennettuna erilliseen tietokantaan keskitetysti. Esimerkiksi kuva- ja musiikkitiedostoissa on usein tiedostoihin sisällytettynä paljon lisätietoa joka voi liittyä esimerkiksi tekijään, kohteeseen, tiedostokokoon, laatuun tai albumiin. Monet kuvankäsittely- ja musiikkiohjelmat toisaalta tallentavat metatietoja myös "mediakirjastoonsa" tai "albumitietokantaansa". Jos metatiedot on tallennettu keskitetysti, niin metatiedot eivät yleensä siirry mukana jos tiedostoja siirretään toisaalle (esimerkiksi ladattaessa musiikkia kannettavaan soittimeen). Jos metatiedot taas ovat sisällytettynä tiedostoon, niin tiedostoformaatista riippuen tiedostoon voi sisältyä hyvin vaihteleva määrä erilaisia metatietoja. Monien metatietoa sisälleen tallentavien tiedostoformaattien ongelmia ovat käyttäjän kannalta epäyhteensopivuus muiden ohjelmien kanssa tai rajalliset metatietojen tallennusmahdollisuudet.

Metatietojen hyödyllisyys esimerkiksi hakukoneille vaihtelee. Esimerkiksi monet tunnetut Internetin hakukoneet eivät juurikaan hyödynnä tiedostojen virallista metatietoa vaan käyttävät tilastollisia analyyseja, sisältöanalyyseja ja ulkopuolisten linkkien ja linkkikuvauksien antamaa tietoa.

[muokkaa] Erilaisia luokitteluja

Erilaisia luokitteluja metatiedoille on useita. Melko yleinen, mutta kovin karkea luokittelu esimerkiksi jakaa metatiedot kolmeen kategoriaan. Luokittelun mukaan metatietoa on kolmenlaista:

  1. Itseisarvoista (tiedoston nimi tai koko)
  2. Kuvailevaa (aihe, otsikko, yleisö, jne.)
  3. Hallinnollista (viimeksi tallennettu, tarkastettu, omistaja, jne.)

Toisenlaisen kolmen kategorian luokittelun on esittänyt esimerkiksi Salminen (2005):

  1. Semanttinen metatieto (sisällön merkitystä kuvaava tieto, esimerkiksi asiasanat, asiakirjan nimeke, aihe, tiivistelmä)
  2. Rakennemetatieto (sisältöyksikön fyysistä tai loogista rakennetta tai sisällön kieltä kuvaavaa tietoa)
  3. Kontekstuaalinen metatieto (kuvaa sisältöyksiköiden ympäristöä jossain tietyssä tilanteessa, esimerkiksi sisältöyksikön luomisaika, tuottaja, käyttäjä ja suhteet muihin sisältöyksiköihin)

Salminen (2005) on myös todennut, että metatietoja voidaan luokitella mitä erilaisimmilla tavoilla. Esimerkiksi pysyvyyden perusteella metatieto voidaan luokitella staattiseksi tai dynaamiseksi, tallennustavan mukaan voidaan metatiedot luokitella upotetuiksi tai ulkoisiksi ja organisoinnin perusteella hajautetuiksi tai keskitetyiksi.

[muokkaa] Metatiedon tuottaminen ja kehittäminen

Metatietoa voidaan tuottaa automaattisesti tai manuaalisesti:

  • automaattisesti
    • dokumenttien ominaisuustiedoista
    • rakenteisista dokumenteista erottelemalla
  • manuaalisesti
    • kirjoittamalla dokumentille erillisiä kuvaustietoja

Perinteisiä metatietojen kehittämismenetelmiä ovat mm.:

  • korttien avulla ryhmätyönä tehtävä luokittelu
  • olemassa olevien sisältöjen analysointi

Nykyisin metatietoja kehitetään usein automaattisesti erilaisten tietokoneohjelmien avulla analysoimalla olemassa olevia sisältöjä, mutta yhtä lailla tärkeätä on edelleen myös ihmisten tekemä luokittelu, asiasanoittaminen ja kuvailu.

[muokkaa] Valmiita sanastoja

Metatiedon yhteensopivuutta parannetaan hyödyntämällä valmiita sanastoja joiden perusteella voidaan saavuttaa parempaa järjestelmien välistä yhteentoimivuutta. Tällöin puhutaan yleensä tietojärjestelmien välisestä semanttisesta yhteensopivuudesta.

Valmiita sanastoja ovat mm.

Toimialakohtaisia valmiita sanastoja sisältyy myös esimerkiksi elektronisen liiketoiminnan määritysperheisiin kuten RosettaNet ja ebXML.

[muokkaa] Yleisiä ongelmia metatietojen hyödyntämisessä

  • Luonnollisten kielien runsaus ja monimutkaisuus
  • Koneellisen tulkinnan vaikeudet
  • Ongelmat sanastojen käytössä ja kehittämisessä
  • Ohjelmat tallentavat metatiedot sellaisessa muodossa, ettei niitä ole mahdollista hyödyntää ilman kyseistä ohjelmaa

Esimerkiksi tyypillinen yksittäisen käyttäjän kokema ongelma metatietojen osalta on, että tietokoneohjelmat kyllä tallentavat paljon metatietoa erilaisista tiedostoista ja sisällöistä omaa käyttöään varten, mutta eivät kykene jakamaan tätä metatietoa muiden ohjelmien kanssa. Esimerkiksi Microsoft Wordin tuottamat dokumentit sisältävät yleensä paljon metatietoa asiakirjan tallennuksista, versioista, muokkauksista, muokkaajista sekä dokumentin muotoilusta, rakenteesta ja kirjasimista. Lähetettäessä sama asiakirja sähköpostitse toiselle henkilölle jolla ei kuitenkaan ole vastaavaa ohjelmaa ei tätä kaikkea dokumenttiin tallennettua metatietoa pystytä hyödyntämään. Esimerkiksi tämän ongelman ratkaisemiseksi on kehitetty OpenDocument-tiedostomuoto.

[muokkaa] Katso myös

[muokkaa] Lähteet

  1. Salminen, A. 2005. Metatiedot organisaatioiden sisällönhallinnassa. Julkaisussa Lehtinen, A., Salminen, A., Nurmeksela, R., Metatiedot suomalaisen lainsäädäntöprosessin tiedonhallinnassa. Eduskunnan kanslian julkaisu 7/2005, 4-13. Artikkeli saatavilla pdf-muodossa: http://www.cs.jyu.fi/~airi/papers/Metatietoartikkeli-2005.pdf


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -