Hizkuntzalaritza konputazionala
Wikipedia(e)tik
Hizkuntzalaritza konputazionala giza lengoaia ikertu eta aztertzeko informatikaz baliatzen den arloa da. Horretarako, lengoaia naturala modu logikoan modelatzen saiatzen da, ikuspegi konputazional batetik beti ere. Modelaketa hori ez da hizkuntzalaritzaren atal batean burutzen, bertan hizkuntzalari, informatikari, psikologo eta logikan adituek parte hartu dezaketelarik.
Honako hauek dira hizkuntzalaritza konputazionalaren ikerketa atal batzuk:
- Ordenagailu bidezko corpus linguistikoa.
- Lengoaia naturalentzako aztertzaile sintaktiko (ingelesez, parser) diseinua.
- POS-tagger bezalako etiketatzaile (ingelesez, tagger) baten diseinua.
- Lengoaia naturalen prozesamendurako balioko duten logika espezializatuen definizioa.
- Lengoaia formal eta naturalen arteko erlazio posible baten ikerketa.
- Itzulpengintza automatikoa.
Eduki-taula |
[aldatu] Jatorriak
Hizkuntzalaritza konputazionala Ameriketako Estatu Batuetan sortu zen 1950eko hamarkadan, atzerriko hizkuntzetatik ingelesera itzultzeko ordenagailuak izatea helburu nagusi zutelarik, bereziki Errusiako aldizkari zientifikoak oinarri hartuta. 1960ko hamarkadan, adimen artifizialaren sorrerarekin batera, hizkuntzalaritza konputazionala beronen atal bat izatera pasa zen.
Itzulpenak egiteko, bi lengoaien sintaxia ulertu beharra zegoela ohartu ziren, perpaus eta morfologia mailan bederen. Sintaxia ulertzeko, berbategiaren semantika eta lengoaiaren pragmatika ulertu beharra daude. Testuak itzultzeko asmo bezala hasi zen hau, lengoaia naturala prozesatzeko arlo bat izatera pasa zen.
Ikerketa hauek corpusaren hizkuntzalaritza bezala ere ezagutzen dira, konputazional terminoa nahasgarria izan daitekeelako.
[aldatu] Ikerketa arloak
Hizkuntzalaritza konputazionala bi azpiarlotan banatuta dago:
[aldatu] Hizkuntzalaritza konputazional teorikoa
Hizkuntzalaritza teorikoa eta ezagutzaren zientzian oinarritzen da. Ezagutzaren psikologiak ere bere garrantzia dauka honetan, psikolinguistikak bereziki. Ondorioz, zientzia berri bat sortu da: psikolinguistika konputazionala.
Bere helburua lengoaiaren funtzionamenduaren azalpena ematea da, maila ezberdinetan izan daitekeelarik: fonetika, morfologia, sintaxia, semantika, pragmatika, eta abar.
[aldatu] Hizkuntzalaritza konputazional aplikatua
Teknologiari zuzenduta dago, eta hori dela-eta ingeniaritza linguistikoa eta giza lengoaiaren teknologia bezalako terminoak ere erabiltzen dira. Baliabide informatikoen bidezko simulazioekin jasotako lengoaiaren jarrerak modu praktikoan aztertzean datza.
Bere helburua lengoaiak (ahozkoa zein idatzizkoa) zeresana duen osaiak dituzten produktu informatikoak sortzea da.
[aldatu] Hizkuntzalaritza konputazionalaren aplikazioak
Honako hauek hizkuntzalaritza konputazionalak sortu ditzakeen aplikazio batzuen adibideak dira:
- Aztertzaile sintaktikoa
- Aztertzaile morfologikoa
- Aztertzaile semantikoa
- Lengoaien arteko bihurtzaileak
- Corpus linguistikoa
- Zuzentzaile ortografikoa
- Desanbiguatzaile funtzionala
- Etiketatzailea
- Indizatze motorea