Web - Amazon

We provide Linux to the World

ON AMAZON:


We support WINRAR [What is this] - [Download .exe file(s) for Windows]

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
SITEMAP
Audiobooks by Valerio Di Stefano: Single Download - Complete Download [TAR] [WIM] [ZIP] [RAR] - Alphabetical Download  [TAR] [WIM] [ZIP] [RAR] - Download Instructions

Make a donation: IBAN: IT36M0708677020000000008016 - BIC/SWIFT:  ICRAITRRU60 - VALERIO DI STEFANO or
Privacy Policy Cookie Policy Terms and Conditions
Itzulpengintza automatikoa - Wikipedia, entziklopedia askea.

Itzulpengintza automatikoa

Wikipedia(e)tik

Itzulpengintza automatikoa informatika bezain zaharra edo gehiago da. Segur aski, giza zein ekonomia baliabide gehien jaso duen aplikazioetako bat da. Merkatuak gaur egun, makina bat produktu eskaintzen ditu eta benetan zaila da aditua ez denarentzat dituen beharretarako aproposena zein den erabakitzea. Artikulu honetan funtsezko gakoak emango dira teknologia honetara jotzearen aukera gutxieneko ezagutza izanik landu ahal izateko.

Eduki-taula

[aldatu] Sarrera

Itzulpengintza automatikoa hizkuntza teknologiaren garapenean nabarmen lagundu duen diziplina da. Zeregin nagusia hori duten elkarte zientifikoak, aldizkari bereziak, unibertsitate departamentuak eta enpresak daude. Martin Kay-ren esanetan:

   
Itzulpengintza automatikoa
Itzultzeko makinak lortzeko irrika horrek hizkuntzalaritza, filosofia, matematika edo informatika diziplinetako zenbait buruargiren arreta merezi izan du. Horretaz gain, itzulpen automatikoak jarraitzaile leial batzuengan erakarpen liluragarria pizten du. Zer dela eta lilura hori?
   
Itzulpengintza automatikoa

Bitarteko mekanikoen bidez itzultzea bada erronka zientifiko bat. Baina itzulpen automatikoak horrenbesteko interesa piztearen benetako arrazoiak ez du sustrai zientifikorik, behar praktikoan du jatorria, informazio jarioan alegia.

Suedia eta Finlandia EB-ean sartu zirenean 1995ean, 60.000 arautze komunitario inguru itzuli behar izan ziren, "acquis communautaire" izenaz ezaguna dena. 1999an, hiru urte beranduago baino ez, Bruselako legegizonen ahalegin nekaezinari esker, kopuru hori 20.000 gehiagorekin handitu zen. Ekialdeko Europako herriak EB-an berehala sartzeak oso hizkuntza egoera delikatuan jartzen du Batzordea eta teknologia berrien aurrerakadak baino ezin lagun dezake egoera arintzen.

[aldatu] Historia

Sakontzeko

 Sakontzeko, irakurri: Itzulpengintza automatikoaren historia

Makina itzultzaileak egiteko nahia ordenagailuak izan baino askoz ere lehenagokoa da. Hortaz, 1940ko hamarkadan ordenagailu bat eskura egon zenetik, itzulpengintza automatikoa berehala bilakatu zen informatikaren aplikaziorik arrakastatsuenetakoa. Ordutik hona, astia izan da esperimentu anitz egiteko, txikiak eta handiak, bai eta instituzio zein industria mailako inbertsio handiak ere. 1950eko hamarkadan itzultzaile automatiko bat sortzeko baikortasuna nagusi zen arren, 1966an argitaratutako ALPAC txostenak ezkortasuna ekarri zuen, eta Kanadan eta Europan ikerketak jarraitu zuen arren, Estatu Batuetan nabarmen egin zuen behera. Hala eta guztiz ere, 1980ko hamarkadan suspertu zen berriz, hainbat sistemaren argitalpena eta teknika berrien agerpena zela eta.

[aldatu] Metodologia garapena

Itzulpen automatikoari aplikaturiko metodoak bi talde handitan bana ditzakegu:

Ikuspuntu teorikotik erabat kontrajarririk dauden hurbilpenak dira, diseinu sistema oso ezberdinak sortarazten dituztenak. Arauetan oinarrituriko sistemek euren kontzepzio teorikoan, Hizkuntzalaritza Sortzailean eta Adimen Artifizialean izandako aurrerapenen eragina izan dute, batez ere, 1970eko hamarkadatik aurrera. Sistema hauek dira normalean "itzulpen automatikorako" benetako sistematzat hartzen direnak. Analogietan oinarrituriko sistemak 1990eko hamarkadan agertu dira eta hurbilpen estatistikoen metodoak aplikatzen dituzte aldez aurretik itzulita dauden testu zatien gainean. Ele egitea eta Corpus Hizkuntzalaritza aztertzeko sistemetan erabilitako tekniken antzekoak aplikatzen dituzte. Zenbait autoreren ustetan "itzulpen lagunduaren" sistemak dira.

Laurogeita hamarreko hamarkada arte ikerlarien artean izan den premisarik indartsuenetako bat, itzulpena funtsean parekotasun semantikoaren arazo gisa hartzea izan da. Premisa horren oinarria Leibniz-en garairaino heldu eta Frege eta Montague-k, semantika garaikidearen aitak, hartu zuten ustean dago, alegia, munduko hizkuntza guztiek azpiegitura logiko bera dutela. Horrela izatekotan, azpiegitura hori asmatu eta formalizatzeko gai bagina itzulpenaren arazoa konponduta legoke. Ideia horrekin, ikertzaileak parekotasun kontzeptualaren arazoa konpontzen saiatu dira, bai adierazpen neutro eta komunen bitartez - hizkuntza arteko teknika -, bai hizkuntza bikoteen artean tarteko adierazpenak proiektatuz -transferentzia teknika. Semantikaren tratamendu konputazionalerako gehien erabiltzen diren ereduen artean azpimarratzeko dira honako hauek: sare semantikoak (Simmons eta Slocum, 1972), lehentasun semantikoak (Wilks, 1973), kasu eta balentzia gramatikak (Somers, 1987), adierazpen kontzeptualak (Carbonell et al, 1981; Nirenburg et al, 1985), transferentzia lexikoa (Melby, 1988; Alonso, 1990), semantika lexikoa (Dorr, 1993) eta ez-anbiguotasun lexikoa (Masterman, 1957; Amsler eta White, 1979).

Uste teoriko hori seguruenik itzultzaileentzat itzulpen sistema erabilgarrien garapena gehien kaltetu duen alderdia da. Duela gutxi arte, soilik behatzaile autorizatu batzuek Melby (1995) edo Kay (1997) esaterako, ausartu dira kritikak egiten. Melby izan da hizkuntzen arteko unibertsaltasun kontzeptualaren hipotesia era argi batean zalantzetan jarri duen lehena. Itzultzaile profesionalek zalantzetan jarri dute ideia horren baliagarritasuna Interneteko (Lantra-1) foro ezagunetan islatzen den legez. Horretaz gain, itzulpengintzaren esparruan semantikoa bezain garrantzitsuak diren parekotasun mailak deskribatzen dituzten azterketa berriak dira. Nord-ek (1993), itzulpen parekotasunaren azterketan egilerik nabarmenena den emakumek, bi dimentsio gehiago proposatzen ditu, parekotasun estatistikoa eta parekotasun pragmatikoa. Bestalde, Hatim eta Mason-ek (1990), itzulpena soilik linguistikoa baino, batez ere zentzu pragmatikodun kontutzat hartzearen garrantzia azpimarratzen dute, eta parekotasun abstraktuagoa duen maila proposatzen dute sinbolo sozial eta kulturalen eremuan, hots, semiotikarena.

Birpasa ditzagun astiroago itzulpen automatikoan erabilitako metodoen multzo biak kontuan hartuz azpi-motarik erabilienak.

[aldatu] Arau bidezko itzulpena

Arau bidezko sistemeen sailkatzea piramide irudi honen bitartez erakusten da.
Arau bidezko sistemeen sailkatzea piramide irudi honen bitartez erakusten da.

Arau bidezko itzulpenean tarteko interpretazioak erabili ohi dituzten bi metodo azpimarra daitezke. Arrazoi hori dela eta, zeharkako arau bidezko itzulpen metodo gisa ezagutzen dira. Horrela bada, hasiera bateko bereizketa metodo "zuzenak" eta "ez zuzenak" ezberdintzen dituena da. Metodo zuzenetan ez dira tarteko adierazpenak erabiltzen eta itzulpena urrats bakar batean burutzen da: jatorrizko hizkuntzako hitzak hiztegian kontsultatzen dira eta zuzenean ematen dira xede hizkuntzan dagozkien parekoak soilik malgutasun, komunztadura eta berrantolaketa arau batzuk aplikatuz. Baina hitzez hitz itzultzeko teknika erraz hori aspaldi baztertu zen bideragarri ez zelako eta ezagutzen diren sistema guztiek, espainola eta katalana bezalako hizkuntza oso hurbilen artean itzultzen dutenek barne (InterNOSTRUM), mota bateko edo besteko tarteko adierazpenak erabili nahi dituzte. Metodo ez zuzen mota bi dago: "hizkuntza artekoa" edo interlingua eta "transferentziakoa".

[aldatu] Interlingua

Sakontzeko

 Sakontzeko, irakurri: Interlinguan oinarritutako itzulpengintza automatikoa

Hizkuntz arteko metodoak itzuliko diren hizkuntzen artean komuna den tarteko adierazpen bakar baten bidezko itzulpena planteatzen du, eta horrek itzulpena soilik esaldi bitan egitea zilegi egiten du: analisia eta sortzea. Bere kontzepzio teorikoan zehatz-mehatz jasotzen du hizkuntzalari unibertsalen ideia eta bere garairik oparoena hirurogeita hamargarren hamarkadan izan zuen Adimen Artifizialak proposatzen zuen ezagutzaren adierazpen ereduen aplikazioarekin. Metodo hori gomendatzen dute testu bat itzultzeko lehenago ulertu beharra dagoela esaten dutenek. Informazio semantikoa ezagutza oinarri batean jasota egon ohi da (munduaren eredu bat) eta itzultze prozesuan zehar eskura izaten da.

Metodo hori oso ospetsua izan zen Japonen hirurogeita hamar eta laurogeigarren hamarkadetan, orduan garrantzitsua zen enpresa informatiko orok bere itzulpen proiektu propioa izan behar zuen: "ATLAS" (Fujitsu), "PIVOT" (NEC), eta abar. Egun oraindik dugun japoniar proiektu bat "UNL" da (Universal Networking Language , United Nations University-rena). AEBetan hizkuntza artekoan oinarrituriko zenbait proiektu burutu izan da: "KBMT" (Carnegie Mellon University), "ULTRA" (New Mexico State University), "PANGLOSS" (CMU, NMSU eta University of Southern California), "UNITRAN" (University of Maryland); halere, kasu guztietan unibertsitateetan buruturiko ikerketa proiektuak izan dira, eta horietatik bat ere ez da merkaturatze fasera iritsi. Europan hizkuntza arteko inspiraziodun proiektu bi aipa daitezke, "DLT" (BSO holandar enpresarena), esperantoa darabilena hizkuntza arteko gisa, eta "ROSETTA" (Philips), Montague-ren gramatikan oinarrituta.

[aldatu] Transferentzia

Sakontzeko

 Sakontzeko, irakurri: Transferentzian oinarritutako itzulpengintza automatikoa

Transferentzia metodoaren alderdi bereizlea tarteko adierazpen bi proposatzen duela da, bat itzulpen bikotearen hizkuntza bakoitzeko. Adierazpen horien gainean jatorrizko testuaren analisia eta xede testuaren sortzea, horrela, itzulpena hiru fasetan burutuko da: analisia, transferentzia eta sortzea. Transferentzia egiten deneko maila alda daiteke sistema batetik bestera. Transferentzia maila lexikoan, sintaktikoan zein semantikoan burutu daiteke.

  • Transferentzia lexikoa: pareko terminoa bilatzen da xede hizkuntzan hiztegian den informaziotik abiatuta.
  • Transferentzia sintaktikoa: jatorrizko perpausaren analisirako zuhaitza sortze zuhaitza bilakatzen da, xede perpauserako parekoa dena.
  • Transferentzia semantikoa: adierazpen sakonak transformatzen dira, kasu ereduak, sare semantikoak edo egitura logikoak esaterako.

Transferentzia semantikoa hizkuntza arteko teknikatik oso gertu dago. Metodo horrekin diseinatu diren sistemarik ezagunenak honakoak izan dira: METAL, MÉTÉO, SUSY. EUROTRA, "LOGOS" eta "GETA" (Grenobleko Unibertsitatea).

[aldatu] Analogia bidezko itzulpena

Laurogeita hamargarren hamarkadan izandako ikuspegi aldaketak onura izan zuen mikroprozesadoreak eta bilketarako unitateak merkatu egin zirelako. Horrekin, formatu elektronikodun testu bildumak areagotzen hasi ziren eta Interneti esker eskuragarri zeudenez, jadanik ahozko corporan hain emaitza onak izan zituzten aukera eta lotura metodoak probatzeko gonbidapena egin zen. Diseinaturiko sistema kopurua (Catizone eta beste batzuk 1993, Kay eta Röscheisen 1993; Vogel eta beste batzuk 1996, Wu 1996 ella Tillman eta beste batzuk 1997) areagotu egin zen, hain zen horrela, ezen arau bidezko itzulpenaren paradigmak jarraitzaile ugari galdu baitzituen analogia bidezko itzulpenaren ponerako (Jones 1992). Birpasa ditzagun ikuspegi horren lau alderdi: itzulpen estatistikoa, adibideetan oinarrituriko itzulpena, corpora paraleloen segida eta itzulpen memoriak.

  • Metodo estatistikoak
  • Adibideetan oinarrituriko itzulpena
  • Corpora paraleloen lerrotzea
  • Itzulpen memoriak

[aldatu] Metodo estatistikoak

Sakontzeko

 Sakontzeko, irakurri: Estatistiketan oinarritutako itzulpengintza automatikoa

Estatistika itzulpen automatikoan metodo erabilgarri gisa Warren Weaver-ren hausnarketa eragin zuen 1949. Berragertu egin zen 1990ean "CANDIDE" sistemarekin, IBM.ren "Thomas J. Watson Center-reko" taldeak garaturikoa Nueva York-en (Brown et al. 1990). Hizketa antzemateko teknika estokastiken bidez lortutako arrakastaren ostean, taldeak itzulpenekin proba egitea erabaki zuen. Ikuspegia analisirako zein sortzeko estatistika ez zen beste informaziorik ez erabiltzeko proba egitearen postulatutik planteatu zen. Esperimentua Kanadako Parlamentuko Akten Hansard corpusaren gainean egin zen (hiru milioi bat esaldi ingelesez eta frantsesez). Lehenengo eta behin perpausak, hitz multzoak eta hitz solteak zerrendatu ziren geroago kalkulatu ahal izateko hizkuntza batean perpausa bateko hitz batek itzulpenean beste hitz batzuekin bat etortzeko zituen aukerak. Emaitzek ikerlariak beraiek harritu zituzten, itzulitako perpausen ia erdia jatorrizko testuan zirenak bezalakoak baitziren bahiz eta hitz ezberdinekin eratu. Sistema ez zen merkaturatu, baina ikerketak birbideratzeko gertaera historikoa suposatu zuten. Egindako azken ekarpenen artean, "University of Southern Californiako" ISI taldearena azpimarra daiteke, "EGYPT-ek" garatzen duena hain zuzen ere, alegia, corpora elebidunetik abiatuta estatistikan oinarrituriko sistemak eratzeko software pakete bat.

[aldatu] Adibideetan oinarritutako itzulpena

Sakontzeko

 Sakontzeko, irakurri: Adibideetan oinarritutako itzulpengintza automatikoa

Itzulpen estatistikoaren antzera, corpora elebidunen disponibilitatean oinarrituriko antzeko ikuspegia da "adibideetan" oinarrituriko itzulpena (AOIA). Hasiera batean japoniar Makoto Nagao ikerlariak 1981ean proposatu zuen, baina teknika ez zen hamarkadaren amaiera arte probatu Kyoto-ko Unibertsitateko Nagao-k berak eta DLT (Sadler, 1989) proiektuaren taldeak Holandan batera egin arte. Hipotesiak dio, itzulita dauden testuak itzulpen berrien eredu izan daitezkeela. Metodoa testu elebidunen corpus batetik, aurretiaz lerrokatua, perpausa edo sintagmak atera eta hautatzean datza. Tsuji eta beste batzuek (1991) eta Sumita eta Iida-k (1991) horren antzeko ikuspegi hibridoak aplikatu dituzte. Adibideetan oinarrituriko itzulpena itzulpen memoriak deritzotenen garapenean oinarriturik dago (Sato eta Nagao, 1991).

[aldatu] Corpora paraleloen lerrotzea

Analogietan oinarritutako itzulpena corpora elebidunen menpe dago nahita nahiez, eta horrek lerrokatze teknikak itzulpen automatikoan interes handien duen ikerketa arloetako bat bilakatu du. Lerrokatzea corpus elebidunaren zatien arteko korrespondentzia erlazio esplizituak egitea da. Martinez-i (1999) jarraituz, hiru ikuspegi nagusiri buruz mintza gaitezke:

  • Ikuspegi estatistikoa: Corpusean diren ezaugarri kuantitatibo batzuen antzekotasuna aprobetxatzen duen lerrokatze metodoa, esaterako, perpausen luzera, hitz edo karakter kopurua, eta abar. (Brown eta beste batzuk, 1991; Gale eta Church, 1991).
  • Ikuspegi linguistikoa: Lerrokatzea aurretiaz unitate sintagmatiko edo menpeko egiturak parekatzean datza (Sadler, 1991; Kaji eta beste batzuk, 1992; Matsumoto eta beste batzuk, 1993).
  • Ikuspegi mistoa: kategoria gramatikalen identifikazioa lerrokatze estatistikorako laguntza legez erabiltzen duen metodoa (Chen, 1993).

Ohar sintaktikoetan oinarritzen diren aukera teknikek aurretiaz eginiko oharrak behar dituzte (Black eta beste batzuk, 1993). Brown corpusa edo Penn Treebank-a (Marcos eta Santorini, 1991) ingeleserako erabilgarri izan dira. Beste hizkuntza batzuetan ere ezagutzen dira ohar sintaktikodun corporak: turkieran /Skut eta beste batzuk, 1997), txekieran (Hajic eta Hladká, 1998), alemaneran (Oflazer eta beste batzuk, 1999). Euskararen kasuan sintaktikoki 10.000 hitz etiketatu dira (Ezeiza eta beste batzuk, 1998). Prozesu hauek asko kostatzen dute, metrika batzuek (Voutilainen, 1997) atera duten ondorioa izan da, urte betez entrenaturiko pertsona baten lana behar dela sintaktikoki 200.000 hitzetako corpus bat etiketatzeko. Martinezek (1998 eta 1999) oso emaitza onak izan ditu etiketa sintaktikorik ez duen espainol eta euskarazko corpus batean, segmentatze elebakarraren prozesuan sartutako egitura etiketak aprobetxatzen dituzten teknikak aplikatuz. Lan era hori DEL taldeak egun Deustuko Unibertsitatean duena da.

[aldatu] Itzulpen memoriak

Sakontzeko

 Sakontzeko, irakurri: Itzulpen memoria

Analogietan oinarrituriko itzulpenak "itzulpenaren memoria" izenaz ezaguna den teknologian izan du bere garapenik handiena. Teknika, eskuz egin eta giza itzultzaile batek onetsiriko itzulpenak biltzean datza, ostean, antzeko testuak itzultzean berriro erabiltzeko. Teknologia honek arrakasta handia izan du merkatuan hazten ari zen software pakete kopurua dela eta; pakete horiek memorien kudeaketa moduluak dituzte datu terminologikoak, lerrokatze automatikoak eta formatuak aldatzeko filtroak sortu eta gordetzeko programez gain. Ezagunenak honakoak dira: "DÉJÀ-VU" (ATRIL), "Translator's Workbench" (TRADOS), "TRANSIT" (STAR), "SDLX", "Eurolang Optimizer" (LANT), "CATALYST"(ALCHEMY), "WORDFAST", eta abar. Gaur egun, merkatuan den liderrik argiena alemaniar TRADOS enpresarena da, gero eta hurbilago DÉJÁ-VU duelarik, halere, hurrengo urteetako konpetentzia gogorra izango da. Programa batzuek (WORDFAST), dohainik izan ohi dira bezeroak bereganatzeko. Hortaz, badirudi hainbeste beldurtzen dituen monopolioa urrun dagoela. Sanchez-Gijon (2001) eta Nogueira-k (2002)emaitza interesgarri eta balorazio pertsonalak izan dituzten azterketa konparatiboak egin dituzte.

[aldatu] Sistemarik aipagarrienak

Ikastaroarekin amaitzeko, gaur egun arte gure artean aritu izan diren arau bidezko itzulpen sistema klasiko batzuen birpasa zehatzagoa egingo dugu. Laurogeita hamargarren hamarkadaren amaiera arte izan diren azpimarragarrienak birpasatuko ditugu, geroago Internet bidez eskuragarri izan direnetan zentratzeko. Azken hauek bereziki interesgarriak dira ikastaroaren ariketa praktikoak egiteko berorietan oinarritu beharra dagoelako. Amaitzeko, itzulpen automatikoak etorkizunean izango duen ildo nagusiari buruzko pare bat komentario egingo dugu, lokalizatzea hain zuzen (materia horrekiko aparteko modulua dago).

[aldatu] Laurogeita hamargarren hamarkada arte

Laurogeita hamargarren hamarkada arte, zalantzarik gabe, inoiz diseinatu izan den sistemarik nabarmenena "SYSTRAN" izan da. Ez da sistema bakar bat, arbaso komuna duen sistema familia bat baizik. Arbaso hori berrogeita hamargarren hamarkadaren amaieran sortu zuen Peter Toma-k Georgetown-eko Unibertsitatean. Geroago, Saarland.eko Unibertsitatera, Europa mailan hizkuntzalaritza konputazionalean aitzindari, igaro zen 1964an. (Saarbrücken-en geroago "SUSY" eta EUROTRA modulu batzuk garatu ziren). Berriro AEBetan, 1986an Tomak Latsec Inc. Sortu zuen La Jolla-n, Kalifornia, USAF-ekin (AEBetako aire-indarrak) lankidetzarako kontratu batek animaturik. SYSTRAN NASA-k erabili zuen zoritxarreko Apollo Soyouz espazio proiektuan 1974 eta 1975 artean. Esperientzia hark ospea eman zion eta Toma ingelesa/frantsesa bikotearen artean EB-erako erakustaldia egiteko gonbidatu zuten. Emaitzek konbentziturik, 1975ean Batzordeak lizentzia eskuratu eta berezko hizkuntza bikoteak garatzen hasi zen gramatikak eta lexikoiak barne administrazio testuen ezaugarrietara egokituz. Egun, EB-eko sistemak hizkuntza zerbitzuen sare lokalean sartu diren 17 hizkuntza bikote ditu, EURAMIS (Strandvik, 2000), Batzordeko langileen artean arrakastatsua dena. 1980ko hamarkadan, beste enpresa batzuek ustiatzeko eskubideak bereganatu zituzten: Wold Translation Corporation Kanadan, SYSTRAN Institute Alemanian, SYSTRAN Corporation Japonen; horrela bada, zenbait urtetan zehar programaren bertsio ezberdinak oso sakabanatuta egon ziren. Laurogeita hamargarren hamarkadaren hasieran Gachot frantziar enpresak filial guztiak bereganatu zituen EB-ekoa izan ezik, eta sistema oso ezaguna bihurtu zen Frantzian Minitel-en bidez zuen eskuragarritasuna zela kausa. 1994an doan eskaintzen zen CompuServe-ko chat-etan. 1995ean, Windowserako bertsio egokitu bat atera zuten. Dena den, behin betiko ospea 1997an lortu zuen, Internet Altavistako tokia SYSTRANekin akordio batera heldu zenean web bidezko doako itzulpen zerbitzu eskaintzeko, BABELFISH. Une honetan, SYSTRAN da itzulpen sistemarik garatuena (35 hizkuntza bikote ditu eskuragarri) eta erabiliena (1.000.000 itzulpen BABELFISHen bitartez).

Antzinatasun eta garrantzian bigarren sistema dudarik gabe, "METAL" da. Hirurogeigarren hamarkadatik bizirik dirauen beste bat da, SYSTRAN bezala, kontinente bietatik ibilia dena. Jatorrizko diseinua 1961ean egin zen LRC-an ("Linguistic Research Center") Austinen den Texaseko Unibertsitatean, Winfred Lehman zuzendari zelarik, ingelesa/alemanera bikoterako. METALen patua kontinente zaharrera igaro zen 1978an, SIEMENS enpresa garapen eta ustiatze eskubideen jabe egin zenean hain zuzen. Hasierako bikoteari berehala beste zazpi gehitu zitzaizkion europar hizkuntza nagusiekin (frantsesa, nederlandera, daniera eta espainola). 1994an SIEMENS-NIXDORF-ek horretarako hain zuzen sortutako filial talde bati eman zion sistemaren garapena, horien artean Alemaniako Sietec eta Espainiako Incyta. 1997an Lernout-Hauspie talde belgikarrak bereganatu zituen. Gaur egun, METALen garapen ezberdinak Sail Labs enpresaren menpe daude. Azpimarratzekoa da Espainian ingeles/ katalanera hizkuntza bikotea (ITACA proiektua) eta espainola/katalanera (IncytaEsCA) garatu direla Kataluniako Gobernuak ordainduta, bai eta espainola/galiziera bikotearena ere Galiziako Gobernuak ordainduta.

Espainola eta ingelesaren arteko itzulpen automatikoari heltzeko, segur aski osatuena eta emaitzarik onenak ematen dituena Panamerikar Osasun Erakundeak (PAHO/OPS) garatutakoa da, Washington DC-an dago eta 1950ean sortu zen. Bertsio bi dago, hizkuntza bikoteko bana: "SPANAM" (espainola/ingelesa), 1979an garatzen hasi zen lehena, eta "ENGSPAN" (ingelesa/espainola) 1984tik garatzen ari dena. Arduradunek egiten ari denetik 35 milioi hitz baino gehiago prozesatu direla esaten dute, eta itzultzaileen ekoizpena %30 eta %50 artean igo dela. Sistemak aire sare batean instalaturik daude eta OPS-aren egoitzako beste sail tekniko eta administratiboetako langileek ere erabiltzen dituzte. Sistemako hiztegi bakoitzak 75.000 hitz baino gehiago dauka, esaldi idiomatikoak eta testuinguru arauak. Programak eta hiztegiak etengabe hobetzen dira erabiltzen dutenen iradokizunei esker. Sistema biak duela gutxi atera dira merkatura Windowsekin bateragarri diren bertsioetan eta arrazoizko prezioan (1.600 €).

Beste alde batetik, informatikaren maisua den IBM-k laurogeigarren hamarkadaren erditik, Michael McCord-ek zuzendu eta era berean AEBetako, Alemania, Espainia eta Israeleko laborategietan garatzen den "LMT" itzulpen automatikoaren proiektuan jarri ditu indar gehienak. Transferentzia estrategia hartzen duen Prolog-en egindako inplementazio bat da (LMT "Logic-programming Machine Translation-en" laburdura da). 12 hizkuntza bikote garatu dira eta gaur egun eskuragarri daude "WebSphere" merkatal izenarekin. IBMk ere badu itzulpen memorietako software bat "TranslationManager", 1999tik sektorean den antzinako beste enpresa baten, "LOGOSen", itzulpen automatikorako programak dituena. Programa hori italiera/ingelesa itzultzailearekin, "PeTra", ere konbina daiteke, IBMren lankidetzarekin italiar SYNTHEMA enpresak garatua.

1990.hamarkadaren hasieratik, itzulpen programa gehienak ordenagailu pertsonalera egokitu izan dira. Lehenengo egin zutenetako bi "PC-Translator" (Linguistic Products-ena) eta "Power Translator" (Globalink-ena) izan ziren. Globalink-ek bat egin zuen lehenago MicroTac-ekin ("Language Assistant" produktu sortako arduraduna eta urte batzuetan (1995-1998) salmenta liderra izan zen bere programak oso prezio merkean merkaturatu zituelako (60 bat €) Ovum Ltd-ren datuen arabera,. Globalink-ek 1995ean METALek baino hiru aldiz mozkin gehiago lortu zuen eta SYSTRAN edp LOGOSek baino hamar aldiz gehiago. 1998an Lernourt-Hauspie-k Globalink bereganatu zuten eta gaur egun, 2000n enpresak izandako diru arazoak gertatu ostean ez dakigu ezer. Fujitsu enpresa japoniarrari dagokionez, aspaldi da PC-rako bere "ATLAS" sistema beteranoaren, "TransLingo-k" ere merkaturatutakoaren, bertsioak arrazoizko prezioan (100 eta 600 €) ezaugarrien arabera) eskaintzen dituen enpresa aitzindaria. Windowsera egokituriko beste japoniar itzultzaile batzuk dira "Language Engineering Corporation-en" "LogoVista" eta "Tsunami" eta "Typhoon" Neoner Technologies-ena (geroago Lernout-Hauspiesek bereganatua). Errusiarra da "ProMT" (lehenago "Stylus" deitua) eta "PARS" programak, biak errusiera beste europar hizkuntza batzuetara itzultzen berezituak. Europan garaturiko PC-rako beste programa aipagarri batzuk dira "WINGER", danierara itzultzen berezitua baina beste europar hizkuntza batzuen bikoteak euskarri izanik, eta "TranSmart" Nokiak garatua finlandiera/ingelesa bikoterako.

Espainian espainola/katalanera bikotearen arteko itzulpenerako programa batzuk garatu dira. Incyta-k (orain Sail Labs) garatutakoaz gain, galizierako ere egin duena, honako beste hauek azpimarra daitezke: Windowserako "SALT" sistema interaktiboa, Valentziako Gobernuaren Kultura Kontseilaritzarena; "InterNOSTRUM", Linux-erako, Alacanteko Unibertsitateak garatu eta Mediterraneoko Aurrezki Kutxak finantzatua; Bartzelonako Softlibrary (El Peridico egunkaria katalanera itzultzen dutenak) enpresaren "AutomaticTrans" sistema; baita Valentziako ARA-AutoTrad enpresaren "ARA" programa ere.

[aldatu] Web aroa

Itzulpen teknologiak dituzten produktuen panoramak pizgarri logikoa izan du Interneten orokortzearekin 1995etik aurrera. CompuServe aurreratu egin zen SYSTRAN eskainiz bere chat guneetan. Doako itzulpen automatikorako BABELFISH zerbitzua 1997an martxan jarri izana (frantses, alemanera eta espainola ingelesetik eta ingelesera bikoteetarako) AltaVista atarian gertakari historikoa izan zen. Harrezkero, gertakariak azkarrago eman dira. Zenbait enpresa desagertu edo beste batzuek bereganatuak izan dira. IBMk Logos; Lernout-Hauspik Globalink eta Neocor Technologies. Programak eskuratzeko prezioa askoz merkeagoa da eta banaketa azkartu egin da atari orokorren bitartez, adibidez, World Language Resources (http://www.worldlanguage.com). Internetekin lehen imajinaezinak ziren gauza bi egun zilegi dira. Batetik, fabrikatzaile askok aukera ematen dio bezero izan daitekeenari eskuratu eta instalatzeko errazak diren aldi baterako frogatzeak edo partzialak ikusteko. Bestetik, eta interesgarriagoa dena, orain Interneterako sarbidea duen edozein erabiltzailek gero eta ugariagoak diren itzulpen automatikorako zerbitzu ireki eta doakoetako bat probatzeko aukera du:

Zehaztu behar da antzeko hizkuntzen artean lan egiten duten sistemak izan ezik, zerrendan den sistema batek ere ez duela kalitatezko itzulpenak eskuratzeko aukerarik ematen lehenago emandako arrazoiak direla kausa. Guztiak dira arau bidezko itzulpen sistemak, hedapen handia dute baina normalean txarra den kalitate baten kalterako. Alternatiba hedapena murriztea da. Kalitatea hobetzeko hedapen handiagoa duten analogian oinarrituriko metodoak aplikatuta, corpora paralelo kopuru handia beharko litzateke, egun inork ez duena (Abaitua, 2001).

[aldatu] Lokalizazioa

Bukatu aurretik, merezi du minutu batzuk eskaintzea bitarteko elektronikoan hobekien txerta daitekeen itzulpen motari, "lokalizatzea". Ikuspegi horrek bi alderdi berri ditu: itzulpena dokumentazioaren bizitzaren zikloan beste maila bat bezala tratatzea, eta itzulpen ideiari produktua merkatuaren eskaeretara egokitzearena. Dokumentazioaren bizitza zikloa

Informazioaren industriak duen ekoizpen katean pentsatzen badugu, gero eta zentzu gutxiago du itzulpengintza zeregin autonomo edo isolatu gisa tratatzeak. Egunero sortzen diren testu gehienak ez dira jatorrizkoak, behin eta berriro errepikatzen dira, aldaketa txikiak eta kontu eguneratuak baino ez dituzte: jatorrizko testuak, erreferentzia manualak, erabilera instrukzioak, lege xedapenak, txostenak, parteak, teletipoak, …Dokumentu ekoizpen mota hori itzulpen eskaeren portzentajerik handiena osatzen dute. Hortaz, garrantzitsua da itzulpena ez ezik, agirien bizitza ziklo osoa ere kontrolatzen uzten duten metodo eraginkorrak izatea (sortzea, idaztea, birpasa, itzulpena, banaketa, katalogatzea, biltzea, berrerabiltzea, kalitatea kontrolatzea). Ildo horretatik, azken urteotan garrantzia handia hartu dute nazioarteko estandar eta arauek, bai dokumentu ekoizpenean ("SGML/XML"), bai kalitatearen kontrolean, industri prozesuarena bere osotasunean ("ISO 9000") zein bereziki itzulpenarena ("DIN 2345").

[aldatu] Globalizazioa vs lokalizazioa

Hasieran diseinatua izan zenerako ez eta orain ezberdina den produktu edo zerbitzu bat merkaturatzean, bezero berrien hizkuntzara itzulita egon behar du, eta horrekin batera, merkatu horren berezitasun kultural, sozial, ekonomiko eta abar guztiak kontuan izan behar ditu. Horrek kontu linguistikoak ez diren beste asko kontu hartu behar izatea dakar eta produktuaren diseinua bera berriro aztertu behar izatea ere ekar dezake.Diseinu ona da merkatu batean erabilera jakin batekin zerikusia duten alderdiak produktuak berak dituen berezitasun orokorretatik bereizten dituena, era horretan nazioarteko bilakatzen utzi eta geroago beste merkatu batzuetara egokitzeko aukera duena. Merkatuak nazioarteko bilakatzen diren heinean, produktuak eta zerbitzuak erabiltzaileen toki betekizun eta gustu pertsonaletara egokitu behar dute (Esselink, 1998).

Zalantzarik gabe, mundua gero eta globalizatuago egon arren ez dio hizkuntza eta kultura anitza izateari utziko. Horregatik, informazioaren gizartea deritzon garai berri honetan, itzulpenaren teknologiek zeregin gorena dute.

Itzulpen automatikoaren alorrean, berau burutzeko baliagarriak diren sistema ezberdinak daude. Bi alor nagusi bereiz daitezke: Erregela linguistikoetan oinarritzen direnak AOIA eta corpusetan oinarrituak. Azken hauetan bi hurbilpen oso ezberdin bereizten dira: estatistiketan eta adibideetan oinarritutako sistemak.

[aldatu] Kanpo loturak

[aldatu] Oinarrizko bibliografia

Doug Arnold, Balkan, L., Meijer, S., Humphreys, R.L. Sadler, L. 1993. Machine Translation: An Introductory Guide. http://clwww.essex.ac.uk/MTbook/

Paul Bennett. 1994. Translation Units in Human and Machine. Babel 40:12-20.

Bert Esselink. 1998. A practical guide to software localization. John Benjamins.

Ethnologue. 2001. Languages of the World. http://www.ethnologue.com

W. John Hutchins & Harold L. Somers. 1992.An Introduction to Machine Translation. Academic Press.

W.John Hutchins. 2001. Machine translation over fifty years. Histoire, Epistemologie, Langage XXII-1:7-31. http://ourworld.compuserve.com/homepages/WJHutchins/HEL.htm.

Martin Kay. 1997. The Proper Place of Men and Machines in Language Translation. Machine Translation 13:3-23.

Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins .

Sergei Nirenburg. 1987. Machine Translation: Theoretical and Methodological Issues. Cambridge University Press.

Johnatan Slocum. 1988. Machine Translation Systems. Cambridge University Press.

[aldatu] Aipamenak

ALPAC. 1966. Language and machines: computers in translation and linguistics. A report by the Automatic Language Processing Advisory Committee. Washington, DC, National Academy of Sciences.

Y. Bar-Hillel. 1960. The present status of automatic translation of languages. Advances in Computers 1: 91-163

A. Barr & E.A. Feigenbaum. 1981. The Handbook of Artificial Intelligence.

Douglas Biber & Edward Finegan. 1986. An initial typology of English text types. Jan Aarts y Willen Meijs (comp.) Corpus Linguistics II: New Studies in the Analysis and Exploitation of Computer Corpora. Rodopi: 19-46.

Daniel Jones. 1996. Analogical Natural Language Processing. UCL Press

Susan Hubbard. 1996. Information Skills for an Information Society: A Review of Research

Hubert Murray. 1996. Methods for Satisfying the Needs of the Scientist and the Engineer for Scientific and Technical Communication.

Danilo Nogueira . 2002. Translation Tools Today: A Personal View. Translation Journal 6-1.

V. Sadler. 1989. Working with analogical semantics: disambiguation techniques in DLT. Foris

Pilar Sánchez-Gijón. 2001. Catàleg de sistemes de memòries de traducció. Tradumàtica 0.

S. Sato & M. Nagao. 1990. Toward Memory-based Translation. Proceedings of the 13th International Conference on Computational Linguistics. Helsinki: 247-252.

E. Sumita y H.Iida. 1991. Experiments and Prospects of Example-Based Machine Translation. Proceedings of the Association for Computational Linguistics. Berkeley: 185-192.

Ingemar Strandvik. 2001. Las memorias de traducción en la Comisión Europea. Tradumàtica 0.

Anna Trosborg. 1997. Text typology: register, genre and text types. Text typology and translation. 3-23. John Benjamins.

Static Wikipedia 2008 (March - no images)

aa - ab - als - am - an - ang - ar - arc - as - bar - bat_smg - bi - bug - bxr - cho - co - cr - csb - cv - cy - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - jbo - jv - ka - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nn - -

Static Wikipedia 2007 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -
https://www.classicistranieri.it - https://www.ebooksgratis.com - https://www.gutenbergaustralia.com - https://www.englishwikipedia.com - https://www.wikipediazim.com - https://www.wikisourcezim.com - https://www.projectgutenberg.net - https://www.projectgutenberg.es - https://www.radioascolto.com - https://www.debitoformativo.it - https://www.wikipediaforschools.org - https://www.projectgutenbergzim.com