Apertium

El Vikipedio, la libera enciklopedio
Saltu al: navigado, serĉo

Apertium estas platformo de aŭtomata tradukado aŭ maŝintradukado, programar-libera kun permesilo GNU GPL. Apertium estis originale desegnita de la Universitato de Alakanto por traduki inter similaj lingvoj, kvankam poste estis vastigita por povi trakti pli malproksimajn lingvoparojn.

Nuntempe estas disponeblaj tradukilojn por la sekvaj lingvoparoj:

Pro sia programar-libera karaktero, la lingvaj datumoj, same kiel la programoj, estas libere alireblaj kaj uzeblaj ĉe http://www.sf.net/projects/apertium.

Historio[redakti | redakti fonton]

La komenca desegno de Apertium baziĝis sur traduksistemo evoluigita de la grupo Transducens de la Universitato de Alakanto, kiu permesis la tradukon inter parencaj lingvoj kiel la kataluna kaj la hispana (interNOSTRUM) aŭ la portugala kaj la hispana (Universia). Fine de 2006 oni publikigis la version 2.0 de la traduk-motoro, kiu permesis pritrakti malpli interrilatantajn lingvoparojn, kiel la katalunan kaj la anglan, danke al pli potenca struktura transfero. La 1an de oktobro 2007, en rilato al la enkonduko de Esperanto en la sistemon, oni publikigis la version 3.0, permesantan la uzadon de Unikodo kaj per ĝi la traktadon de multaj pliaj lingvoj.

En decembro 2007 estis publikigitaj la unuaj tradukiloj al Esperanto. Temis pri du tradukiloj: el la kataluna kaj la hispana lingvoj. Ilin evoluigis la Universitata Instituto pri Aplikita Lingvistiko, ligita al la universitato Pompeu Fabra, en Barcelono, kun kunlaboro de la Departemento pri Lingvoj kaj Komputadaj Sistemoj de la Universitato de Alakanto, kaj de Kataluna Esperanto-Asocio. La tradukilojn mendis la entrepreno ABC-Enciklopedioj, prizorganta i.a. la multlingvan portalon http://www.abc-pack.com. [1]

En februaro 2009 estis publikigita unua versio de la tradukilo el la angla al Esperanto, evoluigita de Jacob Nordfalk.[2]

Konsisto[redakti | redakti fonton]

La platformo provizas:

  • lingvosendependan maŝintradukan motoron
  • ilojn por administri la lingvajn donitaĵojn necesajn por konstrui maŝintradukan sistemon por ĉiu lingva paro
  • lingvajn donitaĵojn por kreskanta nombro de lingvaj paroj.

Funkciado[redakti | redakti fonton]

Dosiero:AT01.gif
Ĝenerala skizo de maŝintraduka procezo

Apertium uzas supraĵan transferan maŝintradukan motoron, t.e. ĝi ne faras sintaksan analizon de la tuta frazo antaŭ ol ektraduki. Krome ĝi procezas la enirtekstojn laŭstadie, kiel en ĉenstablo:

  1. aspektigado, t.e. traktado de la nelingvaj elementoj, kiuj rilatas al la prezentado de la teksto (grasaj aŭ kursivaj literoj, HTML-markiloj k.s.)
  2. morfologia analizo
  3. leksik-kategoria precizigo, per statistikaj analizoj surbaze de la morfologio de la ĉirkaŭaj vortoj
  4. malprofunda struktura transfero, t.e. uzado de reguloj ŝanĝantaj strukturajn aspektojn malsamajn inter la fonta kaj cela lingvoj
  5. vort-transfero
  6. morfologia generado
  7. reaspektigado, t.e. restarigo de la nelingvaj prezento-elementoj en la konvenaj lokoj (t.e. se graslitera adjektivo staris post nomo, ĝia cellingva ekvivalento, eble antaŭ la nomo, devas esti grasigita)

Ekzemple, kiam Apertium tradukas el la hispana 'canto' al Esperanto 'mi kantas' en la frazo 'canto una canción', ĝi:

  • faras morfologian analizon kaj trovas, ke 'canto' povas esti la unua persono de singularo de la estanta tenso de la indikativa modo de la verbo 'cantar', aŭ la nomo 'canto'
  • laŭ la kunteksto precizigas, ke temas pri verbo-formo
  • sekvante strukturajn transferajn regulojn, aldonas personan pronomon de la unua persono de singularo antaŭ la verbo, ĉar ĝi ne estas uzata en la hispana, sed estas necesa en Esperanto
  • transferas la leksikajn elmentojn, t.e. 'cantar' estas tradukita al 'kanti'
  • fine, generas la morfologiajn formojn en Esperanto, t.e. la pronomo alprenas la formon 'mi' kaj la verbo kanti fariĝas kantas, laŭ la morfologiaj indikoj

Entute, ju pli lingvoj estas strukture similaj, des pli la struktura transfero donas trafajn rezultojn. Ĉar Apertium ne faras plenan sintaksan analizon de la frazoj (kio estas tre komplika, tre ofte plur-ebla kaj ofte malsukcesa dum analizado de la reala lingvo), la struktura transfero povas esti nur malprofunda, t.e. ĝi povas baziĝi nur sur la analizo de la ĉirkaŭaj vortoj anstataŭ de tuta frazo. Tio, ekzemple, malfaciligas, ke en katalunlingva ĉu-demando, en kiu oni ofte ekscias, ke ili estas demandaj, nur per la fina demandosigno, Apertium sukcesu generi la vorton 'ĉu' komence de la frazo dum la traduko al Esperanto.

Uzado[redakti | redakti fonton]

Eblas uzi Apertium por konstruadi maŝintradukajn sistemojn por diversaj lingvo-paroj. Tiucele, Apertium uzas simplajn XML-bazitajn normajn formatojn por kodi la bezonatajn lingvajn donitaĵojn (aŭ mane aŭ per transformado de ekzistantaj donitaĵoj), kiuj estas kompilitaj per la provizitaj iloj en la rapidajn formatojn uzatajn de la motoro.

Referencoj[redakti | redakti fonton]

  1. http://www.liberafolio.org/2008/komputraduko
  2. http://sourceforge.net/mailarchive/forum.php?thread_name=20cf28cd0902031753j20ea0d23kce6a22340aa236b3%40mail.gmail.com&forum_name=apertium-stuff

Eksteraj ligiloj[redakti | redakti fonton]

Oni povas provi la sistemon en http://xixona.dlsi.ua.es/apertium/ (stabilaj versioj)
kaj http://xixona.dlsi.ua.es/apertium-unstable (malstabilaj versioj).