Adibideetan oinarritutako itzulpengintza automatikoa
Adibideetan Oinarritutako Itzulpen Automatikoa (AOIA edo EBMT, Example Based Machine Translation), datu-base batean gordeta dauden corpus elebiduna oinarri hartuta itzulpena egiten duen sistema da. Aurrez eginda dauden itzulpenetan oinarritzen da sistema, patroi linguistikoak bilatzeko. Domeinu konkretuetarako da erabilgarria batez ere eta gainontzeko metodoen osagarritzat har daiteke.
Funtzionamendua
[aldatu | aldatu iturburu kodea]EBMT sistema batek, sarrerako testua adibideen datu-basearekin parekatzen du eta adibide egokiak erauzten ditu. Bukaerako itzulpena adibide hauen arteko konbinaziotik etorriko da. Oinarrian, beraz, corpus elebidun parekatua dago. Parekatzea esaldi mailakoa edo sakonagoa izan daiteke, esaldiaren zati txikiagotara helduz.
Parekatzeko datu-basea ezin da nahi bezain beste handitu, bere tamainak baduelako muga bat, adibideen artean gatazkak (adibide berdinak itzulpen ezberdinekin) sortzen direnean, hain zuzen.
Behin datu-basetik itzulpenak eskuratuta, hizkuntzen arteko parekatzea eta testu-zatien arteko konbinazioa egin behar da eta ez da lan samurra. Hizkuntzen arteko parekatzean, itzulpenetako zatiak jatorrizko testuaren zein zatiri dagokion ebatzi behar da eta horretarako hiztegi elebidunak eta analizatzaile morfologikoak erabil daitezke. Zati hauek, segidan, konbinatu egingo dira azken itzulpena emateko.
Corpus elebidunaren adibideak
[aldatu | aldatu iturburu kodea]- Euskaraz: Zenbat balio du auto horrek?
- Ingelesez: How much is that car?
- Euskaraz: Zenbat balio du arkatz horrek?
- Ingelesez: How much is that pencil?