Czytelnia / Technologie tłumaczeniowe

2. Początkowe koncepcje EBMT

Zgodnie z główną definicją, możemy wyróżnić następujące procesy EBMT: wyrównywanie tekstów, dopasowywanie zdań źródłowych do zwrotów (przykładów) w korpusie, wybór i usuwanie odpowiednich wyrażeń w języku docelowym, adaptacja i łączenie wyrażeń języka docelowego w celu uzyskania poprawnych zdań.

Wydaje się, że w pierwotnej koncepcji (np. Nagao 1984), EBMT było postrzegane głównie jako środek przezwyciężania niedoskonałości systemów RBMT, mianowicie ich niedokładności podczas tłumaczenia między językami różniącymi się znacząco strukturalnie, tak jak angielski i japoński, a w konsekwencji uzyskania wyniku dobrej jakości - szczególnie w zastosowaniu kolokacji, np. tłumaczenia yabureru w zdaniu: „Torba została zniszczona” (The bag was broken) oraz „Prezydent został pokonany w wyborach” (The president was defeated in the election), czy w różniących się tłumaczeniach japońskiego słowa kakeru w zależności od „kontekstu”: powiesić (hang) coś na drzewie, położyć (put) coś na czyimś ramieniu, okryć (cover) kogoś lub coś [2]. W związku z tym należy traktować te przykłady podobnie jak inne teksty SL lub TL, tzn. jako przedstawienia „drzewkowe”. Stąd też zdania wprowadzane zostały zbadane najdokładniej jak to możliwe oraz zastosowano w nich transfer (przeniesienie) przy użyciu przykładów, w których zawiodły reguły i „drzewka”.

Powstały dwie teorie: niektórzy badacze (np. Sumita 1990) stosowali przykłady do zastępowania (udoskonalania) systemów RBMT i nie byli pewni, czy EBMT może lub powinno obejmować całość procesu translacji, podczas gdy inni (np. Sato i Nagao 1990) byli przekonani do badań „czystych” systemów EBMT, w których podstawowy proces został przeprowadzony w poszukiwaniu przykładów zdań języka docelowego „analogicznych” do zdań języka źródłowego, a reguły stosowane były w takich przypadkach, kiedy nie można było odnaleźć przykładów w bazie danych.

Obydwie te teorie istnieją nadal. Z jednej strony, metody oparte na przykładzie są praktycznie stosowane w systemach RBMT i postrzegane jako rozwinięcie tradycji tłumaczenia maszynowego (MT), a z drugiej, istnieje przekonanie, że EBMT oznacza nowy „paradygmat”- jako że wielu badaczy SMT twierdzi, iż struktura MT to nowy model, paradygmat. (Osobiście jestem niechętny używaniu określenia „paradygmat”, gdyż pociąga za sobą prawie całkowite unieważnienie i odrzucenie wszystkich badań przeprowadzonych w tej dziedzinie - Kuhn (1962) postrzegał pierwotnie powyższe określenie, łącząc je z teoriami powiązanymi z naukami ścisłymi, w szczególności z fizyką. Podczas gdy niektórzy badacze zajmujący się tematyką SMT mogą traktować swoje metody jako zupełnie nowatorskie, inni w ostatnich latach zaczęli wprowadzać rozwiązania dawniejsze. W przypadku EBMT wydaje się, że większość naukowców postrzega swoje wysiłki jako kontynuację podejścia tradycyjnego i wyraża uznanie dla swoich poprzedników. Z tych powodów wolę odnosić się do nowych „struktur” lub „ram” [3].

--

[2] Pierwsze przykłady pochodzą z Nagao 1984, drugie z Sato i Naao 1190.
[3] Można twierdzić, że metody oparte na korpusie językowym jako całość oznaczają nowy kierunek w przeciwieństwie do poprzednich metod opartych na regule. Tak jak poprzednia praca została ponownie określona i zdefiniowana według nowych schematów, „nagłe” wprowadzenie MT opartego na korpusie językowym w późnych latach 80. może być określone mianem „zwrotu paradygmatu” w rozumieniu Kuhna. Może to być prawdą, mimo, że metody oparte na korpusie językowym były dosyć powszechne na początku badań nad MT (np. projekt Randa), przed tym jak powstanie gramatycznych formalizmów (Bar-Hillel, Harris, Chomsky i inni) doprowadziło do dominacji struktur opartych na regule w projektach MT.