Czytelnia / Technologie tłumaczeniowe

6. Istota EBMT: definicja

Jeśli przyjmiemy, że istota każdego systemu MT znajduje się w metodzie (metodach) używanych do przetwarzania ciągu SL w ciąg TL, wtedy charakterystyczne cechy istotne dla struktur MT odnajdziemy w miejscach, dla których są one najbardziej znaczące. Systemy RBMT są zwykle rozróżniane po tym, czy transformacja SL-TL zachodzi za pośrednictwem struktury językowo-neutralnej (MT oparte na interlingua) przez transdukcję strukturalną od struktury SL do TL (MT oparte na transferze) lub przez częściowe przetwarzanie fragmentów SL na fragmenty TL przy użyciu słowników i reguł („translacja bezpośrednia” lub MT oparte na transformatorze). Porównywalnym działaniem w SMT jest „model translacyjny”, oparty na statystykach pochodzących z korpusów dwujęzycznych, które zamieniają wyrazy lub zwroty języka docelowego (TL) na wyrazy czy frazy języka źródłowego (SL). W systemach TM podobne działanie przeprowadzają translatorzy, którzy wybierają wyrażenia odpowiadające TL z możliwych wyborów zaprezentowanych w bazie danych (pamięć tłumaczeniowa).

Stąd istotą działania w EBMT jest dopasowywanie fragmentów SL (pochodzących z tekstu wejściowego) do fragmentów SL (w bazie danych) i uzyskiwanie odpowiednich fragmentów TL (jako potencjalne częściowe tłumaczenia). W tym kontekście fakt, czy „dopasowywanie” dotyczy wcześniej połączonych fragmentów (szablony pochodzące z korpusu) fragmenty są usuwane na bieżąco, czy też fragmenty (większe części tekstu) zawierają zmienne, stanowi czynnik drugorzędny – jakkolwiek byłby użyteczny w odróżnianiu podtypów EBMT (jak twierdzą Carl i Way w swoim dziele z 2003). Zdania wprowadzane można traktować jako całość, dzielić je na fragmenty lub nawet analizować na „drzewkach”.

Najważniejsze, że podczas przetwarzania (dopasowywania/uzyskiwania) istnieje odniesienie do przykładowej bazy danych, a nie, jak w RBMT, zastosowanie reguł i zasad do transdukcji struktur SL na struktury TL. W związku z tym „analiza” wejściowa SL jest czynnikiem drugorzędnym, jej forma zależy od sposobu stosowania przykładów w głównym procesie „transferu” (i przechowywania w bazie danych). Podobnie można twierdzić, że działania procesu syntezy („rekombinacji”), podobno najbardziej trudnego i złożonego w systemach EBMT, są wynikiem istoty tekstu wyjściowego powstałego w procesie dopasowywania/usuwania, tzn. tekst wprowadzany został rozłożony i otrzymano z bazy danych niepełne zdania. Podobnie wyrównanie korpusów dwujęzycznych stanowi proces drugorzędny, gdyż jest on wynikiem założenia, że dopasowywanie posiada dostępne zestawy odpowiadających fragmentów SL-TL. W rezultacie zastosowanie szablonów, użycie wzorów itd. to pomocnicze techniki w odniesieniu do głównego procesu EBMT.