Czytelnia / Technologie tłumaczeniowe

Na tej zasadzie porównują oni „uzasadnione językowo” systemy EBMT z jednym z systemów RBMT opartych na transferze danych (leksykalne „wstrząsnąć i przypiec”)- jako że ten rodzaj systemu (w przeciwieństwie do innych systemów RBMT) również nie dokonuje transferu strukturalnego.

Zamierzeniem jest jasne przedstawienie statusu baz danych opierających się na przykładach. Jeśli EBMT można przedstawić jako odpowiadający operacyjnie systemowi (takiemu jak leksykalny RBMT), który nie korzysta z bazy danych opartej na przykładzie, wtedy albo system EBMT musi być zdefiniowany bez odniesienia do bazy danych, albo charakterystyka EBMT musi opierać się raczej na nabywaniu wiedzy, a nie jej użyciu - co, podobnie jak Somers, autorzy odrzucili jako ważny czynnik określający ten system. Istotne jest, jak zdania są rozkładane podczas procesu dopasowywania EBMT, w porównaniu z analizą w leksykalnym RBMT. Jakikolwiek system tłumaczenia MT (maszynowego) musi analizować konstrukcje, których nie da się przetłumaczyć grupowo; system taki potrzebuje dostępu do zbioru „kontekstów niemonotonicznych” (przykładów). W RBMT, zbiór jest otrzymywany (tworzony) ze słownika lub z innych źródeł tekstowych; w EBMT zbiór zastosowany operacyjnie może zostać również zaczerpnięty ze źródła (bazy danych opartych na przykładzie) jako „wiedza jawna”. W takim wypadku „informacja językowa użyta przez EBMT jest nie do odróżnienia od tych użytych przez leksykalne MT”. Niemniej jednak w innych projektach EBMT można znaleźć bezpośrednie odniesienie do baz danych opartych na przykładzie podczas przetwarzania zdań (tzn. podczas procesu tłumaczenia). W takim przypadku zbiór jest użyty jako baza danych „wiedzy jawnej”. Turcato i Popowich twierdzą, że jedynie w momencie, gdy EBMT w trakcie tłumaczenia stosuje pełną oryginalną bazę danych przykładów, można je jasno odróżnić od systemów RBMT.

Innymi słowy, pierwotna koncepcja „tłumaczenia przez analogię” (wprowadzona przez Nagao) oznacza „najbardziej charakterystyczną technikę EBMT” i jest „tą, w której zastosowanie pełnych przykładów jest najbardziej uzasadnione. Taki pełny dostęp może zaistnieć, jeśli system EBMT nie przetworzył jeszcze przykładów („wiedza jawna”).  Sugerują oni, że jedyne prawdziwe systemy EBMT to te, w których informacje nie są wcześniej przetworzone, ale pozostały nienaruszone i niezbadane w procesach dopasowywania i usuwania, tzn. jak systemy w zbiorze Carla-Waya stosujące przykładowe bazy danych jako wiedzę „niejawną”, na bieżąco. Nawet takie zastosowanie nie definiuje wreszcie EBMT, jako że „tłumaczenie przez analogię” może być w zasadzie rozszerzeniem tradycyjnego systemu transferu MT w celu rozwiązywania przypadków niejednoznaczności wyrazów, na których istnienie nie można odnaleźć bezpośredniego dowodu w bazie danych tłumaczenia” [5].

W rezultacie Turcato i Popowich uważają, że najbardziej słuszna definicja EBMT nie jest ważna; najważniejsze to tworzyć dobre systemy tłumaczenia maszynowego (MT). Jednakże takie wnioski niosą za sobą dwa główne problemy. Po pierwsze, dla obserwatorów i innych badaczy MT nie stanowi to żadnej pomocy, gdy sami użytkownicy EBMT twierdzą, że jego definicja nie istnieje; chcą oni jednak wiedzieć, czym tak naprawdę EBMT różni się od innych projektów tłumaczenia maszynowego. Po drugie, ograniczenia nałożone na EBMT do wykorzystywania „wiedzy niejawnej” wydawać się mogą zbyt wąskie jedynie na bieżąco, ponieważ wykluczałyby większość badań zapisanych w zbiorze Carla-Waya i podczas ostatnich konferencji naukowych. Z drugiej jednak strony stwierdzenie, że w rezultacie, system tłumaczenia jest systemem EBMT, gdyż tak sądzą jego autorzy, nie jest wyczerpującym uzasadnieniem.

--

[5] To przyczyniło się do powstania dzieła na temat EBMT, autorstwa Sumity (1990).