Czytelnia / Technologie tłumaczeniowe

8. EBMT i SMT

Początkowo różnice między SMT i EBMT były zauważalne: dane wejściowe SMT były rozkładane na poszczególne wyrazy SL, a wyrazy TL były usuwane przez dane częstotliwości (w „modelu translacyjnym”), podczas gdy w EBMT dane wprowadzane były rozkładane na fragmenty SL i przykłady TL (w formie odpowiadających fragmentów) usuwane z bazy danych. Bardziej współczesne rozbudowanie modeli SMT opartych na wyrażeniach i na składni zatarło te różnice.

W systemach SMT opartych na wyrażeniach i na składni, analiza składniowa odbywa się z wielu powodów: aby udoskonalić wyrównywanie (np. Watanabe 2002), lub ułatwić dopasowywanie ciągów danych wprowadzanych (bardziej niż poszczególnych wyrazów, np. Koen i Knight 2003), a także umożliwić analizę zdań wprowadzanych jako wyrażenia (np. Czarniak 2003) i dopasowywanie do zdań w bazie danych po analizie składniowej . Istnieje zatem podobna rozbieżność (jak w systemie EBMT) pomiędzy systemami, w których analiza składniowa stanowi część fazy wczesnego przetwarzania oraz tam, gdzie jest ona (również) częścią analizy (dekompozycji) i fazy dopasowywania. Niemniej jednak, systemy SMT zachowują charakterystyczne użycie „modeli translacyjnych” i „modeli językowych”, oraz większość procesów pozostaje oparta na wyrazie lub ciągu wyrazów.

Takie zastosowanie w SMT modeli opartych (częściowo lub całkowicie) na drzewkach zależności bardziej niż na ciągach powierzchniowych stanowi „zbieżność” w kierunku tych systemów EBMT, które również działają w interpretacji analizy składniowej. Jeśli chodzi o SMT i EBMT oparte na wyrażeniach, wydaje się, że oba te systemy można postrzegać jako warianty tego samego schematu. Jedynymi nieznacznymi różnicami jest to, że; podczas gdy SMT działa głównie na podstawie metod statystycznych, EBMT - z kolei na bazie fragmentów językowych (symbolicznych) oraz przykładów tekstowych.

9. Wniosek


Potrzeba zdefiniowania EBMT jest spowodowana zawiłą różnorodnością technik, które były omawiane jako „oparte na przykładach” i trudnością wskazania miejsca istotnej „struktury” EBMT w wielości opisów systemów EBMT. Jak pokazują ostatnie dwa ustępy, istnieją przypadki, w których podejście do EBMT wydaję się trochę różne od tego odnoszącego się do RBMT i SMT. Próba zdefiniowania EBMT polega na dostarczeniu badaczom i obserwatorom „archetypu” (porównywalnego do definicji systemów RBMT, które rozróżniały systemy oparte na transferze i na interlingua, podczas gdy w praktyce niewiele systemów operacyjnych odpowiadało temu archetypowi pod każdym względem).

Próba stworzenie definicji EBMT w tej pracy pokazała, że charakterystyczną cechą EBMT pozostaje założenie (hipoteza), iż tłumaczenie pociąga za sobą odnajdywanie „analogii” (podobieństwa znaczenia i formy) zdań SL w istniejących tekstach TL. W przeciwieństwie do tego, ani SMT ani RBMT nie działają z odpowiednikami: SMT stosuje statystycznie wytworzone wyrazy i odpowiedniki wyrażeń, a RBMT działa na zasadzie przedstawień (zdań, zdań składowych, wyrazów itp.) „ekwiwalentnych” znaczeń. Jako że EBMT zajmuje pozycję pośrednią między RBMT a SMT i używa zarówno statystycznych (podobnych SMT) oraz symbolicznych i językowych metod (podobnych RBMT), jest otwarty na większą różnorodność metodologii i, w wyniku tego, bardziej skomplikowany do opisania i zdefiniowania.

--

[8] Ogólny model analizy składniowej wyrównanych tekstów dwujęzycznych patrz praca Dekai Wu [Wu (2000) i bibliografia zwarta w tejże książce].