Czytelnia / Technologie tłumaczeniowe

W świetle wysuniętej definicji, różnice zaznaczone przez Turcato i Popowicha (2003) między wykonawczym EBMT i innymi systemami są również drugorzędne. W systemach wykonawczych cała baza przykładów jest udostępniana i podlega wszelkim manipulacjom wymaganym podczas procesów dopasowywania i usuwania (np. Sumita 2003). Takie zastosowanie baz danych jest pomocnicze (istotne) dla głównego procesu przetwarzania wejściowego SL na wyjściowy TL. W innych systemach EBMT, analiza bazy danych powstaje podczas działań przygotowawczych, przed tym, jak rzeczywiste teksty SL (zdania wprowadzane) są przetwarzane na tłumaczenie - tzn. jawne działania podrzędne (np. McTait 2003).

Argument, że systemy, które nie mają dostępu do całego korpusu podczas translacji nie są „prawdziwymi” systemami EBMT, nie jest już prawdziwy. Liczy się sposób, w jaki fragmenty SL są przetwarzane na fragmenty TL w głównym procesie (transferu). Skąd pochodzi i jak jest zbudowana „baza wiedzy” jest także czynnikiem drugorzędnym, choć nadal istotnym. Z tego względu znajomość EBMT zastosowana podczas głównego procesu może zostać przygotowana wcześniej jako „wiedza jawna” lub dopasowana (dostosowana) do danego tekstu wejściowego jako „wiedza niejawna” podczas procesu translacji. To może mieć ważne konsekwencje w obliczeniach, jak również przy przywoływaniu i precyzji w zachowywaniu i wyborze przykładów, ale wybór pomiędzy wiedzą „jawną a niejawną” pozostaje czynnikiem drugorzędnym (jeśli chodzi o definicję EBMT). Dlatego też mamy dwa podtypy EBMT zaliczające się do ogólnego schematu określonego powyżej. Rzeczywiście, jeśli weźmiemy pod uwagę rodzaje systemów opisanych w zbiorze Carla i Waya, otrzymamy prawdopodobnie więcej niż dwa podtypy, gdyż można dostrzec wyraźne różnice między systemami posiadającymi pochodne struktury (drzewka).

Podsumowując: systemy MT są systemami EBMT, jeśli główny proces „transferu” (lub przetwarzania SL-TL) pociąga za sobą dopasowywanie fragmentów SL (zdań, zwrotów, ciągów) pochodzących z tekstu wprowadzanego, dopasowywanie tych fragmentów do bazy danych przykładowych tekstów dwujęzycznych (w formie ciągów, szablonów, interpretacji na drzewkach), oraz uzyskiwanie odpowiednich fragmentów TL (jako częściowe tłumaczenia). Bazy danych EBMT pochodzą w głównej mierze z korpusu dwujęzycznego tłumaczeń wykonywanych przez ludzi, są wcześniej przetwarzane w formach odpowiednich dla procesów dopasowywania i usuwania podczas procesu tłumaczenia (tzw. procesy wykonawcze). Procesy analizy (dekompozycji) i syntezy (rekombinacji) są odpowiednio określane, by przygotować tekst początkowy na dopasowywanie go do bazy danych i otrzymać gotowy tekst.

7. EBMT a RBMT

Zaproponowana definicja nie precyzuje struktury „bazy wiedzy” (bazy danych przykładów) ani też rodzajów przedstawień przykładów zawartych w głównym procesie „transferu”. Niemniej jednak, bez względu na ich formę - zwyczajnych ciągów „powierzchniowych”, ciągów ze zmiennymi, szablonów czy strukturalnych przedstawień (drzewkowych)- istotne jest, że pochodzą z rzeczywistych przykładów zdań w SL i TL. Jeśli takie interpretacje przyjmują formy podobne (lub nawet identyczne) do występujących w systemach RBMT, powstaje pytanie, czy ich włączenie nie wykracza za bardzo poza ramy EBMT. Im więcej bada się tekstów wprowadzanych i bardziej złożone są przykłady w bazie  danych, tym mniej EBMT wydaje się różnić od tradycyjnych RBMT.