Czytelnia / Technologie tłumaczeniowe

Istnieją pewne nieścisłości w tym, co możemy uznać za EBMT, poczynając od nieuporządkowanych ciągów bez zmiennych na jednym końcu spektrum, do schematów zależności zdań wejściowych i przykładowych na drugim. Sam „prosty” sposób dopasowywania ciągów wejściowych (po segmentacji) do nieuporządkowanych zdań przykładów SL (ciągi o „powierzchniowej” strukturze) byłby oczywiście przyjęty jako prawdziwe EBMT (np. Somers 1994). Generalizowanie ciągów w formie sekwencji zdań ze zmiennymi (np. szablony „I do care for the X”  [Troszczę się o …], „X gave the Y his particulars”  [X dał Y swoje informacje], „Do you want a room costing X dollars?” [Czy chce Pan pokój za 100 dolarów?]) jest postrzegane jako uzasadnione i stanowi naturalną technikę rozwoju zaprojektowaną, by ulepszyć wywoływanie odpowiednich przykładów z bazy danych.

 „Problematyczne” w EBMT (jeśli chodzi o zdefiniowanie struktur) jest analizowanie zdań (składowych) jako zależności i drzewkowe interpretacje struktury wyrażeń, czy też zastosowanie jedynie do zdań wejściowych lub przykładowych w bazie danych, lub do obu (np. Watanabe 2003, Menezes i Richardson 2001). Wydawałoby się, że można przyjąć fakt, iż systemy są włączane do struktury EBMT, jeśli analiza składniowa ogranicza się jedynie do jednej części odpowiedników SL-TL, np. tylko do zdań SL w bazie danych, lub do odpowiadających im zdań TL, oraz przypadków, gdy system bada ciągi „powierzchniowe” (ze zmiennymi).

Jednak, gdy wszystkie procesy systemu (wstępne przetwarzanie, dekompozycja danych wejściowych, dopasowywanie, usuwanie, rekombinacja) są oparte na analizie składniowej przedstawionej w interpretacji drzewkowej, należy się zastanowić, jaka jest różnica między procesami transdukcji drzewkowej w systemach RBMT (np. w projekcie Eurotra).  Pomimo, że te systemy znajdują się na krawędzi spektrum EBMT (tzn. przez największe uogólnianie przykładów), nie można ich wciąż uwzględnić w kategorii systemów RBMT. Powodem jest to, że procesy transdukcji drzewkowej w tego rodzaju systemach EBMT oparte są na porównaniach i wyborach interpretacji drzewkowej, która składa się z elementów leksykalnych oraz powstaje z korpusu dwujęzycznego zdań przykładowych SL i TL. Dlatego też procesy „transferu” są oparte na przykładach, ponieważ ich działanie odnosi się do baz danych par zdań i wyrażeń SL-TL.

Natomiast schematy drzewkowe RBMT obejmują zarówno elementy leksykalne, jak i kategorie gramatyczne (N- rzeczownik, NP-grupa rzeczownika, PP- grupa przyimka itd.) i „drzewka” są przekształcane zgodnie z regułami dotyczącymi zarówno węzłów leksykalnych, jak i gramatycznych (i podgrup). W systemach RBMT transdukcja drzewkowa opiera się na zasadach stosowanych do abstrakcyjnego przedstawiania kategorii, jak również elementów leksykalnych. Systemy RBMT mogą czerpać zasady z dwujęzycznych baz danych, czy to manualnie, czy (pół)automatycznie, jednak korzystanie z takich zasobów nie sprawia, że mogą być one nazywane systemami EBMT.

W związku z powyższym, pomimo, że procesy dekompozycji i rekombinacji w tego typu systemach EBMT są identyczne z procesami analizy i syntezy w systemach RBMT, nadal pozostaje wyraźna linia podziału dotycząca głównego procesu „transferu”opartego na regule czy na przykładzie. Można jednak stwierdzić, że „nie istnieje żadna znaczna różnica pomiędzy przykładami translacyjnymi a regułami translacyjnymi…można je traktować jednakowo; to znaczy, przykład translacyjny jest szczególnym przypadkiem reguł translacyjnych, których węzły tworzą elementy leksykalne, a nie kategorie” (Maruyama i Watanabe 1992: 183). Wobec tego takie systemy EBMT z przedstawieniami podobnymi RBMT i przetwarzaniem drzewkowym podobnym RBMT wydają się wariantami tradycyjnych RBMT. Niepewność pozostanie i prawdopodobnie lepiej byłoby odnosić się do nich jako do „systemów hybrydowych” EBMT i RBMT.