Czytelnia / Technologie tłumaczeniowe

4. EBMT w ogólnym kontekście MT

W poniższym fragmencie podjęto próbę zdefiniowana EBMT z szerszej perspektywy, poczynając od rozpoznania głównych procesów i składników jakiegokolwiek systemu MT oraz tego, czym wspomniane procesy różnią się w RBMT, EBMT oraz w SMT.

W każdym systemie MT istotą jest proces, dzięki któremu elementy (jednostki, struktury, wyrazy itd.) tekstu wprowadzanego (SL - języka źródłowego) są zamieniane na odpowiadające im elementy tekstu gotowego (TL - języka docelowego), gdzie tekst wyjściowy (gotowy) jest tym samym (lub funkcjonalnie odpowiadającym) tekstem wprowadzanym [6]. We wszystkich przypadkach istnieją procesy „analizy” poprzedzające to główne przetwarzanie (lub „transfer”) i procesy „syntezy”  (lub „otrzymywania”) następujące po przetwarzaniu.

  1. W RBMT główny proces zachodzi z pośrednictwem słowników dwujęzycznych i reguł określających przetwarzanie struktur SL na struktury TL oraz/lub słowników i reguł do wytwarzania „struktur pośredniczących”, z których może powstać proces końcowy. Ta poprzedzająca faza analizy przetwarza fragmenty początkowe SL na odpowiednie „jednostki translacyjne” (np. kanoniczne formy rzeczowników i czasowników) i związki (np. zależności i jednostki syntaktyczne). Faza następująca po syntezie (lub otrzymywaniu) tworzy teksty TL ze struktur TL uzyskanych w głównym procesie „transferu” (lub „międzyjęzykowym”).
  2. W SMT, główny proces dotyczy „modelu translacyjnego”, który angażuje wyrazy lub sekwencje wyrazów („wyrażenia”) jako tekst wprowadzany SL i tworzy wyrazy lub ich sekwencje w tekście gotowym. Kolejna faza dotyczy „modelu językowego”, który syntetyzuje komplet wyrazów TL w „znaczące” ciągi, mające być odpowiednikami dla zdań wejściowych. W SMT poprzedzająca faza „analizy” to (trywialny) proces dopasowywania poszczególnych wyrazów lub ich sekwencji z tekstu wprowadzanego SL do elementów w modelu translacyjnym. Bardziej istotny jest etap przygotowawczy wyrównywania tekstów SL i TL z korpusu językowego i powstawania danych statystycznych częstotliwości dla „modelu translacyjnego” (lub dodawania danych statystycznych z korpusu do wcześniej istniejącego „modelu translacyjnego”.) Jednojęzyczny „model językowy” może, ale nie musi pochodzić z tego samego korpusu co „model translacyjny”.
  3. W EBMT, główny proces obejmuje wybór i uzyskiwanie fragmentów TL odpowiadających fragmentom SL. Proces ten poprzedza faza „analizy” rozkładającej zdania wejściowe na odpowiednie fragmenty (szablony ze zmiennymi) i ich dopasowywanie do fragmentów SL (w bazie danych). To, czy „dopasowywanie” dotyczy wcześniej złączonych fragmentów (szablonów uzyskanych z korpusu) lub powstały one na bieżąco i zawierają zmienne, czy też nie, są to wszystko czynniki drugorzędne. Faza następująca po procesie syntezy (lub „rekombinacji, jak odnosi się do niej większość autorów EBMT) przystosowuje uzyskane fragmenty TL i łączy je w zdania (wyniki) TL. Podobnie jak w SMT, wyróżniamy istotne fazy początkowe, które wyrównują zdania SL i TL w dwujęzycznej bazie danych, oraz te, które tworzą szablony lub wzory stosowane w procesach dopasowywania i usuwania.

--

[6] Ekwiwalencja znaczeniowa jest celem, lecz w praktyce tekst wyjściowy MT może być użyteczny, kiedy odejdziemy od tego zamierzenia, np. w kontekstach, w których czytelnicy nie tylko muszą zrozumieć i wyczuć istotę treści oraz/lub gdy tekst gotowy można redagować (edytować kolejno), aż do otrzymania odpowiednich do zaakceptowania tekstów.