Czytelnia / Technologie tłumaczeniowe

Jakość systemów MT może być ponadto poprawiona poprzez wypracowanie bardziej wyszukanych metod lub poprzez nałożenie pewnych norm na tekst źródłowy. Przykładowo, można projektować systemy służące jedynie do tekstów ograniczonych do podjęzyków (słownictwo i gramatyka) z danego zakresu tematycznego (np. biochemii) i/lub do określonego typu dokumentów (np. patentów). Ewentualnie, teksty źródłowe mogłyby być pisane ściśle kontrolowanym językiem, który ograniczałby zakres słownictwa, unikając homonimów i polisemii oraz złożonych struktur składniowych. Trzecia możliwość wymagałaby zaznaczenia w tekstach źródłowych (edycja wstępna) przedrostków, przyrostków, podziału słów, syntagmów i zdań składniowych oraz rozróżnienia kategorii gramatycznych (np. rzeczownika cónvict – pol. skazaniec, więzień oraz homonimicznego czasownika convíct – pol. skazać). Ostatecznie sam system może stwarzać dla jego użytkowników (zwykle tłumaczy) problemy z wieloznacznością i wyborem podczas procesu tłumaczenia w trybie interaktywnym.

Systemy przeznaczone są dla par poszczególnych języków (systemy dwujęzykowe) lub dla więcej niż jednej pary języków (systemy wielojęzykowe). Systemy dwujęzykowe mogą być przeznaczone do tłumaczenia w jedną stronę (jednokierunkowe), np. z japońskiego na angielski lub w obie strony (dwukierunkowe). Systemy wielojęzykowe są zazwyczaj dwukierunkowe; większość systemów dwujęzykowych jest jednokierunkowa.

Wyróżnia się trzy podstawowe rodzaje tłumaczeń w ogólnym projektowaniu systemów. Pierwszy rodzaj (najstarszy pod względem historycznym) określany jest ogólnie jako „tłumaczenie bezpośrednie” - system MT jest zaprojektowany w najdrobniejszych szczegółach specjalnie dla jednej wybranej pary języków, np. rosyjskiego jako języka tekstu oryginalnego (języka źródłowego) oraz angielskiego jako języka na który teksty są tłumaczone (języka docelowego). Tłumaczenie ma miejsce bezpośrednio z tekstu języka źródłowego (ang. source language, SL) na język docelowy (ang. target language, TL). Zgodnie z podstawowym założeniem, analiza słownictwa i składni tekstu w języku źródłowym ogranicza się jedynie do rozwiązania wieloznaczności, poprawnej identyfikacji wyrażeń języka źródłowego i specyfikacji szyku zdań języka docelowego; innymi słowy, analiza języka źródłowego jest zorientowana na jeden wybrany język docelowy. Zazwyczaj systemy takie składają się z dużych słowników dwujęzycznych i pojedynczego monolitycznego programu służącego do analizowania i generowania tekstów; takie systemy „tłumaczeń bezpośrednich” muszą być dwujęzykowe i jednokierunkowe.

Drugą podstawową strategią projektowania systemów jest podejście interlingua (język pośredni), które zakłada, że możliwe jest przetwarzanie tekstów źródłowego na więcej niż jeden język. Z takich reprezentacji interlingua generowane są teksty w innych językach. Tłumaczenie składa się zatem z dwóch etapów: z języka źródłowego (SL) na język interlingua (IL) oraz z interlingua na język docelowy. Procedury analizy języka źródłowego są w zamierzeniu zorientowane na język źródłowy, a nie na określony język docelowy; podobnie programy do syntezy języka docelowego są zorientowane na język docelowy, a nie projektowane ze względu na dane źródłowe w określonych językach źródłowych. Prostym argumentem przemawiającym za podejściem interlingua jest ekonomia wysiłku w środowisku wielojęzykowym. Tłumaczenie z n języków wymaga n(n-1) dwujęzycznych „bezpośrednich” systemów tłumaczeniowych, lecz w przypadku tłumaczenia za pośrednictwem interlingua, wymaganych jest jedynie 2n pośrednich programów.