Czytelnia / Technologie tłumaczeniowe

Ostatnio, metody oparte na korpusach językowych zmieniły tradycyjny obraz MT (patrz poniżej). W ciągu pięciu ostatnich lat zaczęła pojawiać się „trzecia generacja” systemów hybrydowych łączących podejście oparte na regułach wcześniejszych rodzajów oraz nieco późniejszych metod opartych na korpusach. Różnice pomiędzy podejściem bezpośrednim i pośrednim, transferem i interlingua, opartym na regułach, wiedzy i korpusach stają się coraz mniej przydatne dla kategoryzacji systemów.

Systemy transferowe zawierają cechy systemów interlingua (dla pewnych obszarów słownictwa i składni); systemy interlingua zawierają komponenty systemów transferowych; systemy oparte na regułach w coraz większym stopniu używają prawdopodobnych danych i stochastycznych metod; systemy statystyczne i oparte na przykładach używają tradycyjnych kategorii i elementów gramatycznych opartych na regułach, itd. Te ostatnie osiągnięcia uwydatniają to, w co zawsze wierzono, a mianowicie, że badania na tłumaczeniem maszynowym i systemy MT przyjmują zróżnicowane metodologie w celu rozwiązywania problemów dotyczących całego pasma zjawisk językowych, itd. Stworzenie operacyjnego systemu MT jest siłą rzeczy długoterminowym zadaniem mechanicznym z zastosowaniem dobrze znanych, niezawodnych i sprawdzonych technik.

2. Prekursorzy i pionierzy, 1933-1956

Użycie słowników mechanicznych w celu pokonania barier językowych po raz pierwszy zaproponowano w XVII wieku. Jednakże, to w XX wieku podano pierwsze konkretne propozycje w postaci niezależnych wynalazków opatentowanych w 1933 roku przez Georga Artsrouniego, pochodzenia armeńsko-francuskiego oraz przez Rosjanina – Piotra Smirnov-Trojańskiego. Artsrouni zaprojektował urządzenie pamięciowe na taśmie papieru, które mogło być używane do znalezienia ekwiwalentu jakiegokolwiek słowa w innym języku; w rzeczywistości prototyp został zademonstrowany w 1937 roku. Propozycje Trojańskiego były z perspektywy czasu bardziej znaczące. Przewidział on sobie trzy etapy tłumaczenia mechanicznego: najpierw, redaktor znający tylko język źródłowy, miał podjąć „logiczną” analizę słów do ich podstawowych form i funkcji składniowych; następnie, maszyna miała za zadanie przekształcić sekwencje podstawowych form i funkcji w ekwiwalentne sekwencje w języku docelowym; ostatecznie inny korektor, znający jedynie język docelowy, miał przetworzyć wynik na poprawne formy swojego języka. Trojański przewidywał zarówno tłumaczenia dwujęzykowe jaki i wielojęzykowe. Mimo że jego wynalazek zakładał, że maszyna mogłaby wykonać jedynie drugi etap, Trojański był przekonany o tym, że „proces logicznej analizy mógłby być zmechanizowany”.

Trojański wyprzedził swoją epokę ale nie był znany poza Rosją, gdzie w ciągu kilku lat od jego wynalazku, możliwość wykorzystania komputerów w tłumaczeniu została przedstawiona przez Warrena Weavera z Rockefeller Foundation oraz przez Andrew D. Bootha, brytyjskiego krystalografa. Po swoim powrocie do Birkbeck College (Londyn), Booth zbadał mechanizację słowników dwujęzycznych i rozpoczął współpracę z Richardem H. Richensem (Cambridge), który niezależnie używał kart perforowanych w celu stworzenia dokładnego tłumaczenia słowo w słowo fragmentów tekstów naukowych. Jednakże to nota Weavera opublikowana w czerwcu 1949 roku skupiła powszechną uwagę na idei tłumaczenia mechanicznego (Weaver 1949). Naszkicował on perspektywy i zasugerował różne metody: użycie technik kryptograficznych z  czasów wojny, metod statystycznych, teorii informacji Shannona oraz wykorzystanie podstaw logiki i uniwersalnych cech języka, „podstawy komunikacji międzyludzkiej”.