Czytelnia / Technologie tłumaczeniowe

Materiał wyjściowy był surowy pod każdym względem, czasem ledwo zrozumiały, ale w przeciwieństwie do niektórych badaczy systemów MT, King nigdy nie miał wygórowanego zdania o swoim systemie. Mimo swych braków, system był w stanie zadowolić podstawowe potrzeby naukowców.

RAND Corporation (1950-1960) stanowi przykład podejścia empirycznego, które sceptycznie odnosiło się do ówczesnych teorii językowych i kładło nacisk na analizę statystyczną. Z dużych korpusów językowych (rosyjskie teksty dotyczące fizyki) przygotowano dwujęzyczne glosariusze zawierające informację gramatyczną i przykładowe reguły gramatyczne; napisano program komputerowy do szkicu tłumaczenia; rezultat został zbadany przez korektorów, którzy wskazali błędy; korpus ponownie przetłumaczono; proces tłumaczenia i korekty cyklicznie kontynuowano. Główną metodą analizy był rozkład statystyczny, jednak David Hays z RAND wprowadził jako pierwszy analizator syntaktyczny oparty na zależnościach gramatycznych.

Badania prowadzone przez Leona Dosterta w Georgetown University miały bardziej eklektyczny charakter i podejmowały empiryczną analizę tekstów tylko wtedy, gdy tradycyjne gramatyczne informacje były niewystarczające. Grupa z Georgetown była największą w USA, a wśród jej członków widoczne były znaczne różnice poglądów. Utworzono cztery grupy, z których każda miała przedstawić swoje metody testowe podczas otwartych zawodów dotyczących testu chemicznego w języku rosyjskim. Metoda „dopasowania kodów” Adriana Łukjanowa przyniosła wspaniałe rezultaty i to z pozoru z doraźnie dobranymi regułami typowymi dla korpusu. Metoda „analizy syntaktycznej” Paula Garlina (który przygotował językowe podstawy dla systemu pokazowego z 1954 roku) nie była zakończona w dniu zawodów; metoda tłumaczenia „zdanie po zdaniu” Anthonego Browna była przykładem empirycznej metody cyklicznej. Przyjęto metodę „analizy ogólnej” wypracowaną przez grupę pod przewodnictwem Michaela Zarechnaka i nazwano ją Georgetown Automatic Translation (GAT). Obejmowała ona trzy poziomy analizy: morfologiczną (w tym identyfikację idiomów), syntagmatyczną (uzgodnienie rzeczowników i przymiotników, przypadków czasownika, modyfikacje przymiotników, itd.) i składniową (podmiot i orzeczenie, związki pomiędzy zdaniami, itd.). Początkowo GAT zastosowano dla systemu SERNA, w dużej mierze dziele Petra Tomy (późniejszego twórcy Systran; Brown rozwinął wówczas metodę programowania dla swojego własnego systemu francusko-angielskiego). W tej formie została ona z powodzeniem zademonstrowana w 1961 i 1962 roku i w rezultacie rosyjsko-angielskie systemy zostały zainstalowane w Euratom w Ispra (Włochy) w 1963 roku oraz w Oak Ridge National Laboratory of the US Atomic Energy Commission w 1964.

Rozwój metody analizy składniowej kontynuował Paul Garvin w Ramo-Wooldridge Corporation w latach 1960-1967. Garvin poszukiwał drogi pomiędzy empirykami a perfekcjonistami. Jego metoda punktu podparcia była w dużej mierze analizą zależności składniowych, rozpoznaniem algorytmu wzorców językowych, które identyfikowały punkt podparcia struktury oraz relacje elementów zależnych względem punktu podparcia. Następnie Garvin wprowadził metody heurystyczne, korzystając z informacji statystycznych, gdy było to niezbędne. Ta metoda była także stosowana w Wayne State University (1958-1972) do rozwoju systemów rosyjsko-angielskich.

Anthony Oettinger z Harvard University był zwolennikiem gradualizmu. Od 1954 do 1960 grupa ta koncentrowała się na opracowaniu dużego słownika rosyjsko-angielskiego, który miał służyć za pomoc tłumaczom (poprzednik obecnie powszechnych komputerowych pomocy słownikowych) w wytwarzaniu nieopracowanych tłumaczeń słowo w słowo dla naukowców zaznajomionych z tematem oraz za podstawę dla bardziej zaawansowanych prac badawczych.