Czytelnia

Porównania są dokonywane na podstawie niezredagowanego materiału docelowego. Powszechnie uważa się, że nie powinno to być jedyne kryterium oceny przydatności systemów (np. do wytwarzania tekstów o jakości nadającej się do druku) oraz że jedynie poprzez analizę niezredagowanych tekstów docelowych, a nie funkcji poedycyjnych, można stwierdzić, czy poprawiła się jakość oprogramowania MT. Bez względu na cel wykorzystania (rozpowszechnienie, asymilacja itd.) im wyższa jest jakość wstępnego tłumaczenia, tym bardziej „przydatny” może być system. Oceny powinny m.in. określać, czy pod względem jakości tłumaczenia nowy produkt (lub nowa wersja) jest lepszy od poprzedniego (lub starszej wersji).

By analiza była bardziej przejrzysta, ograniczyłem się do systemów rosyjsko/angielskich z lat sześćdziesiątych i siedemdziesiątych, angielsko/francuskich z połowy lat siedemdziesiątych oraz francusko/angielskich i niemiecko/angielskich z początku lat osiemdziesiątych i późniejszych. Wybrałem przykłady autentycznych tłumaczeń i porównałem je z materiałem docelowym wyprodukowanym przez współczesny system na podstawie tych samych tekstów.

Niektóre z nich są jednak niespodziewanie dobre, można zatem przypuszczać, że zostały sfabrykowane dla celów reklamowych.
Część z poniższych przykładów sprawia trudności nawet doświadczonym tłumaczom, co możne wskazywać na fakt, że niektóre zostały tak dobrane, by pokazać wady MT. Z drugiej strony, to właśnie przy pracy nad takimi trudnymi tekstami osoby słabo znające język najchętniej wspomagałyby się systemem MT.

Porównania z obecnymi systemami ograniczono do programów komercyjnych, powszechnie dostępnych i/lub internetowych usług MT. Przykłady rosyjsko-angielskie zostały porównane z: (a) materiałem uzyskanym z programu Systran (tj. ostatnią wersją tego programu – Systran Personal 4.0) oraz dwóch witryn internetowych (Babelfish i Lycos) – najczęściej wszystkie trzy programy przedstawiały identyczne wyniki, choć czasem zdarzały się różnice; oraz (b) materiałem wyjściowym programu PROMT On – line i/lub jego ostatniej wersji @promt Standard. W przypadku przykładów francusko-angielskich, znów wykorzystano program Systran, a także materiał wyprodukowany przez programy internetowe FreeTranslation oraz Reverso. Porównania pary językowej niemiecki/angielski przeprowadzono na materiale decelowym programów Systran, Personal Translator PT, Reverso oraz Free Translation.

Artykuł ten jest poszerzoną wersją referatu przedstawionego na IX spotkaniu podczas konferencji dot. tłumaczeń maszynowych w Nowym Orleanie we wrześniu 2003 roku. Pomimo że przedstawia więcej dłuższych fragmentów oraz zawiera przykłady pochodzące z systemów przed- i nieoperacyjnych, nie uwzględniono tu kompletnych tekstów i tłumaczeń. Będą one dostępne w osobnych plikach na mojej stronie internetowej, która jest zaczątkiem bazy danych lub też archiwum starszych systemów MT. Mam nadzieję, że z czasem, w miarę odkrywania kolejnych przykładów w dokumentach, sprawozdaniach firm oraz archiwach ekip badawczych, baza danych zacznie się poszerzać.

 

2. Rosyjski/Angielski

2.1. IBM-USAF Translator, 1959

Pierwszy autentyczny materiał wyjściowy stworzony przez oprogramowanie MT był owocem działania systemu rosyjsko-angielskiego, opracowanego przez Gilberta Kinga dla US Air Force Foreign Technology Division (Odział Technologii Zagranicznej Amerykańskich Sił Powietrznych) w Dayton, w stanie Ohio. System ten opierał się na urządzeniu o dużej pojemności pojęciowej słownika („pamięciowe urządzenie fotoskopowe”). Zasadniczo był to program działający na bazie słownika, którego tłumaczenie miało charakter dosłowny, a pozycje leksykalne zawierały wskazówki dotyczące zmian w materiale docelowym przy spełnieniu konkretnych warunków. Początkowo w skład tych warunków wchodziły jedynie określone elementy leksykalne oraz zależności między kategoriami gramatycznymi.