Czytelnia / Technologie tłumaczeniowe

Cechy semantyczne i przypadków gramatycznych mogą być przyjęte jako uniwersalia w systemach interlingua i systemach transferowych. Kolejne kroki ku reprezentacjom interlingua zawierają rozkład elementów leksykalnych na "atomy znaczenia wspólne dla wszystkich języków (podstawowy zbiór cząstek umożliwiających rozróżnianie znaczeń) i analizę struktur w logiczne formy, np. w ramach predykatów i  argumentów. Podstawową trudnością takich analiz jest utrata informacji powierzchownej, która może być znacząca do stworzenia odpowiednich zdań w TL -  analiza logiczna może nie brać pod uwagę struktury temu i remu oraz może ignorować różnice w strukturach strony czynnej i biernej. Jednak głównym problemem systemów interlingua jest traktowanie różnic leksykalnych między dwoma językami, a w szczególności odpowiedź na pytanie czy interlingua powinna odzwierciedlać każdą różnicę semantyczną w danych językach, np. japońskie rozróżnienie wear nawet wtedy, gdy tłumaczenie ma miejsce pomiędzy francuskim a angielskim.

Wiele problemów odpiera tradycyjne językowe podejście. Rozpoznanie do czego odwołuje się zaimek może zależeć od (pozajęzykowej) wiedzy na temat zdarzeń czy sytuacji: The soldiers killed the women. They were burried next day. Wiemy, że zaimek they nie odnosi się do women, ponieważ wiemy, że „zabijanie” wiąże się ze „śmiercią” i po „śmierci” ma zazwyczaj miejsce „pogrzeb”. To rozpoznanie jest decydujące w przypadku języka francuskiego, gdzie zaimek w tym przypadku będzie elles a nie ils. (użycie anafory opisane zostało w rozdziale 14.).

Wiedza pozajęzykowa może być używana w wielu problemowych sytuacjach transferowych, np. czy wall jest wewnętrzna czy zewnętrzna (Wand i Mauer), czy river wpływa do morza czy nie (fleuve a rivičre), w zależności czy określony przedmiot jest ciemnoniebieski czy jasnoniebieski (sinii a goluboi), itd. Powyższe przykłady i wiele innych są przyczyną umieszczania w systemach TM  baz wiedzy jako dodatków do tradycyjnych analiz semantycznych bądź jako podstawowych mechanizmów analizy i transferu leksykalnego.

W perspektywie historycznej systemy TM oparte na zasadach stopniowo tłumaczenia wprowadzały „głębsze” poziomy analizy i transferu. Wczesne systemy dosłownego tłumaczenia ograniczały się do słowników dwujęzycznych i prostej morfologii. Późniejsze „bezpośrednie” systemy wprowadziły analizę i syntezę składniową. Struktura fraz i analizy zależności zapewniły podstawy działania prostych systemów transferowych z małą ilością analizy semantycznej („transfer składniowy”). Dodanie cech semantycznych i zależności przypadkowych doprowadziło do powstania bardziej popularnych obecniesemantyczno-składniowych systemów transferowych. Szersze wprowadzenie elementów i struktur interlingua lub struktur niby uniwersalnych charakteryzuje zaawansowane projekty transferowe i oczywiście systemy interlingua. Reasumując, pełna analiza koncepcyjno-semantyczna jest cechą systemów interlingua opartych na wiedzy osadzonych na sztucznej inteligencji lub wprowadzających różne techniki z nią związane.

Charakterystyczną cechą systemów opartych na zasadach jest transformacja (transdukcja) oznaczonych reprezentacji drzew, np. od drzewa morfologicznego do składniowego, od składniowego do semantycznego, itd. Zasady transduction wymagają spełnienia określonych warunków: drzewo musi mieć specyficzną strukturę i zawierać szczególne elementy leksykalne lub szczególne cechy (składniowe lub semantyczne). Co więcej, każde drzewo jest testowane przez „gramatykę” co do zgodności swojej struktury na badanym poziomie: morfologicznym, składniowym, semantycznym, itd. Zasady gramatyki i transduction określają ograniczenia determinujące transfer z jednego poziomu na kolejny i stąd w ostateczności transfer tekstu w języku źródłowym na tekst w języku docelowym. Porażka na którymkolwiek z etapów oznacza porażkę całego procesu.