Czytelnia / Technologie tłumaczeniowe

W świetle wyżej opisanych elementów należy zaznaczyć, że w dziedzinie tłumaczenia maszynowego zagadnienie „rozszerzenia lingwistycznego” jest kluczowe i wymaga dokładniejszego omówienia.

Można to ująć w następujący sposób: w systemie lingwistycznym A, informacja kojarzona z podgrupą jednostek translacyjnych (zdań i wyrażeń) wykazuje konkretną regularność i spójność, umożliwiającą jej schematyzowanie i skomputeryzowanie.

Należy jednak wiedzieć czy zachowując tę samą pierwotną spójność cech systemu A, mogą one być rozszerzone do systemu B w taki sposób, żeby jednostki źródłowe tłumaczenia miały swoje stosowne odpowiedniki w języku docelowym.

Jeśli to możliwe, a wprowadzane modyfikacje nie naruszą wewnętrznej spójności systemu B, można powiedzieć, że system A i jego podgrupa jednostek są lingwistycznie rozszerzalne, czyli że są możliwe do przekazania za pomocą translacji komputerowej.

Weźmy na przykład zdanie możliwe do opisania odpowiednio pod względem gramatycznym mimo swojej złożoności i semantycznej dwuznaczności. Zdanie „Minister edukacji spotkał się z ministrem spraw wewnętrznych” może zostać bez problemu przetłumaczone na każdy język przez człowieka. Jednak aby mogło ono być przetłumaczone przez maszynę, jego właściwości lingwistyczne muszą być rozszerzalne do systemu docelowego.

W tym konkretnym przypadku, na przykład „wyrażenie w dopełniaczu” (konstrukcja dopełniacza w języku arabskim) powinno być możliwe do przekazania, a elipsa w cyklicznych wyrażeniach (minister czegoś) powinna być akceptowalna w obu przypadkach bez większych modyfikacji. Co więcej, zagadnienie predykacji powoduje drażliwe problemy dotyczące „przenośności” w dwóch różnych systemach językowych, takich jak angielski i arabski.

Aby uniknąć sytuacji, w której problemy w zgodności między językami stają się nie do pokonania należy zapewnić bardzo dokładne wskazówki językowe, aby osiągnąć kolejny poziom formalizacji jako wstępu do komputeryzacji. Dlatego system ekwiwalentów, który może być odczytany przez maszynę, jest zestawem formuł językowych, gdzie każda formuła określa przynajmniej kilka wyrażeń (zob. holistyczna perspektywa translacji).

Weźmy jako przykład zestaw wyrażeń (SES) w tekście źródłowym (TEX), gdzie każde wyrażenie (EXP) może być skojarzone z jedną lub kilkoma oznakami (IND), podobnymi dla wszystkich wyrażeń (EXP) w zestawie (SES) tekstu (TEX). To prowadzi do następującego wzoru: SES = {IND, EXP,TEX}.

Na podstawie tego wzoru, wzoru na ekwiwalent, można wyprowadzić wzór właściwy dla tekstu docelowego: SES1 = {IND1, EXP1, TEX1}. Ten wzór jest uzasadniony dla zestawu wyrażeń, które posiadają istotne cechy lingwistyczne, wspólne z językiem docelowym, niekoniecznie ekwiwalentów wyrażeń z języka źródłowego na poziomie strukturalnym.

Nie ma systematycznej projekcji zawartości jednego systemu do drugiego. Jeżeli zachodzi projekcja, nieuchronnie musi się ona odbywać zgodnie z zasadami gramatycznymi, których opracowanie jest przedmiotem stanowiącej podłoże dla wszystkich wyrażeń z tekstu kalkulacji (formalnej lub algorytmicznej).