Czytelnia / Technologie tłumaczeniowe

Tak więc własność lingwistyczna może być przedstawiana lub nie, w ten sam sposób, jak system może (lub nie) być przenośny, biorąc pod uwagę możliwość, lub jej brak, tłumaczenia sekwencji z jednego języka na drugi.

Przyjmując w translacji „formalistyczny” punkt widzenia, mamy wyraźne kryteria porównywania tekstów – z każdym należy się rozprawić i wyrazić go w formie odpowiednich równań. Według tej metody analizy tłumaczeń nie istnieją dokładne odpowiedniki w różnych językach, co najwyżej podobieństwa struktur i cech językowych.

W przeciwieństwie do „odpowiedników”, które można analizować według podobnych kryteriów, „podobieństwa” są parami obiektów różniących się od siebie na płaszczyźnie formy, ale porównywalnymi na płaszczyźnie funkcji.

Zamieszczanie w tekście tych „podobieństw” zawierających semantyczną niedokładność wynika głównie z wyborów z fazy obserwacyjnej. Które elementy porównawcze powinny zostać przyjęte? Oczywiście wykluczamy z naszych kryteriów jakiekolwiek subiektywne rozważania dotyczące „piękna” lub „elegancji” tłumaczenia w trakcie przekładu maszynowego.

Zarys przyjętego podejścia

Z teoretycznego punktu widzenia, nasze podejście może być kojarzone z lingwistyką tekstu oraz zasadą kontrastowania i formalizacji.

W ramach tego podejścia teksty, które są wsparciem naukowym klasyfikuje się zgodnie ze źródłami ich produkcji i dystrybucji (np. artykuł lub organ oficjalny) oraz zgodnie z ich denotacyjną dziedziną, opartą na jasnych semantycznych rozważaniach (np. teksty dotyczące prawa lub zdrowia).

Kiedy dziedzina tekstu oraz jego rodzaj zostały już dobrze opisane, skupiamy się z jednej strony na segmentacji tekstu i elementach składni („porcjach tekstu”), a z drugiej strony na łączeniach między tymi elementami z morfologicznego i semantycznego punktu widzenia.

Podstawowe kalkulacje zapewniają temu podejściu uzasadnienie z teoretycznego i z praktycznego punktu widzenia. Tak więc wybór jednostek tekstowych do analizy i formalizacji musi być zgodny z konkretnymi pojęciami, takimi jak „powtarzanie się”, „relacja”, czy „dokładność”.

Aby wykryć najczęstsze językowe i tłumaczeniowe użycia struktur w korpusie badawczym i aby stworzyć opis, mówiący o najistotniejszych elementach, używa się statystyki.

Stąd obserwacja zajmuje się tym, co jest dostępne od razu w badanych wyrażeniach. W tym momencie nie zajmujemy się semantyką. Użycie korpusów szkoleniowych oraz wprowadzenie opisów to podstawa podejścia tekstowego. Główne etapy analizy są następujące (od konkretnych faktów do ogólnego podsumowania):

1)        Segmentacja i analiza morfologiczna;
2)        Pozbycie się dwuznaczności w kategoriach morfologicznych;
3)        Lokalna i tekstowa analiza syntaktyczna;
4)        Analiza funkcjonalnych relacji syntaktycznych.