Czytelnia / Technologie tłumaczeniowe

Głównym celem będzie zatem podkreślenie strukturalnych odpowiedników między dwoma językami, co pragmatycznie będzie polegało na szukaniu jednostki w T2 (tekst docelowy) najbliższej „żądaniu”, przedstawionemu przez jednostkę z T1 (tekst źródłowy).

2) Lingwistyczna i stylistyczna analiza korpusu

Różne poziomy analizy lingwistycznej służą jako baza do przykładów tłumaczenia:

-    Po pierwsze, analiza morfologiczna identyfikuje odpowiednie słowa lub morfemy w korpusie.

 -    Po drugie, analiza syntaktyczna identyfikuje korespondujące wyrażenia i struktury w obu tekstach.

 -   Po trzecie, analiza semantyczna identyfikuje znaczenie jednostek i ewentualne dwuznaczności w każdym tekście.

Użyteczność takiego korpusu przekracza podstawy tłumaczenia. Jako że głównym celem jest krytyka translacji, możemy rozważyć też inne przydatne programy, takie jak dwujęzyczne generujące listy terminologii, przytaczanie przykładów dla potrzeb pedagogicznych, rozszerzanie aktualnych słowników lub nawet wprowadzanie zasad gramatycznych. 

Sugerowane podejście pozwala zoptymalizować myślenie w zakresie translacji, dotyczące tekstów dwujęzycznych.

Ogólna koncepcja tego podejścia polega na powiązaniu odpowiadających sobie „jednostek translacyjnych” (słów, zdań, struktur syntaktycznych), podczas identyfikowania ciągów w korpusie.

Głównym celem tego podejścia jest sprawienie, żeby mechanizm dopasowywania składał się z dwóch różnych części:

1)        Rozpoznanie potencjalnie kojarzonych „jednostek” w obu korpusach

2)       Oszacowanie prawdopodobieństwa sugerowanych jednostek poprzez zestawienie ich za pomocą dwujęzycznego korpusu danych.

Jeśli podzielić procedurę tłumaczenia na dwie fazy, można zastosować stosunkowo łatwe modele translacji w celu zidentyfikowania jednostek, które mogą skorelować analizę teoretyczną z faktycznymi tłumaczeniami zaobserwowanymi w korpusie.

Jednym z możliwych sposobów opracowywania systemów operacyjnych jest rozwój metod analizy opartych na danych przechowywanych w korpusie szkoleniowym. Takie metody jednak, oparte na modelowym szkoleniu, zależą od ilości wcześniej dostępnych informacji. 

W tym względzie można rozróżnić między dwoma rodzajami sytuacji:

Sytuacja 1: Analogiczny korpus zanalizowanej i opatrzonej przypisami jednostki tłumaczeniowej jest dostępny a priori z podanym znaczeniem. Mowa tu o korpusie, w którym dla każdej jednostki wybrano plan syntaktyczny, przedstawiający strukturę tej jednostki.