Czytelnia / Technologie tłumaczeniowe

W ramach ujednoliconej metody tłumaczenia mowy uwzględniamy również prawdopodobieństwa modelu akustycznego image hipotez w siatkach słów ARM jako cechy. Jak już zostało wspominane, istnieje również możliwość uwzględnienia prawdopodobieństw modelu języka źródłowego.

Dla hipotetycznie rozpoznanego zdania źródłowego image oraz zakładanego tłumaczeniaimage, niech image będzie monotoniczną segmentacją pary zdań we frazy dwujęzyczne K (bez nielogicznych fraz i wyrazów nakładających się na siebie). Nasza metoda oparta na frazach w odniesieniu do statystycznego zintegrowanego tłumaczenia mowy da się wyrazić w postaci następującego równania:

image

Tutaj optymalizujemy poprzez ciągi słów systemu rozpoznawania alternatywnego image, przez wszelkie możliwe segmentacje monotoniczne danej rozpoznanej sekwencji do fraz języka źródłowego oraz wszelkie możliwe tłumaczenia tych fraz. Poniższe modele przyczyniają się do kryterium decyzji globalnej:

·image to model docelowego języka przekładu oparty na m-gramach.

·Dla danej segmentacji frazowej image, niech image będzie powstałymi parami dwujęzycznymi, z których każda składa się z frazy źródłowejimage i jednej z możliwych tłumaczeń frazy źródłowej image. Wzory słownictwa opartego na frazach przy translacji wykonanej „w dwie strony” mają następującą postać:

 

image

image

Prawdopodobieństwa translacji opartej na frazie zostały obliczone jako interpolacja logarytmiczno – liniowa względnych częstotliwości oraz prawdopodobieństw IBM modelu 1.

·Dla podanej segmentacji frazowej modeli słownictwa opartego na pojedynczych słowach:

 

image

image

prawdopodobieństwo image jest określane jako produkt prawdopodobieństw słownictwa opartego na pojedynczym słowieimage poprzez wszystkie wyrazyimage w obrębie frazy docelowej, natomiast image jest odwrotnym modelem tego samego typu.

·imagei imageto odpowiednio czynniki kary stosowane odnośnie do słów i fraz.

·cecha modelu rozpoznawania asr(j) ma następującą postać:

image

Prawdopodobieństwo image jest prawdopodobieństwem akustycznym hipotezy słowa image w siatce słów ARM, która stanowi odpowiednik elementuimage wektorów akustycznych [4]. Prawdopodobieństwoimagejest prawdopodobieństwem źródłowego języka przekładu opartego na m-gramach. Oba mogą ulec skalowaniu za pomocą funkcji wykładniczej; wówczas cecha modelu języka docelowego oraz cecha akustyczna uzyskają odpowiednio współczynniki skalujące image i image.

Cechy modelu translacji i wzór języka docelowego podlegają skalowaniu za pomocą zbioru funkcji wykładniczych image. Ich wartości mogą być optymalizowane wraz z współczynnikami skalującymi dla cech modelu rozpoznawania image i image równocześnie w jednym modelu logarytmiczno – liniowym.