Czytelnia / Technologie tłumaczeniowe

Również w [11] autorzy wybierają listę N najlepszych wyników rozpoznawania, na którą składa się tylko 100 hipotez na jedną wypowiedź, by przybliżyć się do połączenia rozpoznawania i tłumaczenia mowy; tutaj badamy znacznie silniejszą integrację za pomocą gęstych siatek. Ostatecznie [1] skorzystał z kombinacji modelu logarytmiczno – liniowego do przetłumaczenia listy N najlepszych wyników, jednak nie był w stanie udoskonalić sieci niejednoznaczności.

Dalsza część niniejszego artykułu przedstawia się następująco: rozdział 2. analizuje regułę decyzyjną Bayesa w oparciu o prezentację [4]. Począwszy od tego momentu, zajmiemy się metodą statystycznego tłumaczenia opartego na frazach, bazując na modelu logarytmiczno – liniowym oraz na minimalizacji błędu popełnianego podczas nauki w rozdziale 3. Tutaj tłumaczymy siatki słów za pomocą ARM oraz korzystamy z wyników modelu akustycznego i modelu języka źródłowego. Rozdział 4. zajmuje się pewnymi praktycznymi problemami związanymi z tłumaczeniem siatek słów. W rozdziale 5. mówimy o znaczącym postępie w ramach jakości tłumaczenia z języka włoskiego na angielski, wykonanego przy wykorzystaniu wyników modelu akustycznego i modelu języka źródłowego oraz poprzez optymalizację wzorcowych współczynników skalujących. Kolejną część artykułu stanowi opis pierwszych obiecujących eksperymentów nad angielsko - hiszpańskim tłumaczeniem opartym na siatce, w przypadku dużego zbioru słownictwa.

 

2.Bayesowska reguła decyzyjna w tłumaczeniu mowy

W ramach tłumaczenia mowy szukamy zdania języka docelowego image, które jest tłumaczeniem wypowiedzi ustnej przedstawionej w postaci wektora akustycznego image. W celu zminimalizowania liczby błędów w zdaniu, zwiększamy maksymalnie późniejsze prawdopodobieństwo tłumaczenia języka docelowego, biorąc pod uwagę sygnał mowy (patrz [4]). Słowa źródłowe imagesą przedstawione jako ukryta zmienna:

image

Należy zauważyć, że z góry założyliśmy, iż sygnał mowy nie zależy od zdania docelowego i przybliżaliśmy sumę poprzez wszelkie możliwe transkrypcje języka źródłowego, aż do maksimum. image może być standardowym modelem akustycznym, natomiast image jest modelem języka docelowego. Dla modelu translacji image wprowadzamy prawidłowość pomiędzy zdaniem naturalnym a zdaniem docelowym jako ukrytą zmienną image:

 

image.

Ukryta prawidłowość A przedstawia wszelkie możliwe interpretacje słów źródłowych przez słowa docelowe. Jest ona używana do określenia modelu leksykalnego opartego na frazach lub pojedynczych słowach.

Powstała reguła decyzyjna nie uwzględnia prawdopodobieństwa modelu języka źródłowego image. Jeżeli weźmiemy pod uwagę warunek poprawności zdania źródłowego image , model tłumaczenia musi zawierać zależność kontekstową w odniesieniu do poprzednich słów źródłowych. W modelu tłumaczenia opartego na frazach, zależność ta istnieje w obrębie frazy. Możemy ją przybliżyć dla całego zdania poprzez włączenie modelu języka źródłowego w strukturę modelu logarytmiczno – liniowego, prezentowanego w następnym rozdziale.

3. Kombinacja modelu logarytmiczno-liniowego

W praktyce posługujemy się metodą bezpośredniego tłumaczenia. Tutaj dystrybucja prawdopodobieństw jest przedstawiona jako rozkład cech w modelu logarytmiczno – liniowym. Dokładniej mówiąc, na prawdopodobieństwo wzoru tłumaczenia składa się kilka prawdopodobieństw. Określamy modele słownictwa opartego na frazach, korzystając ze statystycznego dopasowania słów (patrz [10]). Prawdopodobieństwa tłumaczeń frazowych są uzupełnione przez prawdopodobieństwa wzoru przekładu opartego na pojedynczych słowach.