Czytelnia / Technologie tłumaczeniowe

Jakość tłumaczenia dla pojedynczego najlepszego wyniku rozpoznawania zwiększa się dzięki wprowadzeniu nowego zbioru parametrów λ’μ. Wydawało się, że model tłumaczenia przystosował się do błędów rozpoznawania poprzez zmianę współczynników skalujących oraz nadanie odpowiedniej wagi modelowi języka docelowego i odwrotnemu słownictwu opartemu na pojedynczych słowach i frazach. Jednakże później nie zaobserwowaliśmy już podobnych postępów w przypadku zbiorów testowych dla najlepszego pojedynczego wyniku.

Tłumaczenie

Pojedynczy najlepszy wynik

Siatka

I'am very sick lost.

I feel much better now.

Referencja I feel much better now

Pojedynczy najlepszy wynik

Siatka

When should I take it ma’am

When should I take it sir

Referencja when should I bring it sir

Tabela 5. Przykłady ulepszeń zintegrowanej metody tłumaczenia mowy (zestaw testowany BTEC, tłumaczenie z języka włoskiego na angielski).

Przypuszczamy, że wynika to z faktu, iż błędy rozpoznawania są prawdopodobnie specyficzne dla każdej wypowiedzi. Jako dane wejściowe w następnym eksperymencie przyjęliśmy siatki słów o wielokrotnych hipotezach rozpoznanych wypowiedzi, jednak na początku nie korzystaliśmy z wyników akustycznych lecz jedynie z topologii siatki. Nie zauważyliśmy poprawy jakości translacji. W niektórych przypadkach system komplikuje się więc w wyniku hipotez, które dadzą się łatwo przetłumaczyć, lecz mają niewiele wspólnego ze słowami mówionymi. Włączając wyniki akustyczne znaczników w siatkę danych wejściowych i optymalizując współczynnik μ2, możemy znacznie zredukować częstotliwość występowania błędów oraz ulepszyć wynik najlepszego liniowego nieobciążonego estymatora. Podobny postęp będzie miał miejsce, gdy użyjemy jedynie wyniku modelu języka źródłowego i zoptymalizujemy współczynnik skalujący μ1. Jeżeli skorzystamy z wyników rozpoznawania i jednocześnie zoptymalizujemy μ1 i μ2, wówczas będziemy w stanie połączyć pozytywne efekty obydwu modeli i w rezultacie podwyższyć jakość translacji.

Najlepsze efekty można osiągnąć, optymalizując jednocześnie współczynnik skalujący modelu translacji λ i współczynnik skalujący modelu rozpoznawania μ. Poprzez takie ustawienia względna różnica w częstotliwości występowania błędów podczas tłumaczenia poprawnego tekstu jest redukowana z 26% do minimum 19%.

Wyniki testowanego zestawu podano w tabeli nr 4. Obserwacje są tutaj podobne do zbioru ulepszeń; najwyższa jakość tłumaczenia może zostać osiągnięta poprzez równoczesne wykorzystanie wyniku modelu akustycznego i wyniku modelu języka źródłowego, a także poprzez optymalizację wszystkich użytych parametrów modelu logarytmiczno – liniowego. Przykłady podwyższenia jakości tłumaczeń zostały podane w tabeli nr 5. Również tabela 4 stanowi porównanie wyników systemu modelu logarytmiczno – liniowego (oznaczonego jako ang. Performance-Based Training, PBT) z metodą łącznego prawdopodobieństwa bazowaną na systemie ważonych skończenie stanowych transduktorów [3] (oznaczonym jako FSA).