Czytelnia / Technologie tłumaczeniowe


6. Wnioski

W niniejszym artykule zajmowaliśmy się siatkami słów w oparciu o ARM jako danymi wejściowymi dla systemu translacji statystycznej. Połączenie rozpoznawania mowy i tłumaczenia maszynowego zostało przeprowadzone za pomocą kombinacji modelu logarytmiczno – liniowego. Poprzez użycie siatek słów z wynikami modelu akustycznego zamiast wyników pojedynczego najlepszego rozpoznawania oraz poprzez uwzględnienie wyników modelu języka źródłowego uniknęliśmy negatywnego efektu błędów rozpoznawania i skutecznie podnieśliśmy jakość translacji. Dokonaliśmy optymalizacji współczynników skalujących dla cech tłumaczenia i rozpoznawania, bazując na minimalizacji błędu popełnianego podczas procesu uczenia i włączyliśmy wszystkie cechy w proces ogólnych poszukiwań, nie korzystając z przybliżenia hipotez translacyjnych dotyczących najlepszych wyników rozpoznawania. O ile wiemy, są to pierwsze eksperymenty, w których zastosowano w przekładzie opartym na siatce słów najnowocześniejszy system tłumaczenia maszynowego opartego na frazach z wielokrotnymi cechami i zarazem pierwsze eksperymenty, które przyniosły tak znaczące sukcesy. Zadania dotyczące dużego zbioru słownictwa w zakresie tłumaczenia maszynowego europejskich mów parlamentarnych są jeszcze przeprowadzane i analizowane, ale pierwsze rezultaty wydają się zachęcające.

7. Podziękowania

Przeprowadzone badania zostały częściowo sfinansowane przez Unię Europejską w ramach zintegrowanego projektu TC-STAR - Technology and Corpora for Speech to Speech Translation (IST-2002-FP6-506738). Składamy serdeczne podziękowania kolegom: R. Zens, S. Kanthak, C. Goplan i J. Lööf, którzy przyczynili się do naszych sukcesów.

8. Bibliografia

[1] N. Bertoldi, “Statistical Models and Search Algorithms for Machine Translation”, PhD thesis, Universit`a degli Studi di Trento, Italy, February 2005.

[2] S. Kanthak and H. Ney, “FSA: An Efficient and Flexible C++ Toolkit for Finite State Automata using On-demand Computation”, Proc. 42nd Annual Meeting of the ACL, pp. 510 – 517, Barcelona, Spain, 2004.

[3] E. Matusov, S. Kanthak, and H. Ney, “On the Integration of Speech Recognition and Statistical Machine Translation”, To appear in Proc. Interspeech 2005, Lisbon, Portugal, 2005.

[4] H. Ney, “Speech Translation: Coupling of Recognition and Translation”, Proc. IEEE Int. Conf. on Acoustics, Speech and Signal Processing, pp. 1149–1152, Phoenix, AZ, 1999.

[5] F.J. Och, “Minimum Error Rate Training in Statistical Machine Translation”, In Proc. of the 41th Annual Meeting of the Association for Computational Linguistics (ACL), pp. 160–167, Sapporo, Japan, July 2003.

[6] K. Papineni, S. Roukos, T. Ward, and W.-J. Zhu, “BLEU: a Method for Automatic Evaluation of Machine Translation”, Proc. 40th Annual Meeting of the ACL, Philadelphia, PA, pp. 311–318, 2002.

[7] S. Saleem, S.-C. Jou, S. Vogel, and T. Schultz, “UsingWord Lattice Information for a Tighter Coupling in Speech Translation Systems”, Proc. Int. Conf. on Spoken Language Processing, pp. 41–44, Jeju Island, Korea, 2004.

[8] E. Vidal, “Finite-State Speech-to-Speech Translation”, Proc. IEEE Int. Conf. on Acoustics, Speech and Signal Processing, pp. 111–114, Munich, Germany, 1997.

[9] D. Vilar, E. Matusov, S. Hasan, R. Zens, and H. Ney, “Statistical Machine Translation of European Parliamentary Speeches”, To appear in Proc. of the Machine Translation Summit X, Phuket, Thailand, September 2005.

[10] R. Zens and H. Ney, “Improvements in phrase-based statistical machine translation”, In Proc. of the Human Language Technology Conf. (HLT-NAACL), pages 257–264, Boston, MA, May, 2004.

[11] R. Zhang, G. Kikui, H. Yamamoto, T. Watanabe, F. Soong, W. K. Lo, “A Unified Approach in Speech-to-Speech Translation: Integrating Features of Speech Recognition and Machine Translation”, In Proc. of The 20th International Conference on Computational Linguistics (CoLing’04), Geneve, Switzerland, 2004.