Czytelnia / Technologie tłumaczeniowe

Użycie wyspecjalizowanego korpusu do poprawy jakości tłumaczenia

Michael Wilkinson

tłum. Ada Mulica

Źródło: http://accurapid.com/journal/33corpus.htm

 

1. Korpusy i narzędzia ich analizy

W kontekście technologii tłumaczeniowej wspomaganej komputerowo (CATT), korpus może być zdefiniowany jako pokaźny zbiór tekstów w formacie elektronicznym. Korpusy elektroniczne mogą być, na przykład, wzbogacone o znaczniki części mowy, co jest szczególnie użyteczne dla badaczy, gdyż umożliwia im przeprowadzenie zaawansowanych badań językowych. W części następnej mam zamiar udowodnić, że nawet nieznakowany korpus tekstów (tzw. „surowy” tekst) okazuje się użytecznym narzędziem wspomagającym tłumaczenie: na przykład jako pomoc przy: podejmowaniu intuicyjnych decyzji, weryfikowaniu lub odrzucaniu wyborów opartych na innych narzędziach, takich jak np. słowniki, otrzymywaniu informacji dotyczących kolokatów (wyrazów, które zazwyczaj występują razem), poszerzaniu wiedzy na temat schematów języka docelowego oraz przy używaniu nowych wyrażeń.

Narzędzia analizy korpusu umożliwiają użytkownikom sprawdzanie i manipulowanie informacjami zawartymi w korpusie na wiele sposobów. Na przykład, większość zestawów analizy korpusów zawiera „konkordancje”, które odnajdą wszystkie przykłady szukanego słowa lub szukanego schematu oraz wyświetlają je na środku ekranu, wraz z całością kontekstu z prawej i lewej strony, jak na rysunku 1.

Ryc.1. Przykład konkordancji dla słowa eat* wygenerowanej przez program Wordsmith Tools, wersja 4

Przykłady przedstawione na rysunku 1, znane są jako przykłady konkordancji typu Key Word In Context (KWIC): kluczowe słowo w kontekście. Można manipulować pozostałymi kolumnami konkordancji: na przykład jeśli szukanym słowem jest rzeczownik, możemy posortować wyrazy tak, aby od razu zostały wyświetlone w porządku alfabetycznym, co powinno pomóc znaleźć odpowiedni przymiotnik łączący się z szukanym słowem. Poprzez podwójne kliknięcie na wybraną kolumnę, można zobaczyć je w pełnym kontekście.

Konsultowanie drukowanego tekstu o tej samej tematyce w języku docelowym - w celu, na przykład, wyszukania terminologii lub znalezienia idiomatycznego wyrażenia, jest oczywiście tłumaczom doskonale znane. Sprawdzanie cyfrowego korpusu za pomocą narzędzi analizy umożliwia wykorzystanie dużych ilości tekstu o wiele szybciej i systematyczniej.