Czytelnia / Technologie tłumaczeniowe

Teksty korpusu turystycznego pochodziły głównie z broszur, które pojawiają się w Internecie w formacie PDF. W wielu przypadkach przekonwertowanie ich na zwykły format tekstowy było całkiem proste, chociaż w większości wymagały późniejszej edycji, ponieważ tytuły, a czasami również całe paragrafy, miały tendencję do zmiany pozycji w procesie konwertowania. Zwykle im bardziej skomplikowana była broszura, tym trudniej było ją przekonwertować.

Do września 2004 roku z pomocą studentów stworzyłem korpus składający się z 670 000 słów. Można wymienić różne rodzaje korpusów oraz odmienne metody ich klasyfikowania. Korpus turystyczny określamy jako nieoznaczony jednojęzyczny korpus języka docelowego. Zawiera on głównie teksty pochodzące z prospektów Wielkiej Brytanii, Ameryki Północnej, szczególnie Kanady. Podczas jego tworzenia włączono teksty kanadyjskie, ponieważ zawierają wiele opisów czynności pojawiających się w fińskich tekstach języka źródłowego, na przykład wyprawy na rakietach śnieżnych, jazdę na nartach, wycieczki na skuterach śnieżnych, wędrówki po dzikich obszarach – o tym rzadko się wspomina w broszurach brytyjskich.

Nazwy plików opatrzone są jednym z następujących kodów: BI, CA, US po to, aby użytkownik mógł natychmiast zorientować się, czy kolumna konkordancji pochodzi z Wysp Brytyjskich, Kanady czy Stanów Zjednoczonych, jak przedstawiono na rysunku 1.

4. Wykorzystywanie korpusu turystycznego

Podczas roku akademickiego 2004-2005 włączyłem wykorzystywanie korpusu do kursu tłumaczeniowego. Studenci otrzymali wskazówki, w jaki sposób należy używać programu analizy korpusu Wordsmith Tools (Scott, 2004), poznali różne strategie wykorzystywania korpusów podczas tłumaczenia oraz dostali zadanie przetłumaczenia tekstu broszury turystycznej z języka fińskiego na angielski. Poniżej podane zostały przykłady ilustrujące sposoby wykorzystania przez studentów korpusu turystycznego, aby poprawić jakość swoich tłumaczeń.

4.1 Kolokacja

Korpus okazał się bardzo użyteczny dla wyszukiwania informacji dotyczących kolokatów, szczególnie przymiotników, które łączą się z rzeczownikami. Na przykład podczas tłumaczenia zdań zawierających rzeczownik rapids, wyświetlacz KWIC dostarcza bogatego menu przymiotników do wyboru, jak przedstawiono na rysunku 2.

Ryc.2. Przykład konkordancji dla słowa rapids wygenerowanej przez program Wordsmith Tools