Czytelnia / Technologie tłumaczeniowe

Użycie specjalistycznego korpusu językowego w celu poprawy jakości tłumaczenia
 
Michael Wilkinson
 
tłum. Magdalena Janik 
 

Źródło: http://accurapid.com/journal/33corpus.htm

 

1. Narzędzia do analizy korpusowej tekstów

W kontekście komputerowej technologii wspomagającej tłumaczenie (CATT) korpus językowy może być zdefiniowany jako duży zbiór tekstów w formacie elektronicznym. Elektroniczne korpusy mogą być „wzbogacone” przez np. dołączenie specjalnych kodów do wyrazów, w celu oznaczenia poszczególnych kategorii językowych, np. części mowy, co umożliwia naukowcom przeprowadzenie zaawansowanych badań językoznawczych. Jednak nawet korpus tekstów bez znaczników (tzw. „surowy” tekst) może być użytecznym narzędziem wspomagającym tłumaczenie, co, mam nadzieję, uda mi się przedstawić poniżej. Bywa on bardzo pomocny np. w utwierdzaniu się w decyzjach intuicyjnych, w potwierdzaniu lub odrzucaniu decyzji opartych na innych narzędziach, jak np. słowniki, w uzyskiwaniu informacji o możliwych kolokacjach (słowach, które zazwyczaj występują wspólnie), w poszerzaniu wiedzy nt. wzorców w zwyczajnym języku docelowym i przy uczeniu się, w jaki sposób należy używać nowych zwrotów.

Narzędzia do analizy korpusu umożliwiają użytkownikom zbadanie informacji w nim zawartej i pokierowanie nią na wiele sposobów. Na przykład większość zestawów narzędzi komputerowych do korpusowej analizy tekstu zawiera program konkordancyjny (popularnie zwany „konkordancerem”), który znajduje wszystkie przykłady występowania szukanego słowa lub szukanego wzorca i wyświetla je na środku generowanej listy, w otaczającym je kontekście z lewej i prawej strony, co przedstawia ryc. 1.

 

Ryc.1: Przykład konkordancji dla szukanego wyrazu eat* utworzonej przez program WordSmith Tools wersja 4

Obraz pokazany na ryc. 1 jest przykładem konkordancji typu KWIC (z ang. Key Word In Context, czyli „słowo kluczowe w kontekście”). Można sterować kolejnością wersów: np. jeżeli szukane słowo jest rzeczownikiem, można użyć konkordancera do ułożenia w kolejności alfabetycznej słów bezpośrednio poprzedzających szukany wyraz, co może pomóc w znalezieniu odpowiednich przymiotników, które występują zazwyczaj w sąsiedztwie szukanego słowa. Poprzez podwójne kliknięcie na wers można zobaczyć cały kontekst, w jakim dany wyraz występuje.
Konsultowanie gotowych drukowanych tekstów „równoległych” w języku docelowym – w celu np. wyszukania terminologii lub wyrażeń idiomatycznych – jest naturalnie czynnością dobrze znaną tłumaczom. Sprawdzanie zdigitalizowanych korpusów językowych za pomocą narzędzi do analizy korpusowej umożliwia im przeszukanie dużej ilości tekstów o wiele szybciej, a tym samym bardziej systematycznie.