Czytelnia / Teoria tłumaczenia

Funkcja konkordancji polega na wydobyciu wszystkich informacji o występowaniu poszczególnych słów w ich pierwszym kontekście oraz na wyświetleniu ich w łatwym do odczytania formacie. Najbardziej znanym formatem jest KWIC (nazwa pochodzi z języka angielskiego key word in context i oznacza „słowo kluczowe w kontekście”), który pokazuje jedno występowanie elementu w jednej linijce. Słowo, którego szukamy pojawia się podświetlone na środku ekranu, tak jak to przedstawiono w tabeli 2. Zróżnicowanie kontekstu po obu stronach jest dość duże. Ponadto kontekst ten może być uporządkowany na wiele sposobów, np. w kolejności, w jakiej występuje w korpusie lub w porządku alfabetycznym słów poprzedzających lub następujących po elemencie, którego szukamy. Cały ten proces stał się dość elastyczny, umożliwiając funkcje wyszukiwania nastawione na przypadek, wyszukiwanie symboli wieloznacznych (np. od słowa ‘play*’ można uzyskać ‘play’, ‘played’, ‘player’, ‘players’, ‘playing’, ‘plays’ etc.) oraz wyszukiwanie, w którym jakiś termin musi występować z określonym przez użytkownika dystansem do słowa, którego szukamy (np. kontekst, w którym ‘play’ pojawia się z pięcioma terminami ‘DVD’).

TABELA 2

Przykład wyników wyszukiwania w formacie KWIC słowa ‘player’.

atsushita’s slick, portable DVD

ndows Explorer, but their movie

ndows NT compatibility. The DVD

ers with a “record” button. The

o three years,” he says. Such a

t’s eye, Wood said. A super VCD

player

player

player

player

player

player

with a color LCD and To

software refused to pla

software in all these k

will not even have the

would have a display ab

is believed to improv

Główną zaletą tych narzędzi w tłumaczeniu jest to, że mogą zobaczyć dany termin jednocześnie w wielu różnych kontekstach, co z kolei pozwala im wykryć inne rodzaje wzorców językowych i pojęciowych, które czasami są trudne do rozpoznania w pojedynczych, drukowanych źródłach (np. znaczenia terminów, terminy pokrewne, typowe schematy złożone).

Większość narzędzi służących do analizy korpusu językowego oferuje wiele innych elementów wyposażenia, które często łączą w sobie dane wyprodukowane przez konkordancję oraz przeliczenia częstotliwości występowania wyrazu. Przykładowo, statystyki dotyczące kolokacji danych słów (‘współwystępujących’) mogą być generowane. Ten rodzaj informacji bywa użyteczny do rozpoznawania typowego użycia jakiegoś schematu.

3. Tworzenie korpusu językowego wspomagającego ocenę tłumaczenia

Jak już ustaliliśmy w rozdziale 2., korpus językowy nie jest zbiorem przypadkowych tekstów, ale zbiorem tekstów wybranych według specjalnych kryteriów na potrzeby projektu. Oczywiście wartość tego, co wywodzi się z korpusu zależy w dużej mierze od tekstów, które się w nim znajdują. Kryteria dotyczące tworzenia ogólnych korpusów językowych zostały dość dobrze opisane w literaturze (patrz Engwall 1994), jednak nie mogą być całkowicie stosowane do tworzenia specjalnych korpusów, takich jak korpus wspomagający ocenę tłumaczenia. Raczej należy szczególnie zadbać o to, aby zawartość korpusu zaspokajała potrzeby potencjalnych użytkowników. W tym przypadku użytkownikami są szkoleniowcy, którzy muszą stawić czoła zadaniu, jakim jest ocena stosunkowo krótkiego tłumaczenia specjalistycznego (liczącego do kilku tysięcy słów) z dziedziny, która nie jest im do końca znana - scenariusz typowy dla wielu programów szkoleniowych[3].

Korpus językowy wspomagający ocenę tłumaczenia jest wspólną nazwą dla zbioru tekstów, który został podzielony na cztery podkorpusy: porównywalny korpus źródłowy, korpus jakościowy, korpus ilościowy oraz korpus niewłaściwy. Owe podkorpusy różnią się pod względem treści i zakładanej funkcji. W poniższych podrozdziałach zostały przedstawione i objaśnione główne zasady tworzenia korpusu językowego wspomagającego ocenę tłumaczenia. Zasady te będą zilustrowane w rozdziale czwartym z uwzględnieniem struktury korpusu na płytach DVD oraz jego zastosowanie przy ocenie tłumaczeń studentów.[3] Można wyobrazić sobie inne rodzaje korpusów językowych wspomagających ocenę tłumaczenia, które mogłyby być stworzone do użytku w innych sytuacjach oceny tłumaczenia (np. ocenianie tłumaczenia literackiego), ale zapewne miałyby one inny charakter niż korpus opisany tutaj