Czytelnia / Teoria tłumaczenia

4.3. Zawartość i zastosowanie korpusu ilościowego na DVD

Korpus ilościowy na DVD został opracowany w bardziej na wpół automatyczny sposób niż ręcznie wybrany korpus jakościowy. Teksty zostały zaczerpnięte z CD-ROM-ów (np. New Scientist, Computer Select) oraz ze stron internetowych (np. TechWeb) przy użyciu kombinacji elementów wyboru zdefiniowanych przez użytkownika, zawierających słowa kluczowe (DVD), rok wydania (1997-1999) oraz rodzaj tekstu (artykuły). Wybrane teksty zawierały w sumie 27 446 słów, a opracowanie zajęło około 25 minut. Ze względu na to, że korpus był dosyć mały i obejmował wyznaczony okres, podjęto decyzję o nierozdzielaniu korpusu ilościowego na mniejsze części w zależności od roku.

Pewne rodzaje wyborów językowych i stylistycznych podjętych przez studentów, które mogą być zbadane przy pomocy korpusu ilościowego, zostały przedstawione poniżej, począwszy od zwykłych ćwiczeń weryfikujących, a skończywszy na bardziej zaawansowanych badaniach.

Jeżeli chodzi o weryfikację, oceniający może po prostu życzyć sobie potwierdzenia, że student dokonał właściwego wyboru, dotyczącego konkretnego terminu lub frazy. Przykładowo student przetłumaczył termin le CD audio jako ‘the audio CD’ (płyta CD audio). Oceniający może instynktownie wyczuć, że jest to dobry wybór, ale może też chcieć potwierdzenia swojej intuicji poprzez sprawdzenie tego terminu w korpusie ilościowym, aby upewnić się, że termin ten nie brzmi naprawdę ‘CD-audio’ (np. podobnie do formy CD-ROM). Wyszukiwanie terminu ‘CD’ ujawnia 219 przypadków, w których on występuje, ale poprzez sortowanie tych terminów (najpierw do lewej, a potem do prawej) można szybko ustalić, że zarówno ‘audio CD’ i ‘CD-audio’ są dopuszczalne. ‘audio CD’ pojawia się sześciokrotnie w korpusie, podczas gdy ‘CD-audio’ występuje tylko raz.

Kolejne zastosowanie korpusu pokazuje, że chociaż preferowana pisownia terminów CD-Rom i DVD-Rom w języku francuskim wiąże się z użyciem małych liter ‘om’, w języku angielskim dominuje użycie wielkich liter: CD-Rom (wystąpił jeden raz), CD-ROM (wystąpił 102 razy), DVD-Rom (nie wystąpił ani razu), DVD-ROM (wystąpił 107 razy). Ponadto gdy jeden student użył terminu CD-ROM, jak gdyby nie odmieniał się on w liczebniku (‘it combines the storage equivalent of five to seven CD-ROM’ (łączy to ze sobą równowartość pamięci od pięciu do siedmiu CD-ROM?)), korpus pokazuje, że samo słowo ROM nie odmienia się w liczebniku, ale od słowa CD-ROM można utworzyć liczbę mnogą poprzez dodanie końcówki ‘s’, co w rezultacie daje nam CD-ROMs.

W innym przykładzie student przetłumaczył jednostkę miary Go z tekstu źródłowego (jak w zdaniu permettant au DVD de stoker 4,7 Go sur une face et jusqu’ à 17 Go sur des modèles à venir double face et double couche!) jako ‘gigaoctet’ (gigaoctet) w tekście docelowym. Wyszukiwanie w korpusie pokazuje, że słowo ‘gigaoctet’ (a właściwie ‘octet’) nie pojawia się. Fakt, że nie wystąpiło w korpusie uświadamia oceniającemu, że wymagane są dalsze poszukiwania w celu odnalezienia odpowiednika, a można zastosować wiele strategii. Jak przedstawia tabela 5, wyszukiwanie kontekstowe słowa ‘giga*’, a nawet samego ‘G*’ w odniesieniu do pięcioliterowego słowa ‘stor*’ odnajduje wybór przydatnych konkordancji, podobnie jak przy wyszukiwaniu ‘4,7’ i ‘17’.

 

TABELA 5

Wyszukiwanie kontekstowe, w którym ‘G’ pojawia się w odniesieniu do pięcioliterowego słowa ‘stor*’.

OMs specifically, they give you 2.1

her much more tightly: as much 4.7

n’t be overly impressed with the 4.7

ntains 26 times the storage space-17

, dual-layer can hold about 17

mputer-related products that promise

GB of storage. But their performan

Gbytes of data can be stored on on

Gbytes of data stored on DVD-ROM p

Gbytes compared with CD’s 650 Mbyt

Gbytes. DVD’s increased storage ca

Gigabytes of optical storage. But