Czytelnia / Technologie tłumaczeniowe

Większość programów do analizy korpusowej obsługuje tekst w formacie zwykłego tekstu (*.txt) ale istnieją również takie, które współpracują z innymi formatami.

Jednak pierwszym krokiem do skompilowania własnego korpusu jest znalezienie odpowiednich tekstów o danej tematyce i przekonwertowanie ich do formatu zwykłego tekstu. Można to zrobić na kilka sposobów.

Zlecenia jako korpusy

Jeśli jesteś profesjonalnym tłumaczem, najprawdopodobniej większość twoich zleceń występuje w formie elektronicznej. Na przykład, gdy tłumaczysz teksty z fińskiego na angielski i vice versa, to zapewne będziesz dysponował pokaźnym zbiórem autentycznych tekstów źródłowych w obu językach w formacie Word. W takim przypadku bardzo łatwo można zbudować korpus. Wystarczy tylko zapisać jeszcze raz dokumenty w formacie zwykłego tekstu. Jeśli jesteś studentem, możesz już teraz,rozpocząć kompletowanie tekstów,prosząc swoich wykładowców o przesyłanie zadań tłumaczeniowych jako dokumenty Word.

Moja żona Arja jest profesjonalnym tłumaczem, jedna z jej dziedzin specjalizacji to tłumaczenie broszur turystycznych z języka fińskiego na angielski. Ostatnio skompilowałem z jej tekstów źródłowych korpus fińskiego języka używanego w broszurach turystycznych, składający się z 70.000 słów. Dokonałem tego w przeciągu kilku godzin, ponieważ wszystkie jej zlecenia były dostępne w wersji elektronicznej. Korpus ten może być także używany do tłumaczeń z fińskiego na inne języki, i pokazywać na przykład jak często występuje wyszukiwany przez nas termin w języku źródłowym i podawać kontekst ułatwiający jego zrozumienie.

Może również posłużyć jako pomoc przy tłumaczeniu tekstów z dziedziny turystyki z innych języków na język fiński, szczególnie wtedy, gdy fiński to drugi język (L2) tłumacza. (Na przykład, studenci szkoły dla tłumaczy Uniwersytetu Joensuu w Savonlinna, których L1 to rosyjski a L2 to fiński mogliby wykorzystać ten korpus do tłumaczeń broszur turystycznych z języka rosyjskiego na fiński).

Skanowanie

Możemy szukać drukowanych materiałów, takich jak książki, magazyny, broszury czy czasopisma i konwertować je przy pomocy skanera (urządzenie takie w połączeniu z programem rozpoznawania tekstu (OCR) pozwala na przekonwertowanie dokumentów drukowanych na elektroniczny tekst). W Internecie można znaleźć niezliczone przewodniki. jak korzystać ze skanera. Można na przykład skorzystać z następujących:

http://www.aarp.org/learntech/computers/howto/Articles/a2002-07-16-scan.html

http://www.ehow.com/how_3668_scanner-capture-text.html


Niemniej jednak metoda ta jest relatywnie wolna i posiada wady w porównaniu z innymi metodami.

Literatura online

W sieci jest dużo dostępnych gazet i magazynów. Niektóre z nich wymagają subskrypcji by można było z nich korzystać, inne sprzedają poszczególne artykuły ale i są też takie, które udostępniają swoje materiały za darmo. Stronę internetowa z odnośnikami do gazet angielskojęzycznych można znaleźć pod adresem:

http://www.newspaperwebsites.co.uk/

stronę z odnośnikami do magazynów angielskojęzycznych pod adresem:

http://www.uk250.co.uk/Magazine/

Kolejnym krokiem będzie znalezienie artykułów, które nas interesują a następnie skopiowanie i wklejenie ich do dokumentu Word używając funkcji Wklej specjalnie → Tekst niesformatowany i ostatecznie zapisać jako zwykły tekst.