Czytelnia

Oprócz Brytyjskiego Korpusu Narodowego istnieje dziś kilka megakorpusów języka angielskiego  (zob.   Kennedy   1998:   45-57).   Do  najważniejszych  z  nich  należy  korpus monitorujący zwany Bankiem Języka Angielskiego (ang. the Bank of English), stworzony z inicjatywy Johna Sinclaira, który obejmuje już dziś ponad 500 milionów wyrazów (http://www.collins.co.uk/Corpus/CorpusSearch.aspx ). 

W odróżnieniu od korpusu referencyjnego, który stanowi zamkniętą całość, korpus monitorujący cały czas dynamicznie zwiększa swoją objętość, aby odpowiednio dokumentować zmiany zachodzące w języku.

Bank Języka Angielskiego ma jednak jedną wadę - jest to korpus oportunistyczny, tj. obejmuje on teksty odpowiadające różnorodnym stylom i gatunkom języka, ale ich struktura jest przypadkowa i jednolita, ponieważ niektóre typy tekstu występują w nadmiarze. Mówiąc inaczej, nie jest to korpus w pełni zrównoważony.

Oprócz korpusów języka ogólnego, istnieją liczne korpusy języków specjalistycznych, np. języka biznesu (zob. McEnery, Xiao, Tono 2006: 60-61), translatoryczne korpusy dwu- i wielojęzyczne, korpusy uczniowskie i wiele innych. Aktualny przegląd korpusów oraz technik korpusowych znaleźć można w opracowaniu pod redakcją Lewandowskiej-Tomaszczyk (2005).

3. WYKORZYSTANIE KORPUSU

3.1. Wyszukiwanie pojedynczych wyrazów

Jak już wspomniałam, materiał korpusowy mogą z powodzeniem wykorzystywać osoby uczące się języka obcego, ponieważ pozwala on na rozwiązywanie problemów natury leksykalnej czy gramatycznej w oparciu o obiektywne dane tekstowe.

Użytkownicy mogą oczywiście korzystać ze słowników, zwłaszcza jednojęzycznych, ale nawet najobszerniejsze słowniki nie zapewnią odpowiednio dużej ilości przykładów tekstowych (cytatów), aby zilustrować użycie każdego wyrazu i znaczenia, choć to dzięki nim tworzy się naturalnie brzmiące, autentyczne teksty w języku obcym.

Gdy opis słownikowy okaże się niejasny czy niewystarczający, warto skorzystać z materiału korpusowego.

Rys1

Rys. 1. Wyniki wyszukiwania dla słowoformy knowledge

Podstawowym narzędziem korpusowym -jak pokazano powyżej- jest opcja wyszukiwania pojedynczych wyrazów (ang. word ąuery). Po wpisaniu w okienko poszukiwanej słowoformy, a raczej odpowiedniego ciągu znaków, oprogramowanie wyszukuje daną formę wraz z częstością wystąpień (frekwencją określaną tutaj skrótem F). Dla rzeczownika knowledge oprogramowanie wyodrębni także różnorodne formy pochodne, m.in. przymiotniki knowledge-based czy knowledgeable.

Po wybraniu słowoformy knowledge, która ma w BNC bardzo wysoką frekwencję (F 14359), mamy do dyspozycji trzy różne tryby postępowania: (1) udostępnienie wszystkich wystąpień, (2) udostępnienie próbki wybranej losowo lub (3) udostępnienie próbki pochodzącej z pierwszych typów tekstu. Ponieważ uzyskanie wszystkich wyników zajmuje dużo czasu i jest tym samym niepraktyczne, zaleca się korzystanie z próbek, najlepiej z próbki losowej.