Czytelnia / Społeczność tłumaczy

3. Składniki systemu MULTILINT

W następnych rozdziałach składniki systemu MULTILINTU są opisane bardziej szczegółowo; obecnie wszystkie istnieją jeszcze w formie prototypów. Eksperymentalne zastosowanie ich przez wybranych autorów dokumentów technicznych na stronie pilotażowej jest przewidziane w przyszłych miesiącach.

3.1. Moduł interfejsu użytkownika SYSCON

Użytkownik komunikuje się z narzędziami poprzez wspólny interfejs, dla którego został wyszczególniony format wymiany danych. Obecna prototypowa wersja interfejsu użytkownika została zrealizowana  w Tcl/Tk, umożliwiając sieciowy dostęp do narzędzi na stacjach roboczych z systemem Unix, będących platformą używaną na stronie pilotażowej; pracuje się nad importem do JAVA/html (która może zostać uruchomiona również na komputerach osobistych).

Następnym ważnym zadaniem tego składnika będzie analizowanie i realizowanie komunikacji, z jednej strony, pomiędzy modułami systemu autoringowego, a z drugiej – pomiędzy narzędziami językowymi.
Aby zapewnić optymalną funkcjonalność, narzędzia językowe są sparametryzowane pod względem różnych funkcji. Parametry te mogą zostać albo uprzednio zdefiniowane albo wybrane przez użytkownika:

_ format tekstu, np. SGML użyty przez pilotażowy system użytkownika TIS
_ język źródłowy i docelowy, np. niemiecki, angielski, itd.
_ dziedzina, np. handel, konstrukcja, logistyka, itd. Dziedziny są zorganizowanie hierarchicznie.
_ planowana funkcja dla dwujęzycznej lub wielojęzycznej obróbki, np.
{sprawdzenie pisowni, składni i stylu
{indeksacja (przechowywanie zwrotu, np. skrótów i ich znaczenia, głównych tematów dokumentu, itd.)
{jedno- lub dwujęzyczne wyszukiwanie
{sprawdzenie terminologii   
{automatyczne generowanie glosariusza i produkcja dodatkowych materiałów do wykorzystania jako pamięci tłumaczeniowej oraz terminologicznych baz danych.

Jak już wspomnieliśmy, użytkownik może wybrać język źródłowy i docelowy z ustalonej listy języków. Jeśli nie wyznaczy on pary językowej, system wybierze język źródłowy ustawiony jako domyślny w jego profilu użytkownika. Wybór języka źródłowego jest sprawdzany poprzez składnik morfologiczny. Jeśli wybrany język nie jest zgodny z określonym tekstem, wybrany zostanie język zidentyfikowany poprzez analizę morfologiczną i wybór ten zostanie zasygnalizowany. Ten sam proces dotyczy wyboru dziedziny.

Analiza morfologiczna i ustalenie technicznej dziedziny każdego elementu tekstu są częścią automatycznego przetwarzania wstępnego, co również dostarcza użytkownikowi listę słów, które nie zostały znalezione  w bazie danych. Systemy  komercyjne również posiadają tę funkcję lub jej zmodyfikowaną wersję. Dodatkowo, opisana funkcja wstępnego przetwarzania informuje (interaktywnie) o liczbie wyrazów, które nie należą do określonej lub automatycznie rozpoznanej dziedziny. Dostarczana jest również informacja o średniej długości zdań, ponieważ ma to znaczenie w stopniu tłumaczenia tekstu.