Czytelnia / Technologie tłumaczeniowe

Jak poradzić sobie z wieżą Babel, czyli lokalizacja danych w XML

Andrzej Zydroń

tłum. Krystyna Furman

Źródło:

Andrzej Zydroń przedstawia w poniższym artykule trudności, które często napotykają początkujący autorzy, tłumacze i programiści języka XML, a także ukazuje sposoby na uniknięcie tych problemów. Wskazówki autora mogą przyczynić się nie tylko do zaoszczędzenia wykonawcom czasu, pieniędzy oraz bólu głowy, mogą również im pomóc w osiągnięciu  sukcesu.

Wstęp

Odkąd XML stał się standardem dla przechowywania, odzyskiwania i przekazywania informacji, wiele projektów posiada znaczne bazy danych w tym formacie. Bardzo często informacje w takich bazach wymagają tłumaczenia. Zazwyczaj w projektach wyzyskuje się wszystkie możliwości XML pod kątem generowania informacji, natomiast bardzo często nie wykorzystuje się w sposób maksymalny zalet tłumaczenia opartego na XML.

Istotą XML jest rozdzielenie formatu od treści. Dzięki temu dokumenty XML są łatwiejsze do zlokalizowania niż te, które powstały za pomocą tradycyjnych systemów przetwarzania lub składania tekstu. Jednak decyzje podjęte podczas tworzenia struktury XML i podczas redagowania dokumentu mogą mieć znaczący wpływ na to, czy tekst w języku źródłowym będzie z łatwością zlokalizowany w innych językach.

Na przykład błędy w dokumencie XML spowodowane nieodpowiednim użyciem narzędzi składniowych mogą negatywnie wpłynąć na tłumaczenie dokumentu oraz na koszty jego wykonania. Może nawet zaistnieć konieczność redagowania dokumentu od nowa, tak aby mógł zostać przetłumaczony. Warto więc zwrócić uwagę na sporą liczbę dokumentów XML, ponieważ są one potencjalnymi kandydatami do tłumaczenia.

Projektowanie dokumentów XML w celu ich tłumaczenia

Projektując dokument XML, należy pamiętać o konsekwencjach dla jego lokalizacji. Ze złych decyzji mogą wyniknąć istotne problemy dla procesu tłumaczenia, zwiększając jego koszty. Wszystkie przykłady przedstawione poniżej zakładają standardowy format pliku do tłumaczenia, tj. XLIFF (ang. XML Localization Interchange File Format).

Każdy, kto zamierza dostarczyć dokument XML bezpośrednio do tłumacza, już przy pierwszej próbie zreflektuje się, że nie jest to udany pomysł. Standardowy format chroni plik oryginalny i stanowi gwarancję, że otrzymany plik w języku docelowym będzie ekwiwalentny w stosunku do dokumentu w języku źródłowym.

Dodatkowym pojęciem związanym z lokalizacją dokumentów XML jest tzw. element inline. Elementy inline znajdują się w normalnym tekście (PCDATA - Parsable Character DATA), nie powodują zmian językowych ani strukturalnych, są jedynie częścią zawartości PCDATA.