Czytelnia / Technologie tłumaczeniowe

Unikaj sekcji CDATA, które mogą zawierać przekładalny tekst

Sekcje CDATA zazwyczaj stosuje się po to, aby uniknąć powtarzania znaczników '<' i '&'. Niestety mogą one utrudniać pracę narzędziom, które wyodrębniają taki tekst. Problem więc stanowi sposób, w jaki należy traktować tekst CDATA, a nie pominięte znaczniki.<br />
<![CDATA[<p>Please refer to the
  index page
 
page for further information


Przykład 5: Problemy związane z sekcją CDATA

Podobne problemy wywołują przekładalne atrybuty. Nasuwa się więc pytanie, czy tekst należy traktować jako integralną część tekstu głównego? Czy pominięta sekwencja znaczników ma zostać przywrócona w trakcie tłumaczenia, czy może nie należy ingerować? Jak zareaguje program?

Napotkałem całe dokumenty XML, które były umieszczone jako CDATA wewnątrz głównego dokumentu XML. Poważny problem stanowił sposób, w jaki należy traktować tekst CDATA. Odpowiedź jest następująca: tekst należy najpierw rozpakować i powtórnie sparsować, a dopiero później rozpakować w celu tłumaczenia.

Jeżeli tekst w sekcjach CDATA nigdy nie ma być przetłumaczony, zamieść go wewnątrz predefiniowanych elementów i zostanie pominięty. Unikaj stosowania sekcji CDATA.


 

Please refer to the index page
 
page for further information




Przykład 6: Proponowane rozwiązanie

Dołącz raczej dokument zewnętrzny zamiast dokumentu XML umieszczonego jako CDATA:



Przykład 7: Dołączanie dokumentów zewnętrznych

Unikaj nieograniczonej przestrzeni nazw

W dokumentach poprawnych składniowo nie używaj takich elementów, jak przedstawione poniżej elm001, elm002, elm003.

<?xml version="1.0" ?>

  Cannot open file $1.
  Hint: does file $1 exist.
  Incorrect value.
  Hint: value must be between $1 and $2.
  Connection timeout.
  .
  .