Andrzej P. Wozniak <uszer@poczta.onet.pl.invalid> napisał(a):
W przypadku PDF mamy pomieszanie z poplątaniem. Stare wersje standardu
przewidywały możliwość stosowania własnej tabeli znaków zamiast tabeli
unikodowej. W szczególności taka tabela może zawierać tylko znaki
faktycznie występujące w tekście (ponumerowane zwykle według jakieś
8-bitowej strony kodowej, rzadziej kolejno czy według częstotliwości
występowania) i tylko te glify z fontu są wbudowane w wygenerowany plik
PDF, co zmniejsza jego rozmiar.
W interesujących nas przypadkach mamy zwykle plik PDF zakodowany z użyciem
tabeli dla strony kodowej windowsowej (windows-1250) lub makowej
(x-mac-ce, 10029) zamiast tabeli unikodowej, więc po przekopiowaniu
znaki ASCII pozostaną na swoim miejscu, a zamiast polskich ogonków
zobaczymy znaki, które mają takie same numery w tabeli unikodowej, czyli
pochodzące z ISO-8859-1.
Ciekawe z tym PDF. Czy sytuacja z tą własną tabelą ma jakiś związek ze
standardem PDF/A?
--
Grzegorz Niemirowski
http://www.grzegorz.net/
OE PowerTool i Outlook Express: http://www.grzegorz.net/oe/
Uptime: 27 days, 10 hours, 34 minutes and 59 seconds
|