Lista winnt@man.lodz.pl
[Lista archiwów] [Inne Listy]

Re: [WINNT] Problem z odczytem plików

To: winnt@man.lodz.pl
Subject: Re: [WINNT] Problem z odczytem plików
From: "Grzegorz Niemirowski" <gnthexfiles@poczta.onet.pl>
Date: Sun, 10 Nov 2013 00:06:08 +0100
Andrzej P. Wozniak <uszer@poczta.onet.pl.invalid> napisał(a):
W przypadku PDF mamy pomieszanie z poplątaniem. Stare wersje standardu
przewidywały możliwość stosowania własnej tabeli znaków zamiast tabeli
unikodowej. W szczególności taka tabela może zawierać tylko znaki
faktycznie występujące w tekście (ponumerowane zwykle według jakieś
8-bitowej strony kodowej, rzadziej kolejno czy według częstotliwości
występowania) i tylko te glify z fontu są wbudowane w wygenerowany plik
PDF, co zmniejsza jego rozmiar.
W interesujących nas przypadkach mamy zwykle plik PDF zakodowany z użyciem
tabeli dla strony kodowej windowsowej (windows-1250) lub makowej
(x-mac-ce, 10029) zamiast tabeli unikodowej, więc po przekopiowaniu
znaki ASCII pozostaną na swoim miejscu, a zamiast polskich ogonków
zobaczymy znaki, które mają takie same numery w tabeli unikodowej, czyli
pochodzące z ISO-8859-1.

Ciekawe z tym PDF. Czy sytuacja z tą własną tabelą ma jakiś związek ze standardem PDF/A?

--
Grzegorz Niemirowski
http://www.grzegorz.net/
OE PowerTool i Outlook Express: http://www.grzegorz.net/oe/
Uptime: 27 days, 10 hours, 34 minutes and 59 seconds

<Pop. w Wątku] Aktualny Wątek [Nast. w Wątku>