Autor: Maciej Guc' (guc_at_ibib.waw.pl)
Data: Fri 08 Sep 2000 - 13:46:30 MET DST
Rozwiazania sa dwa:
1. miec Adobe Acrobat, ale pelny zestaw - nie tylko Reader, i otworzyc
PDF-a wyciagajac kawalki skladowe (uwaga to tylko teoria, nie
mialem jeszcze stycznosci z opisywanymi programami.
2. wydrukowac do pliku na bitmape (*.tiff , *.pcx)
i potraktowac programem OCR
rozwiazanie o tyle uniwersalne ze mam np. kilkusetstronnicowe
pliki dokumentacji w PDF zrobione ze skanow z oryginalnych
dokumentow,
tam po prostu tych literek w postaci ASCII nawet najglebiej nie ma,
ale ksztalt znakow pisarskich jest i mozna OCRem probowac
wpadlem jeszcze na
3. w przypadku gdy nie zachodzi uwaga z pkt. 2
mozna wydrukowac do pliku postscriptowego
i potraktowac programem do wyciagania tekstow ASCII z PSow
(istnieja takie share- / freeware)
mozna tez recznie wyluskiwac napisy jak ktos ma duza cierpliwosc
zycze powodzenia
Maciek
To archiwum zostało wygenerowane przez hypermail 2.1.7 : Tue 18 May 2004 - 20:36:15 MET DST