Re: Jak pdf --> txt

Autor: Maciej Guc' (guc_at_ibib.waw.pl)
Data: Fri 08 Sep 2000 - 13:46:30 MET DST


Rozwiazania sa dwa:
1. miec Adobe Acrobat, ale pelny zestaw - nie tylko Reader, i otworzyc
   PDF-a wyciagajac kawalki skladowe (uwaga to tylko teoria, nie
mialem jeszcze stycznosci z opisywanymi programami.
2. wydrukowac do pliku na bitmape (*.tiff , *.pcx)
   i potraktowac programem OCR
   rozwiazanie o tyle uniwersalne ze mam np. kilkusetstronnicowe
pliki dokumentacji w PDF zrobione ze skanow z oryginalnych
dokumentow,
   tam po prostu tych literek w postaci ASCII nawet najglebiej nie ma,
   ale ksztalt znakow pisarskich jest i mozna OCRem probowac

wpadlem jeszcze na

3. w przypadku gdy nie zachodzi uwaga z pkt. 2
   mozna wydrukowac do pliku postscriptowego
   i potraktowac programem do wyciagania tekstow ASCII z PSow
   (istnieja takie share- / freeware)
   mozna tez recznie wyluskiwac napisy jak ktos ma duza cierpliwosc

zycze powodzenia
   Maciek



To archiwum zostało wygenerowane przez hypermail 2.1.7 : Tue 18 May 2004 - 20:36:15 MET DST