Re: *.ps>*.txt (lub *.cos_innego)

Autor: Maciej Bartkowiak (mbartkow_at_et.put.poznan.pl)
Data: Mon 24 May 1999 - 11:38:23 MET DST


Dariusz K. Ladziak wrote:
>
> Ukryc sie nie da - tylko rozne tresci w tym tekscie bywaja...
> >Jesli chodzi o ekstrakcje tekstu z peesa to mozna zrobic to z programowego
> >interpretera ps takiego jak Ghostscript (jest tam taka opcja, ale dokladnie
> >nie pamietam jak sie nazywa), albo Adobe Distiler (produkuje pliki *.pdf) a
> >potem odczytujac pdf w Acrobacie skopiowac poprostu tekst.
>
> Taa... Zwlaszcza jak ci ktos czcionki sq... to duzo na tekst zamienisz
> - juz raczej chyba skonwertowac do jakiegos tiffa i przez ocr
> przepuscic.

Bzdury wypisujesz. Ghostscript MA mozliwosc wyekstrahowania samego
tekstu
z dokumentu postscriptowego. Najwygodniej zainstalowac sobie GhostScript
Alladin oraz GhostView. Oba sa za darmo.

--
Maciej Bartkowiak
========================================================================
Institute of Electronics and Telecommunication     fax: (+48 61) 8782572
Poznan University of Technology          phone: (+48 61) 8791016 int.171
Piotrowo 3A                             email: mbartkow_at_et.put.poznan.pl
60-965 Poznan POLAND               http://www.et.put.poznan.pl/~mbartkow
========================================================================


To archiwum zostało wygenerowane przez hypermail 2.1.7 : Tue 18 May 2004 - 18:33:25 MET DST