Dnia 09.11.2016 Marek J. <MarekJ@Koscielisko.pl> napisał/a:
> Jest tu może ktoś, kto ma doświadczenie w ściąganie serii danych z Google
> Drive?
[...]
> Może, ktoś już rozwiązywał podobny problem, albo macie jakieś inne pomysły,
> żeby cały proces od linku do pliku
> tekstowego zautomatyzować.
>
> Pozdrawiam,
>
To tak nie działa jak to sobie wyobrażasz.
To nie jest udostępniony Dokument Google, a "zwykły" plik, akurat tak
się złożyło że PDF. Możesz go pobrać w orginalnej postaci. Do
zautomatyzowania tego posłużyć się możesz dowolnym downloaderem (curl,
wget, itd).
curl.exe -JOL
"https://drive.google.com/uc?export=download&id=0B-n8zi4LbvWVLWs5N0N0Q1BtX3c"
Nie jest on zbyt skomplikowany, konwersja do czystego tekstu nie stanowi
żadnego kłopotu. Posłuż się dowolnym przyzwoitym narzędziem. Ot mogę
polecić Poppler.
https://sourceforge.net/projects/poppler-win32/
pdftotext.exe -layout Kom_01_2016.pdf
Możesz dokonać tego z pomocą Google Drive. Pobrać stosowne pliki.
Zaimportować do własnego konta jako dokument "Google Docs" i wyeksportować w
stosownym formacie - plain/text, plain/html.
Do wszystkich tych operacji możesz się posłużyc świetnym narzędziem do
obsługi Google Drive z linii poleceń - gdrive.
https://github.com/prasmussen/gdrive
|