W dniu 2016-11-10 o 01:11, 2late pisze:
On 09/11/2016 11:09, Marek J. wrote:
Jest tu może ktoś, kto ma doświadczenie w ściąganie serii danych z Google
Drive?
Mój SO to w8.1
Mam taki nietypowy przypadek. Jest sobie strona z danymi, która zawiera
około 150 linków do plików pdf(?)
przykładowy link wygląda tak
https://drive.google.com/file/d/0B-n8zi4LbvWVLWs5N0N0Q1BtX3c/view
Link uruchomiony w przeglądarce wygląda dziwnie. W nagłówku ma
Kom_01-2016.pdf Dysk Google. Po lewej stronie ma napis
Kom_01-2016.pdf, a w
środku dokument, który nie wygląda na pdf.
PDF średnio mnie interesuje bo chcę wyciągnąć dane liczbowe z tabeli.
Próbuję więc zapisz jako txt. Chrome w ogóle nie ma takiej opcji, IE
zapisuje bardzo dużą kobyłę z ogromną ilością html-u ( na końcu jest
jednak
zwykły tekst), Firefox zapisuje krótki plik tekstowy, z którego można
wyciągnąć liczby. Sukces?. Nie. Bo jak są braki w wierszu w tabeli to je
pomija. Liczba wyników jest mniejsza i nie wiadomo, który brakuje.
Sredni moge o tej porze myslec i nie wiem dokladnie o co ci chodzi ale
otworzylem ten twoj link w firefoxie i zapisalem na pulpicie w
widndowsie 8.1 jak plik.txt
Masz rację. Całkowitą rację ;) nie wiesz dokładnie, o co chodzi.
Przede wszystkim chodzi o dostęp do _setek_ linków, a w zasadzie do
danych z dokumentów umieszczonych pod tymi linkami.
Ty by pasowało coś w rodzaju WebClient() z C# i parsowanie z ekranu. Ale
w tym przypadku chyba nie przejdzie.
--
Pozdrawiam.
Adam
|