Szanowna Redakcjo – witam i pozdrawiam!
Mam nadzieję, że pomożecie rozwiązać mi pewien problem. Otóż chciałbym zapisać na dysku twardym dużą ilość stron z kilku serwisów internetowych – potrzebuję stałego dostępu do zawartych tam informacji. Tymczasem Neostrada jest tak zawodna, że nigdy nie wiem kiedy odmówi współpracy.
W tym miejscu polecilibyście mi zapewne jakiś program do ściągania całych witryn, lecz ta opcja odpada z prostego powodu – zbyt duża ilość stron, z których nie będę korzystać, a które tylko będą zapełniać dysk. Wyszukiwanie i usuwanie tych zbędnych plików HTML i folderów zajęłoby mi tyle samo czasu co ręczne zapisywanie plików, których potrzebuję. Dlatego właśnie wolę mozolnie ręcznie to zapisywać niż użyć webripera. A sedno mojego problemu tkwi w nazwach plików HTML. Jeśli będę je zapisywał ręcznie, to przy późniejszym przeglądaniu nie będą widoczne grafiki, skrypty, arkusze stylów itp.
Pytanie brzmi: czy istnieją jakieś skrypty, dzięki którym możliwe byłoby automatyczne usuwanie zbędnej frazy w nazwie pliku, w momencie zapisu do folderu docelowego? I czy za pomocą jakiegoś skryptu można również, podczas zapisu na dysk, automatycznie zmieniać rozszerzenie (np. z .html na .mhtml i sposób kodowania tekstu?
DamianNigdy nie słyszałem o tego rodzaju skryptach, myślę, że z prostego powodu – opisany przez Pana problem został niepotrzebnie wyolbrzymiony. Tak naprawdę nie trzeba go wcale rozwiązywać, wystarczy \”zgodzić\” się na to co oferują współczesne kopiarki witryn (ang. offline browsers, webrippers). A więc, jeśli się da, wyselekcjonować do pobrania tylko te pliki HTML, którymi jest Pan zainteresowany. Każda kopiarka witryn ma zestaw filtrów, który może pomóc w precyzyjnym określeniu co ma być pobierane (np. filtr według wielkości pliku, według nazwy z zastosowaniem masek itp.)
Jeśli się nie da, należy zgrać całą witrynę na dysk, ale np. z pominięciem plików przekraczających dajmy na to 100 czy 200 kB. W ten sposób będzie można zaoszczędzić nieco miejsca na dysku. Z drugiej strony chyba nie ma potrzeby robienia aż takich oszczędności, zważywszy na to, że większość witryn zajmuje niewiele miejsca, zaś współczesne dyski twarde mają duże pojemności. Poza tym zawsze można spakować ściągniętą witrynę do archiwum ZIP czy RAR i rozpakowywać ją tylko wtedy, gdy zechcemy ją przeglądać.
Użycie kopiarek witryn daje ogromną korzyść: zawartość całej pobranej witryny zostaje automatycznie i inteligentnie przelinkowana, dzięki czemu witrynę można oglądać w trybie offline tak samo, jakby się to odbywało online.
Jedna z najlepszych kopiarek witryn to Offline Explorer (http://www.metaproducts.com), popularny i chwalony jest także Teleport Pro (http://tenmax.com). Darmowa alternatywa to HTTrack (http://www.httrack.com). (JB)