PianoWeb, la tua Agenzia di Web Marketing.
Operativi a Grosseto, Siena, Arezzo, Firenze, Prato, Livorno, Pisa, Pistoia e Lucca.
Contattaci senza impegno
Saremmo lieti di fissare un appuntamento per conoscere le tue esigenze e trovare la miglior soluzione per migliorare il tuo Business.

+39 347 14 39 263

info@pianoweb.eu

Via Tripoli 41 58100 Grosseto

Via Tripoli 41 58100 Grosseto

Top

Come scaricare copie di siti scaduti – Wayback machine downloader

PianoWeb SEO e Marketing / Articoli  / Come scaricare copie di siti scaduti – Wayback machine downloader

Come scaricare copie di siti scaduti – Wayback machine downloader

Internet archive Wayback machine

Internet archive – Wayback machine è un archivio storico di oltre 279 miliardi di pagine Web, un sito Web che consente ai suoi visitatori di consultare pagine Web e in alcuni casi anche interi portali nel corso del tempo. Internet archive memorizza continuativamente migliaia e migliaia di pagine, con priorità rivolta ai siti più popolari, e le rende disponibili in un indice temporale facilmente consultabile. Basta un click per rendersi conto dell’effettiva potenzialità di tale strumento, in particolar modo quando si ha a che fare con il recupero di domini scaduti. Capita spesso, infatti, sia per errori umani sia per una strategia SEO di voler ripristinare, provvisoriamente, una versione del sito quanto più simile a quella originale completa di CSS immagini e javascript.
Può esserci d’aiuto una libreria in Ruby che, in combinazione con le API di wayback machine, consente di scaricare la copia integrale del sito Web tramite riga di comando.

Cosa fare per scaricare rapidamente la copia storica del nostro sito?

Scarica Ruby (per Windows)

Scarica l’ultima versione di Ruby ( >= 1.9.2 ) a questo indirizzo, installala e passa al punto successivo.

Importa lo script Wayback Machine Downloader

 

wayback machine downloader

Esegui come amministratore il prompt dei comandi con Ruby.

Installa la libreria di wayback_machine_downloader digitando questo comando:

Cerca la versione del sito Web da scaricare

Ho effettuato il primo esperimento sul vecchio sito di PianoWeb

http://web.archive.org/web/20120826121114/http://pianoweb.eu/

Avvia il download

Il comando per scaricare interamente quello snapshot da riga di comando (prompt di comandi con Ruby) è:

download-wayback-machine-pianoweb

I tempi per il download dipendono dalla macchina che utilizziamo, dal tipo di connessione a disposizione e dall’intasamento del server di Wayback Machine, un sito sempre molto sovraccarico e lento. Per un sito di poche pagine occorreranno una decina di minuti.

Nel nostro caso il sistema ha impiegato 1160 secondi (quindi quasi 20 minuti).

Il risultato, da un punto di vista grafico non è stato molto soddisfacente, ma abbiamo comunque salvato correttamente tutte le pagine del sito Web, con tutti i contenuti divisi cartella per cartella.

wayback-salvataggio

Cosa ne pensi? Hai sperimentato questa libreria?

Fammi sapere come ti sei trovato lasciando un commento qua sotto.

Buon download 😉

 

Fonti:

Libreria su Github

Missing Tricks

Un’idea nata da alcune discussioni sui gruppi facebook Fatti di SEO e Da Zero a SEO

Share

Esperto di comunicazione e marketing, con laurea magistrale in "Teoria della comunicazione e tecniche dei liguaggi persuasivi", ho fondato nel 2013 PianoWeb, agenzia di Web marketing & SEO dopo circa 10 anni di esperienza in campo Web. Amo la musica, investire in persone e nuovi progetti. Suono il pianoforte.

No Comments

Post a Comment