Macchina del ritorno

Article

July 3, 2022

La Wayback Machine (pronunciato [ˈwejbak maˈʃin]) è un servizio e un database che contiene copie di un gran numero di pagine o siti Internet. In conseguenza di questo progetto è anche possibile consultare lo storico o le modifiche delle pagine nel tempo.

Caratteristiche

Il servizio Wayback Machine funziona in modo semplice: basta digitare l'indirizzo (URL) di una pagina web per vedere qual è l'ultima copia che viene salvata nel file.[2] Se vogliamo vedere quale pagina si tratta, allora la Wayback machine ci chiederà in quale data e anno vogliamo visitare la pagina. C'è un calendario nella parte superiore dello schermo, che consente di visualizzare graficamente le acquisizioni nel tempo. La lunghezza delle barre nel grafico indica in quali mesi è stata eseguita la maggior parte delle copie. Quello che fa questo sito per memorizzare tutto il contenuto della pagina web è molto semplice ma geniale: memorizza solo il contenuto html del codice sorgente e non salva le immagini ma solo il codice; quindi, quando un server di immagini rimuove un'immagine dal sito Web originale, non viene riprodotta, ma è contrassegnata come errore 404. Nel 2012 conteneva 10 petabyte di informazioni ed è cresciuta di circa 20 terabyte al mese, [3] Il suo spazio di archiviazione ha superato 20 petabyte a ottobre 2019. [4] A dicembre 2020, la sua memoria ha superato i 70 petabyte.[5] Tuttavia, Wayback Machine è lungi dall'essere una copia completa di Internet poiché diversi siti evitano l'indicizzazione e la registrazione delle informazioni, ad esempio utilizzando il file robots.txt con: Agente utente: ia_archiver Disallow: /

API del server CDX Wayback

Da novembre 2015, Wayback Machine dispone di un servizio di indicizzazione della cattura delle pagine che permette, rapidamente, di conoscere la cronologia delle registrazioni per ogni URL sia nel proprio formato che in formato JSON.[6] Questo servizio è un progetto in fase beta chiamato Wayback CDX Server API e il cui codice sorgente e manuale utente sono ospitati su GitHub.[7]

Incidenti

Nel corso della sua storia, la Wayback Machine ha presentato una serie di incidenti, i più importanti dei quali sono stati i seguenti: Nel gennaio 2017, hanno sviluppato un plug-in, sia per il browser Chromium che per Google Chrome, [8] che consente di salvare la pagina Web che si sta visualizzando, scoprire se quella pagina è stata precedentemente salvata in Wayback Machine e persino ti permette di fare una ricerca veloce su Twitter, tra le altre funzionalità. Il plug-in è elencato correttamente nel Chrome Web Store. [9] Nell'ottobre 2020, il sito Wayback ha smesso di funzionare.

Riferimenti

Collegamenti esterni

e https://web.archive.org Sito ufficiale (in inglese)