Archive.today

site web d'archivage

Logo de Archive.today

AdresseSite officiel
Publiciténon
Type de siteArchivage web
Langueanglais
Inscriptionnon
Lancement2012
État actuelactif

Archive.today (anciennement archive.is) est un site web dont le but est d'archiver des pages web et dont le centre de données est situé en France, dans le Nord-Pas-de-Calais[réf. nécessaire]. Il fonctionne en utilisant Apache Hadoop et Apache Accumulo.

Particularité

Sa particularité est de capturer à la demande les pages web page par page afin de ne pas être affecté par l'éventuelle présence d'un fichier robots.txt[1]. Il est donc impossible d'interdire l'archivage de son site web, ce qui explique pourquoi ce site est fréquemment critiqué.

Références

Voir aussi

Articles connexes

Liens externes

🔥 Top keywords: