La mémoire d'Internet est-elle condamnées à l'oubli ?

La mémoire d’Internet est-elle condamnée à l’oubli ?

Comment les chercheurs et historiens de demain vont-ils percevoir notre monde d’aujourd’hui ? Que deviendront nos données numériques dans 100 ans, 1000 ans… Comment les conserver et comment les transmettre aux générations futures ?

Des supports informatiques peu résistants au temps

Nous n’avons jamais autant produit d’information depuis l’ère du numérique. Mais nous n’avons toujours pas trouvé le support informatique qui puisse les conserver aussi longtemps que la pierre (10 000 ans), le parchemin (1000 ans)…
Brewster Kahle fondateur d’Internet Archive :

“Alors qu’il est possible de lire un livre ancien de 400 ans imprimé par Gutenberg, il est souvent difficile de lire une disquette informatique qui a 15 ans ».

Lorsque le CD ROM est arrivé nous étions persuadés d’avoir trouvé un support idéal, durable pour préserver nos données informatiques. Mais ils craignent le soleil et la poussière. 15 % des CD ROM ont une durée de vie d’une année, les 85 % restant peuvent durer 20 ans.
Les disques durs sont sensibles aux chocs et se démagnétisent. Leur durée moyenne de vie est de 5 ans.

L’obsolescence du matériel informatique oblige de migrer tous les dix ans nos fichiers sur de nouveaux supports pour pouvoir les préserver. Et aujourd’hui le meilleur moyen d’archiver les données restent encore le papier et l’encre utilisés par exemple pour archiver les données sur les déchets nucléaires et les transmettre aux archéologues et géologues du futur.


Les chercheurs se penchent alors sur d’autres supports qui pourraient-être plus fiables comme :

  • le quartz, un minéral résistant à des températures de 1000 degrés Celsius ou en encore à des bains d’acide. Les données y sont gravées par un laser dans la masse et elles sont lisibles par un simple microscope. Mais le quartz ne permet pas de conserver des trillions d’octets.
  • l’ADN est peut-être une solution d’avenir. Il peut stocker toute la mémoire numérique du monde dans 2m3 et peut se conserver plus d’un demi-million d’années.

La conservation de la mémoire d’Internet

Le monde d’Internet est en constante évolution. Les pages d’un site web ne cessent de se modifier et s’adaptent en fonction des internautes. Tous les jours, des sites web disparaissent et d’autres se créent.
Brewster Kahle fondateur d’Internet Archive :

 “Un site Web change ou disparaît tous les quatre-vingts jours en moyenne. Et c’est notre culture, notre histoire, la trace de nos vies qui disparaissent. Le Web a besoin d’une mémoire.”

Pour que la mémoire du Web ne tombe pas dans l’oubli, Brewster Kahle fonde en 1996 Internet Archive, la future bibliothèque numérique d’Alexandrie. Les premiers sites archivés étaient en relation avec les élections présidentielles américaines. Internet Archive reste aujourd’hui la bibliothèque du web la plus riche.

Cette initiative a été reprise par d’autres bibliothèques dans le monde. En France la BNF a commencé son travail d’archivage du web en 2000 en conservant les sites web liés aux élections présidentielles de 2002.

La méthode utilisée pour archiver le Web est de prendre des photographies instantanées du Web plusieurs fois par jour pour rendre compte du dynamisme d’un site web qui évolue sans cesse.

En 2003 Internet Archive et la BNF lance l’International Internet Preservation Consortium qui aujourd’hui réunit une cinquantaine d’institution d’archivages du Web.

Pour que les historiens et chercheurs de demain puissent explorer cette masse d’information, des algorithmes sont nécessaires pour interconnecter toutes ces données numériques et leur donner du sens. Aux Archives de Venise, des milliers de documents relatifs à la vie des citoyens et de la ville sont numérisés et analysés pour recréer et décrire la micro histoire des Vénitiens.

Les algorithme sont nécessaires à la compréhension de la mémoire du web. Aux États-Unis, la société IBM a crée une interface, un super calculateur nommé Watson, qui peut analyser 200 millions de pages en 3 secondes.

Sources :
> future.arte.tv : Archivage numérique : le défi de l’obsolescence technologique
> bnf.fr : Historique de l’archivage du web à la BnF
> arte.tv : Nos ordinateurs ont-ils la mémoire courte ?
> blog.archive.org :  Internet Archive
> lemonde.fr : Vingt ans d’archivage du Web : les coulisses d’un projet titanesque
binaire.blog.lemonde.fr : Numérique : ne perdons pas la mémoire

Auteur : Denis ALLARD

Denis ALLARD
Rédacteur Web sur le blog studiovitamine depuis 2009, j'ai pu mesurer l'évolution fulgurante du web, des nouvelles technologies, du e-commerce... Quand je n'écris pas pour le web, je me consacre à l'ergonomie, au référencement naturel et à la formation universitaire des futurs concepteurs de sites...

Commentaires Facebook

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *