COMUNICACIóN, TECNOLOGíA

Internet Archive, la biblioteca de Alejandría de la era digital

Internet Archive, la biblioteca de Alejandría de la era digital

Por Zuberoa Marcos | Noelia Núñez | 17-05-2017

Brewster Kahle

Brewster Kahle

Fundador de Internet Archive

Las evidencias arqueológicas no demuestran de forma categórica que la mítica biblioteca de Alejandría tuviera las dimensiones fabulosas que todos suponemos. No hay suficientes fuentes que permitan describir con exactitud cuántos volúmenes albergó, cómo estaban ordenados o cuál era el trabajo de los bibliotecarios. Sí es seguro que existió, que en el siglo III antes de nuestra era la mandó construir Ptolomeo I, rey de Egipto y lugarteniente de Alejandro Magno (el fundador de la ciudad), y que pretendía reunir todo el saber humano acumulado hasta la fecha. A partir de aquí la mayoría de los datos son confusos e incluso contradictorios, puesto que ni tan siquiera existe un acuerdo acerca de cuál fue su final: si se destruyó en el incendio provocado por Julio César, o si el declive vino posteriormente provocado por los saqueos que ordenaron los emperadores romanos cristianos que pretendían acabar con las herejías, o si fue expoliada durante la conquista musulmana, al considerar las obras -también ellos, triste coincidencia- blasfemas. En cualquiera de los casos, la biblioteca de Alejandría ha quedado grabada en el imaginario como un lugar donde floreció el conocimiento y el respeto por encima de las diferencias, y también como un símbolo de la ignorancia que los maniqueísmos fanáticos pueden provocar.

Por eso es normal que cuando Brewster Kahle hable de The Internet Archive, un proyecto que le ha ocupado media vida, haga referencia a la biblioteca egipcia: “la idea es construir la biblioteca de Alejandría de la era digital. ¿Podemos coger toda esta tecnología y hacer algo grandioso? ¿Podemos hacer que todas las obras públicas de la humanidad estén disponibles para todo el mundo?”. La propuesta suena, desde su propia formulación, inabarcable, pero Kahle ha conseguido con su idea reunir una cantidad de información impresionante: 286 mil millones de webs (incluyendo una máquina del tiempo que permite visitar versiones antiguas de sitios o páginas que ya no existen), 12 millones de textos, 3,3 millones de archivos de vídeo, una cantidad similar de audios, un millón y medio de fotografías, más de un millón de shows de televisión, 176.000 conciertos y 171.000 programas de software. El proyecto nació en 1996, cuando Internet daba sus primeros pasos, para recopilar páginas webs y que estas no se perdieran y año tras año fue ampliando y diversificando sus fondos. Desde 2005 digitalizan 1.000 libros al día que están a disposición de cualquiera, bien en descarga gratuita si los derechos así lo permiten, o bien mediante un préstamo.

Kahle, que se define a sí mismo como “bibliotecario”, es uno de los pioneros de Internet.  Graduado en inteligencia artificial por el MIT, trabajó con supercomputadoras y en 1989 creo el primer sistema de publicación para Internet. Ser protagonista de aquellos inicios es lo que le hace mantener el espíritu original de quienes vieron en la web una posibilidad para mejorar el mundo. Por eso, a pesar de que el objetivo de The Internet Archive pudiera parece el proyecto de un megalómano ensoñador, Kahle cree que el intento de que todo el conocimiento sea compartido merece la pena en sí mismo por complejo que resulte. Y vuelve a su ejemplo predilecto, la biblioteca de Alejandría, para argumentar que no debemos permitir que otro incendio -real o digital- haga que se pierdan tantas obras humanas valiosas.

Edición: Noelia Núñez | David Castañón
Texto: José L. Álvarez Cedena

Transcripción de la conversación
BREWSTER KAHLE
00:05
Me llamo Brewster Kahle y soy básicamente un friki de la informática. Mi idea es construir una Biblioteca de Alejandría para la era digital. Podríamos utilizar la tecnología para crear algo grande. Podríamos hacer accesibles para todo el mundo todas las publicaciones de la humanidad.

Mucha gente encuentra las cosas a través de Google. Acceden, buscan algo y puede que acaben entrando al Internet Archive. Alrededor de tres o cuatro millones de usuarios al día utilizan el Internet Archive, pero la mayoría no tiene ni idea de que han estado ahí.

Internet Archive intenta completar las partes de Internet que no se han incorporado a la biblioteca. El objetivo de la Biblioteca de Alejandría era recopilar todas las obras de todas las personas del mundo. Fue el epicentro del conocimiento desde el año trescientos antes de Cristo hasta el trescientos después de Cristo, más o menos, porque recogía todas las obras del mundo.
BREWSTER KAHLE
01:12
Creamos el Internet Archive hace veinte años para completar las partes que faltaban, así que empezamos por archivar la World Wide Web. Tomamos una captura de cada página dentro de cada sitio web cada dos meses. Capturas, capturas, capturas. Actualmente tenemos más de quinientos mil millones de páginas accesibles públicamente. Después empezamos con películas, música y televisión. Grabamos sesenta canales de televisión las veinticuatro horas del día. ¿Podemos realizar una visión global de Internet? La respuesta es sí, sin duda. Solo tenemos que hacerlo.

En Internet Archive la gente puede subir archivos. Hazlo, por favor. Sube todo lo que sea importante para ti. Hemos visto que la gente quiere asegurarse de que las cosas llegarán a la siguiente generación: libros, películas, música, páginas web, programas… Tuvimos la idea de disponer software antiguo de Apple, de Commodore 60 o de Atari; hardware que ya no existe. Pero ¿cómo podemos mantener vivos los bits? Pues mediante emuladores de estas plataformas antiguas en los navegadores. Puedes hacer clic y obtener la interfaz de un ordenador antiguo de IBM y acceder a ese viejo juego de los ochenta. Esto ya está en marcha en archive.org.
BREWSTER KAHLE
02:34
Twitter, YouTube, Instagram, Vine... estamos archivando todo esto. En las elecciones de Estados Unidos, la mayor parte se desarrolló en Twitter. No solo estamos archivando los tuits de Trump, desde el principio, sino también las conversaciones que se generan.

Las redes sociales son esenciales para comprender nuestro mundo, pero Facebook, por ejemplo, es un gran problema. Hay algunas que no se han diseñado para acumular contenido, como Snapchat, así que no las recogemos. No recopilamos contenido que no sea de acceso público.
BREWSTER KAHLE
03:04
Almacenar toda esta información requiere mucho espacio y se almacena aquí. En los servidores que veis detrás de mí se almacenan alrededor de cinco petabytes de los treinta petabytes que componen la copia primaria original. Pero hay otra copia también en San Francisco. Además, hay una copia parcial en Ámsterdam y otra en Alejandría, Egipto. En serio. El objetivo es tener varias copias. Si intentamos crear la segunda versión de la Biblioteca de Alejandría, aprendamos de la primera versión, que ya no existe.

Lo que pasa con las bibliotecas es que las queman, y, por lo general, las queman los gobiernos, a los que no les gustan las novedades. En cualquier caso, la amenaza no sería igual en todas partes, de modo que no perderíamos esta gran biblioteca igual que hemos perdido prácticamente todas las grandes bibliotecas del pasado.
BREWSTER KAHLE
04:00
Yo creo que el mayor obstáculo que nos vamos a encontrar será la privatización. Por ejemplo, el iPhone de Apple es una plataforma cerrada, completamente opuesta a lo que es Internet. Es una empresa la que decide su contenido.

Necesitamos tres cosas básicas para crear la biblioteca. Una es pasar todo lo que compone el mundo analógico a la red. Lo siguiente es conservar todo el material digital, es decir, las páginas web, la televisión y las cosas que ya están en formato digital. Y, por último, ¿podemos construir un futuro mejor?
BREWSTER KAHLE
04:39
En realidad, Internet no se creó con el fin de conservarse. ¿Sería posible crear una red que no dependa de ningún hardware? Es un sistema fiable basado en transferencia de pares. Los archivos viven en varios sitios. Son eficaces, son rápidos. Están respaldados por copias anteriores que se capturaron. Si tienes este sistema, es más difícil saber quién está leyendo qué, es decir, el lector tiene privacidad. Así que subamos a Internet los archivos antiguos, preservemos lo que está online y desarrollemos mejores tecnologías que sirvan mejor a la humanidad. A eso lo llamamos la «Red Descentralizada».

La Red Descentralizada está ahí desde el principio. Vint Cerf, Tim Berners-Lee, IPFS, WebTorrent, BitTorrent… Ha habido mucha gente que ha trabajado para construir algo mejor. Quizá no despierte el interés del gran público, pero es emocionante.