He leído con suma atención el artículo que Jean-Claude Guédon ha escrito como réplica a otro artículo que mi admirado Robert Darnton escribió en The New York Review of Books hace un mes y medio.
Darnton alababa de manera optimista las ventajas que tiene la digitalización de libros en la actualidad, y cómo el proyecto de Google Books conducirá a nuevo modo de investigar, determinado por el acceso inmediato a la información; giro este, sólo equiparable al que supuso la generalización de la imprenta en Europa durante la segunda mitad del siglo XV y comienzos del siglo XVI. En sus propias palabras:
In 2006 Google signed agreements with five great research libraries—the New York Public, Harvard, Michigan, Stanford, and Oxford’s Bodleian—to digitize their books. Books in copyright posed a problem, which soon was compounded by lawsuits from publishers and authors. But putting that aside, the Google proposal seemed to offer a way to make all book learning available to all people, or at least those privileged enough to have access to the World Wide Web. It promised to be the ultimate stage in the democratization of knowledge set in motion by the invention of writing, the codex, movable type, and the Internet.
Como Darnton sugiere en otro lugar del artículo, su acercamiento al proyecto de Google es el de un entusiasta, un erudito, un historiador de la cultura, que comprende las dificultades de su oficio y que ve las posibilidades de ahorro de tiempo y de recursos tanto para el investigador como para la persona interesada por la cultura. Hasta aquí nuestro entusiasmo es compartido. Sin embargo, Guédon pone de manifiesto varios aspectos que parecen escapársele a Darnton:
- El modo en que Google limita el libre uso de esos textos.
- El modo en que Google se convierte en mediador necesario entre el objeto cultural y el lector.
A mí, como usuario con una profunda convicción sobre las bondades de los textos digitales —y con una biblioteca digital propia que comienza a ser la pesadilla de cualquier disco duro— me interesa especialmente la primera. Pero Guédon argumenta de modo convincente la indisolubilidad de ambas.
Cuando uno accede a Google Books y pasa allí una tarde, acaba llegando a la conclusión de que se trata de un espacio mal pensado. Digo esto porque a mí se me ocurren bastantes más cosas que hacer con los libros que las que se me permiten. La primera de ellas es realizar búsquedas cruzadas mediante operadores booleanos en un conjunto de textos que yo elija, la segunda es comprobar las ocurrencias de un conjunto determinado de fórmulas textuales para identificar estilos, fuentes y demás, y así un largo etcétera. Es evidente, como bien explica Guédon, que Google necesita limitar el acceso y el tratamiento de los libros en orden a proteger su “modelo de negocio”, y es evidente que el lector que no hace de la lectura y del análisis textual su trabajo apenas notará esta diferencia a la hora de acceder a los libros.
Aquí entramos en otro problema importante: existen lectores interesados en muchos de los temas que ocupan a los historiadores; pero son pocos los que pueden aproximarse a ellos con cierta desenvoltura —¿y quién lo hace?, en realidad— a ellos. El trabajo del historiador es describir, exponer, sintetizar los datos de modo claro para que la interpretación posterior de los mismos albergue un mínimo interés para el lector culto; de no ser así, su trabajo habrá de reinterpretarse o quedar relegado al olvido.
Probablemente todos los libros del mundo acaben por digitalizarse, y ello transformará indudablemente nuestro modo de relacionarlos con el libro, la información y la historia. En un futuro quizás no muy lejano, el trabajo de los profesores de humanidades estará mucho más centrado en enseñar cómo gestionar los contenidos que en los contenidos mismos, o sencillamente desaparecerá. Esto plantea nuevos retos: el giro en el modelo educativo, si las estructuras más esclerotizadas del sistema lo permiten, va a ser radical. Aquí es fundamental allanar el camino no al cambio, y sí a la dura batalla por mantener el sentido de toda esa masa informe. Está en juego, en el fondo, el modo en que el pensamiento occidental se relaciona con su historia y, valga la redundancia, con la historia de su pensamiento. Si nos preparamos para el cambio, veremos estudios que durante el siglo pasado eran impensables por ambiciosos y complejos; si no, el hecho de tener digitalizados todos los libros del mundo probablemente solo signifique una excusa para la desaparición de la memoria y de las endebles relaciones que hemos creado entre ellos durante siglos. Del mismo modo, cambiará el hábito de lectura y de análisis con él. Ahora bien, para que esto suceda es preciso que se creen las herramientas necesarias y se comprendan de modo claro las vías para simplificar o complicar infinitamente la consulta de textos y demás materiales.
Google limita estas posibilidades, paradojas de los nuevos tiempos, al ofrecerlos. Su papel como mediador, como señala Guédon, hace que las mismas bibliotecas con las que trabaja no puedan explorar el auténtico potencial de una inmensa biblioteca digital. Sumado a esto, el trabajo de digitalización de Google es un tanto mediocre en ocasiones, no solo por lo que toca a la calidad de la resolución, sino a errores de bulto en repetición y omisión de páginas, como señalaba Robert B. Towsend en otro artículo que —de momento[^1]— es de referencia sobre el particular, o también las referencias en xml, bibtex y demás, que son un 90% de las veces erróneas.
Hay iniciativas que pretenden cambiar esta situación con muy diversos logros. En esta entrada sólo haré referencia a dos de ellas como modelos distintos de trabajo y de perspectivas:
Por una parte, The European Library, un proyecto que tiene como meta a largo plazo digitalizar todos los documentos del viejo continente y que sin embargo tiene todo el aspecto de ir a la deriva precisamente porque no comprende, como le pasa a Gallica —incluida en ésta—, que no basta con la presencia de imágenes montadas en un pdf, si no ofrecen un texto que pueda ser rastreado.
Por otra, The Internet Archive, que últimamente se está convirtiendo en mi repositorio favorito por varias razones: la primera es que se trata de una plataforma libre y abierta, donde hay textos digitalizados por multinacionales como microsoft, por entidades y archivos públicos, por usuarios particulares, y forman un gran colectivo con un interés continuo por mejorar la calidad de sus contenidos y ampliarla. The Internet Archive no se limita a hacer acopio de textos, sino que alberga contenidos de todo tipo, que o bien han perdido sus derechos de copia privada, o bien han sido creados bajo una licencia Creative Commons, o bien han sido donados por sus autores o por casas editoriales que poseían los derechos. Lo bueno de Internet Archive es que tiene detrás una comunidad muy crítica y muy activa, un grupo amplio y preparado de comisarios (curators) que se encargan de revisar, reseñar y recomendar los contenidos.
Por supuesto, ninguna de las dos realiza la tarea que he mencionado anteriormente, incluso Google Books sigue siendo superior en posibilidades de búsqueda. Pero me parece que Internet Archive cuenta con un factor que va a ser esencial en el futuro de la lectura y el estudio en Internet: la creación de una comunidad crítica y especializada en torno a esos contenidos. Se trata una de las dos piezas, siendo la otra la creación de instrumental semántico y relacional adecuado, esenciales para que las bibliotecas virtuales no corran la suerte de las bibliotecas tridimensionales. Y a mí me fascina la idea de convertirme en bibliotecario, aunque sea un bibliotecario modesto y achacoso, de este mundo virtual.
Algunas lecturas de interés para una postura coherente hacia Google Books:
Google Books vs. Bison, de Mark J. Ludwig y Margaret R. Wells. Estupendo artículo de The Library Journal escrito desde el punto de vista de documentalistas y bibliotecarios, que contrastan el uso de Google Books con el sistema de información bibliográfica de la Universidad de Buffalo (BISON), los resultados del análisis derivan en la derrota absoluta de Bison ante el gigante de Silicon Valley. Las conclusiones, me parece, las correctas: teniendo en cuenta el progreso en la digitalización de fondos enormes, la carrera ya está perdida en cuanto a la creación de más documentos, pero la creación de servicios en torno a los archivos es el que ofrece un campo ilimitado de posibilidades, a la vez que prácticamente desierto por el momento.
Para los ataques de distintos grupos editoriales Europeos y algunas de sus instituciones contra Google Books, puede verse lo que ha pasado en Francia (1, 2, 3 y 4) o en Alemania. Y, por contraste, todo (1, 2 y 3) lo que ha pasado en España.
Para las bondades de Google Books dentro del ámbito académico —fuera de artículos de opinión como el mencionado de Darnton—, puede entrarse con buen pie vía el análisis que Gregory Crane le dedicó al auge de las bases textuales en internet hace un par de años y a las ideas de Tim O’Reilly sobre las necesidades de computar toda la masa bibliográfica que aporta el repositorio y algunos ejemplos de cómo serían modelos básicos de análisis. Está claro que también puede acudirse a este recorte del documental «El mundo según Google» que habla de Google Books:
- Por último, me queda hacer referencia a la lista de recursos para la investigación en Internet que Anthony Grafton hizo en The New Yorker hará cosa de un año. Es a su vez una fenomenal introducción al uso de las bases de datos y las bibliotecas virtuales por oposición a los archivos clásicos.
[^1]:
Digo de momento porque el propio Google Books tiene herramientas para señalar estos errores de modo que puedan ser subsanados y corregidos con cierta celeridad.
{ 3 comments }




























