He leí­do con suma aten­ción el artícu­lo que Jean-Claude Gué­don ha escrito como répli­ca a otro artícu­lo que mi admi­ra­do Robert Darn­ton escribió en The New York Review of Books hace un mes y medio.

Darn­ton alaba­ba de man­era opti­mista las ven­ta­jas que tiene la dig­i­tal­ización de libros en la actu­al­i­dad, y cómo el proyec­to de Google Books con­ducirá a nue­vo modo de inves­ti­gar, deter­mi­na­do por el acce­so inmedi­a­to a la infor­ma­ción; giro este, sólo equipara­ble al que supu­so la gen­er­al­ización de la imprenta en Europa durante la segun­da mitad del siglo XV y comien­zos del siglo XVI. En sus propias pal­abras:

In 2006 Google signed agree­ments with five great research libraries—the New York Pub­lic, Har­vard, Michi­gan, Stan­ford, and Oxford’s Bodleian—to dig­i­tize their books. Books in copy­right posed a prob­lem, which soon was com­pound­ed by law­suits from pub­lish­ers and authors. But putting that aside, the Google pro­pos­al seemed to offer a way to make all book learn­ing avail­able to all peo­ple, or at least those priv­i­leged enough to have access to the World Wide Web. It promised to be the ulti­mate stage in the democ­ra­ti­za­tion of knowl­edge set in motion by the inven­tion of writ­ing, the codex, mov­able type, and the Inter­net.

Como Darn­ton sug­iere en otro lugar del artícu­lo, su acer­camien­to al proyec­to de Google es el de un entu­si­as­ta, un eru­di­to, un his­to­ri­ador de la cul­tura, que com­prende las difi­cul­tades de su ofi­cio y que ve las posi­bil­i­dades de ahor­ro de tiem­po y de recur­sos tan­to para el inves­ti­gador como para la per­sona intere­sa­da por la cul­tura. Has­ta aquí nue­stro entu­si­as­mo es com­par­tido. Sin embar­go, Gué­don pone de man­i­fiesto var­ios aspec­tos que pare­cen escapárse­le a Darn­ton:

* El modo en que Google limi­ta el libre uso de esos tex­tos.
* El modo en que Google se con­vierte en medi­ador nece­sario entre el obje­to cul­tur­al y el lec­tor.

A mí, como usuario con una pro­fun­da con­vic­ción sobre las bon­dades de los tex­tos dig­i­tales —y con una bib­liote­ca dig­i­tal propia que comien­za a ser la pesadil­la de cualquier dis­co duro— me intere­sa espe­cial­mente la primera. Pero Gué­don argu­men­ta de modo con­vin­cente la indis­ol­u­bil­i­dad de ambas.

Cuan­do uno accede a Google Books y pasa allí una tarde, aca­ba lle­gan­do a la con­clusión de que se tra­ta de un espa­cio mal pen­sa­do. Digo esto porque a mí se me ocur­ren bas­tantes más cosas que hac­er con los libros que las que se me per­miten. La primera de ellas es realizar búsquedas cruzadas medi­ante oper­adores booleanos en un con­jun­to de tex­tos que yo eli­ja, la segun­da es com­pro­bar las ocur­ren­cias de un con­jun­to deter­mi­na­do de fór­mu­las tex­tuales para iden­ti­ficar esti­los, fuentes y demás, y así un largo etcétera. Es evi­dente, como bien expli­ca Gué­don, que Google nece­si­ta lim­i­tar el acce­so y el tratamien­to de los libros en orden a pro­te­ger su “mod­e­lo de nego­cio”, y es evi­dente que el lec­tor que no hace de la lec­tura y del análi­sis tex­tu­al su tra­ba­jo ape­nas notará esta difer­en­cia a la hora de acced­er a los libros.

Aquí entramos en otro prob­le­ma impor­tante: exis­ten lec­tores intere­sa­dos en muchos de los temas que ocu­pan a los his­to­ri­adores; pero son pocos los que pueden aprox­i­marse a ellos con cier­ta desen­voltura —¿y quién lo hace?, en real­i­dad— a ellos. El tra­ba­jo del his­to­ri­ador es describir, expon­er, sin­te­ti­zar los datos de modo claro para que la inter­pretación pos­te­ri­or de los mis­mos alber­gue un mín­i­mo interés para el lec­tor cul­to; de no ser así, su tra­ba­jo habrá de rein­ter­pre­tarse o quedar rel­e­ga­do al olvi­do.

GoogleBooks

Prob­a­ble­mente todos los libros del mun­do acaben por dig­i­talizarse, y ello trans­for­mará indud­able­mente nue­stro modo de rela­cionar­los con el libro, la infor­ma­ción y la his­to­ria. En un futuro quizás no muy lejano, el tra­ba­jo de los pro­fe­sores de humanidades estará mucho más cen­tra­do en enseñar cómo ges­tionar los con­tenidos que en los con­tenidos mis­mos, o sen­cil­la­mente desa­pare­cerá. Esto plantea nuevos retos: el giro en el mod­e­lo educa­ti­vo, si las estruc­turas más escle­ro­ti­zadas del sis­tema lo per­miten, va a ser rad­i­cal. Aquí es fun­da­men­tal alla­nar el camino no al cam­bio, y sí a la dura batal­la por man­ten­er el sen­ti­do de toda esa masa informe. Está en juego, en el fon­do, el modo en que el pen­samien­to occi­den­tal se rela­ciona con su his­to­ria y, val­ga la redun­dan­cia, con la his­to­ria de su pen­samien­to. Si nos preparamos para el cam­bio, ver­e­mos estu­dios que durante el siglo pasa­do eran impens­ables por ambi­ciosos y com­ple­jos; si no, el hecho de ten­er dig­i­tal­iza­dos todos los libros del mun­do prob­a­ble­mente solo sig­nifique una excusa para la desapari­ción de la memo­ria y de las ende­bles rela­ciones que hemos crea­do entre ellos durante sig­los. Del mis­mo modo, cam­biará el hábito de lec­tura y de análi­sis con él. Aho­ra bien, para que esto suce­da es pre­ciso que se creen las her­ramien­tas nece­sarias y se com­pren­dan de modo claro las vías para sim­pli­ficar o com­plicar infini­ta­mente la con­sul­ta de tex­tos y demás mate­ri­ales.

Google limi­ta estas posi­bil­i­dades, parado­jas de los nuevos tiem­pos, al ofre­cer­los. Su papel como medi­ador, como señala Gué­don, hace que las mis­mas bib­liote­cas con las que tra­ba­ja no puedan explo­rar el autén­ti­co poten­cial de una inmen­sa bib­liote­ca dig­i­tal. Suma­do a esto, el tra­ba­jo de dig­i­tal­ización de Google es un tan­to mediocre en oca­siones, no solo por lo que toca a la cal­i­dad de la res­olu­ción, sino a errores de bul­to en repeti­ción y omisión de pági­nas, como señal­a­ba Robert B. Towsend en otro artícu­lo que —de momento[^1]— es de ref­er­en­cia sobre el par­tic­u­lar, o tam­bién las ref­er­en­cias en xml, bib­tex y demás, que son un 90% de las veces erróneas.

Hay ini­cia­ti­vas que pre­tenden cam­biar esta situación con muy diver­sos logros. En esta entra­da sólo haré ref­er­en­cia a dos de ellas como mod­e­los dis­tin­tos de tra­ba­jo y de per­spec­ti­vas:

* Por una parte, The Euro­pean Library, un proyec­to que tiene como meta a largo pla­zo dig­i­talizar todos los doc­u­men­tos del viejo con­ti­nente y que sin embar­go tiene todo el aspec­to de ir a la deri­va pre­cisa­mente porque no com­prende, como le pasa a Gal­li­ca —inclu­i­da en ésta—, que no bas­ta con la pres­en­cia de imá­genes mon­tadas en un pdf, si no ofre­cen un tex­to que pue­da ser ras­trea­do.

* Por otra, The Inter­net Archive, que últi­ma­mente se está con­vir­tien­do en mi repos­i­to­rio favorito por varias razones: la primera es que se tra­ta de una platafor­ma libre y abier­ta, donde hay tex­tos dig­i­tal­iza­dos por multi­na­cionales como microsoft, por enti­dades y archivos públi­cos, por usuar­ios par­tic­u­lares, y for­man un gran colec­ti­vo con un interés con­tin­uo por mejo­rar la cal­i­dad de sus con­tenidos y ampli­ar­la. The Inter­net Archive no se limi­ta a hac­er aco­pio de tex­tos, sino que alber­ga con­tenidos de todo tipo, que o bien han per­di­do sus dere­chos de copia pri­va­da, o bien han sido crea­d­os bajo una licen­cia Cre­ative Com­mons, o bien han sido don­a­dos por sus autores o por casas edi­to­ri­ales que poseían los dere­chos. Lo bueno de Inter­net Archive es que tiene detrás una comu­nidad muy críti­ca y muy acti­va, un grupo amplio y prepara­do de comis­ar­ios (cura­tors) que se encar­gan de revis­ar, reseñar y recomen­dar los con­tenidos.

Por supuesto, ningu­na de las dos real­iza la tarea que he men­ciona­do ante­ri­or­mente, inclu­so Google Books sigue sien­do supe­ri­or en posi­bil­i­dades de búsque­da. Pero me parece que Inter­net Archive cuen­ta con un fac­tor que va a ser esen­cial en el futuro de la lec­tura y el estu­dio en Inter­net: la creación de una comu­nidad críti­ca y espe­cial­iza­da en torno a esos con­tenidos. Se tra­ta una de las dos piezas, sien­do la otra la creación de instru­men­tal semán­ti­co y rela­cional ade­cua­do, esen­ciales para que las bib­liote­cas vir­tuales no cor­ran la suerte de las bib­liote­cas tridi­men­sion­ales. Y a mí me fasci­na la idea de con­ver­tirme en bib­liote­cario, aunque sea un bib­liote­cario modesto y acha­coso, de este mun­do vir­tu­al.

**********

Algunas lecturas de interés para una postura coherente hacia Google Books:

* Google Books vs. Bison, de Mark J. Lud­wig y Mar­garet R. Wells. Estu­pen­do artícu­lo de The Library Jour­nal escrito des­de el pun­to de vista de doc­u­men­tal­is­tas y bib­liote­car­ios, que con­trastan el uso de Google Books con el sis­tema de infor­ma­ción bib­li­ográ­fi­ca de la Uni­ver­si­dad de Buf­fa­lo (BISON), los resul­ta­dos del análi­sis derivan en la der­ro­ta abso­lu­ta de Bison ante el gigante de Sil­i­con Val­ley. Las con­clu­siones, me parece, las cor­rec­tas: tenien­do en cuen­ta el pro­gre­so en la dig­i­tal­ización de fon­dos enormes, la car­rera ya está per­di­da en cuan­to a la creación de más doc­u­men­tos, pero la creación de ser­vi­cios en torno a los archivos es el que ofrece un cam­po ilim­i­ta­do de posi­bil­i­dades, a la vez que prác­ti­ca­mente desier­to por el momen­to.

* Para los ataques de dis­tin­tos gru­pos edi­to­ri­ales Europeos y algu­nas de sus insti­tu­ciones con­tra Google Books, puede verse lo que ha pasa­do en Fran­cia (1, 2, 3 y 4) o en Ale­ma­nia. Y, por con­traste, todo (1, 2 y 3) lo que ha pasa­do en España.

* Para las bon­dades de Google Books den­tro del ámbito académi­co —fuera de artícu­los de opinión como el men­ciona­do de Darn­ton—, puede entrarse con buen pie vía el análi­sis que Gre­go­ry Crane le dedicó al auge de las bases tex­tuales en inter­net hace un par de años y a las ideas de Tim O’Reil­ly sobre las necesi­dades de com­putar toda la masa bib­li­ográ­fi­ca que apor­ta el repos­i­to­rio y algunos ejem­p­los de cómo serían mod­e­los bási­cos de análi­sis. Está claro que tam­bién puede acud­irse a este recorte del doc­u­men­tal «El mun­do según Google» que habla de Google Books:

* Por últi­mo, me que­da hac­er ref­er­en­cia a la lista de recur­sos para la inves­ti­gación en Inter­net que Antho­ny Grafton hizo en The New York­er hará cosa de un año. Es a su vez una fenom­e­nal intro­duc­ción al uso de las bases de datos y las bib­liote­cas vir­tuales por oposi­ción a los archivos clási­cos.

[^1]:

Digo de momen­to porque el pro­pio Google Books tiene her­ramien­tas para señalar estos errores de modo que puedan ser sub­sana­dos y cor­regi­dos con cier­ta celeri­dad.