Ficta eloquentia

Retórica, política y poética medieval y renacentista. Silva de varia lección

Resultados de buscar: "digitalizando todos los libros del mundo"

Digitalizando todos los libros del mundo

He leí­do con suma aten­ción el artícu­lo que Jean-Claude Gué­don ha escrito como répli­ca a otro artícu­lo que mi admi­ra­do Robert Darn­ton escribió en The New York Review of Books hace un mes y medio.

Darn­ton alaba­ba de man­era opti­mista las ven­ta­jas que tiene la dig­i­tal­ización de libros en la actu­al­i­dad, y cómo el proyec­to de Google Books con­ducirá a nue­vo modo de inves­ti­gar, deter­mi­na­do por el acce­so inmedi­a­to a la infor­ma­ción; giro este, sólo equipara­ble al que supu­so la gen­er­al­ización de la imprenta en Europa durante la segun­da mitad del siglo XV y comien­zos del siglo XVI. En sus propias pal­abras:

In 2006 Google signed agree­ments with five great research libraries—the New York Pub­lic, Har­vard, Michi­gan, Stan­ford, and Oxford’s Bodleian—to dig­i­tize their books. Books in copy­right posed a prob­lem, which soon was com­pound­ed by law­suits from pub­lish­ers and authors. But putting that aside, the Google pro­pos­al seemed to offer a way to make all book learn­ing avail­able to all peo­ple, or at least those priv­i­leged enough to have access to the World Wide Web. It promised to be the ulti­mate stage in the democ­ra­ti­za­tion of knowl­edge set in motion by the inven­tion of writ­ing, the codex, mov­able type, and the Inter­net.

Como Darn­ton sug­iere en otro lugar del artícu­lo, su acer­camien­to al proyec­to de Google es el de un entu­si­as­ta, un eru­di­to, un his­to­ri­ador de la cul­tura, que com­prende las difi­cul­tades de su ofi­cio y que ve las posi­bil­i­dades de ahor­ro de tiem­po y de recur­sos tan­to para el inves­ti­gador como para la per­sona intere­sa­da por la cul­tura. Has­ta aquí nue­stro entu­si­as­mo es com­par­tido. Sin embar­go, Gué­don pone de man­i­fiesto var­ios aspec­tos que pare­cen escapárse­le a Darn­ton:

* El modo en que Google limi­ta el libre uso de esos tex­tos.
* El modo en que Google se con­vierte en medi­ador nece­sario entre el obje­to cul­tur­al y el lec­tor.

A mí, como usuario con una pro­fun­da con­vic­ción sobre las bon­dades de los tex­tos dig­i­tales —y con una bib­liote­ca dig­i­tal propia que comien­za a ser la pesadil­la de cualquier dis­co duro— me intere­sa espe­cial­mente la primera. Pero Gué­don argu­men­ta de modo con­vin­cente la indis­ol­u­bil­i­dad de ambas.

Cuan­do uno accede a Google Books y pasa allí una tarde, aca­ba lle­gan­do a la con­clusión de que se tra­ta de un espa­cio mal pen­sa­do. Digo esto porque a mí se me ocur­ren bas­tantes más cosas que hac­er con los libros que las que se me per­miten. La primera de ellas es realizar búsquedas cruzadas medi­ante oper­adores booleanos en un con­jun­to de tex­tos que yo eli­ja, la segun­da es com­pro­bar las ocur­ren­cias de un con­jun­to deter­mi­na­do de fór­mu­las tex­tuales para iden­ti­ficar esti­los, fuentes y demás, y así un largo etcétera. Es evi­dente, como bien expli­ca Gué­don, que Google nece­si­ta lim­i­tar el acce­so y el tratamien­to de los libros en orden a pro­te­ger su “mod­e­lo de nego­cio”, y es evi­dente que el lec­tor que no hace de la lec­tura y del análi­sis tex­tu­al su tra­ba­jo ape­nas notará esta difer­en­cia a la hora de acced­er a los libros.

Aquí entramos en otro prob­le­ma impor­tante: exis­ten lec­tores intere­sa­dos en muchos de los temas que ocu­pan a los his­to­ri­adores; pero son pocos los que pueden aprox­i­marse a ellos con cier­ta desen­voltura —¿y quién lo hace?, en real­i­dad— a ellos. El tra­ba­jo del his­to­ri­ador es describir, expon­er, sin­te­ti­zar los datos de modo claro para que la inter­pretación pos­te­ri­or de los mis­mos alber­gue un mín­i­mo interés para el lec­tor cul­to; de no ser así, su tra­ba­jo habrá de rein­ter­pre­tarse o quedar rel­e­ga­do al olvi­do.

GoogleBooks

Prob­a­ble­mente todos los libros del mun­do acaben por dig­i­talizarse, y ello trans­for­mará indud­able­mente nue­stro modo de rela­cionar­los con el libro, la infor­ma­ción y la his­to­ria. En un futuro quizás no muy lejano, el tra­ba­jo de los pro­fe­sores de humanidades estará mucho más cen­tra­do en enseñar cómo ges­tionar los con­tenidos que en los con­tenidos mis­mos, o sen­cil­la­mente desa­pare­cerá. Esto plantea nuevos retos: el giro en el mod­e­lo educa­ti­vo, si las estruc­turas más escle­ro­ti­zadas del sis­tema lo per­miten, va a ser rad­i­cal. Aquí es fun­da­men­tal alla­nar el camino no al cam­bio, y sí a la dura batal­la por man­ten­er el sen­ti­do de toda esa masa informe. Está en juego, en el fon­do, el modo en que el pen­samien­to occi­den­tal se rela­ciona con su his­to­ria y, val­ga la redun­dan­cia, con la his­to­ria de su pen­samien­to. Si nos preparamos para el cam­bio, ver­e­mos estu­dios que durante el siglo pasa­do eran impens­ables por ambi­ciosos y com­ple­jos; si no, el hecho de ten­er dig­i­tal­iza­dos todos los libros del mun­do prob­a­ble­mente solo sig­nifique una excusa para la desapari­ción de la memo­ria y de las ende­bles rela­ciones que hemos crea­do entre ellos durante sig­los. Del mis­mo modo, cam­biará el hábito de lec­tura y de análi­sis con él. Aho­ra bien, para que esto suce­da es pre­ciso que se creen las her­ramien­tas nece­sarias y se com­pren­dan de modo claro las vías para sim­pli­ficar o com­plicar infini­ta­mente la con­sul­ta de tex­tos y demás mate­ri­ales.

Google limi­ta estas posi­bil­i­dades, parado­jas de los nuevos tiem­pos, al ofre­cer­los. Su papel como medi­ador, como señala Gué­don, hace que las mis­mas bib­liote­cas con las que tra­ba­ja no puedan explo­rar el autén­ti­co poten­cial de una inmen­sa bib­liote­ca dig­i­tal. Suma­do a esto, el tra­ba­jo de dig­i­tal­ización de Google es un tan­to mediocre en oca­siones, no solo por lo que toca a la cal­i­dad de la res­olu­ción, sino a errores de bul­to en repeti­ción y omisión de pági­nas, como señal­a­ba Robert B. Towsend en otro artícu­lo que —de momento[^1]— es de ref­er­en­cia sobre el par­tic­u­lar, o tam­bién las ref­er­en­cias en xml, bib­tex y demás, que son un 90% de las veces erróneas.

Hay ini­cia­ti­vas que pre­tenden cam­biar esta situación con muy diver­sos logros. En esta entra­da sólo haré ref­er­en­cia a dos de ellas como mod­e­los dis­tin­tos de tra­ba­jo y de per­spec­ti­vas:

* Por una parte, The Euro­pean Library, un proyec­to que tiene como meta a largo pla­zo dig­i­talizar todos los doc­u­men­tos del viejo con­ti­nente y que sin embar­go tiene todo el aspec­to de ir a la deri­va pre­cisa­mente porque no com­prende, como le pasa a Gal­li­ca —inclu­i­da en ésta—, que no bas­ta con la pres­en­cia de imá­genes mon­tadas en un pdf, si no ofre­cen un tex­to que pue­da ser ras­trea­do.

* Por otra, The Inter­net Archive, que últi­ma­mente se está con­vir­tien­do en mi repos­i­to­rio favorito por varias razones: la primera es que se tra­ta de una platafor­ma libre y abier­ta, donde hay tex­tos dig­i­tal­iza­dos por multi­na­cionales como microsoft, por enti­dades y archivos públi­cos, por usuar­ios par­tic­u­lares, y for­man un gran colec­ti­vo con un interés con­tin­uo por mejo­rar la cal­i­dad de sus con­tenidos y ampli­ar­la. The Inter­net Archive no se limi­ta a hac­er aco­pio de tex­tos, sino que alber­ga con­tenidos de todo tipo, que o bien han per­di­do sus dere­chos de copia pri­va­da, o bien han sido crea­d­os bajo una licen­cia Cre­ative Com­mons, o bien han sido don­a­dos por sus autores o por casas edi­to­ri­ales que poseían los dere­chos. Lo bueno de Inter­net Archive es que tiene detrás una comu­nidad muy críti­ca y muy acti­va, un grupo amplio y prepara­do de comis­ar­ios (cura­tors) que se encar­gan de revis­ar, reseñar y recomen­dar los con­tenidos.

Por supuesto, ningu­na de las dos real­iza la tarea que he men­ciona­do ante­ri­or­mente, inclu­so Google Books sigue sien­do supe­ri­or en posi­bil­i­dades de búsque­da. Pero me parece que Inter­net Archive cuen­ta con un fac­tor que va a ser esen­cial en el futuro de la lec­tura y el estu­dio en Inter­net: la creación de una comu­nidad críti­ca y espe­cial­iza­da en torno a esos con­tenidos. Se tra­ta una de las dos piezas, sien­do la otra la creación de instru­men­tal semán­ti­co y rela­cional ade­cua­do, esen­ciales para que las bib­liote­cas vir­tuales no cor­ran la suerte de las bib­liote­cas tridi­men­sion­ales. Y a mí me fasci­na la idea de con­ver­tirme en bib­liote­cario, aunque sea un bib­liote­cario modesto y acha­coso, de este mun­do vir­tu­al.

**********

Algunas lecturas de interés para una postura coherente hacia Google Books:

* Google Books vs. Bison, de Mark J. Lud­wig y Mar­garet R. Wells. Estu­pen­do artícu­lo de The Library Jour­nal escrito des­de el pun­to de vista de doc­u­men­tal­is­tas y bib­liote­car­ios, que con­trastan el uso de Google Books con el sis­tema de infor­ma­ción bib­li­ográ­fi­ca de la Uni­ver­si­dad de Buf­fa­lo (BISON), los resul­ta­dos del análi­sis derivan en la der­ro­ta abso­lu­ta de Bison ante el gigante de Sil­i­con Val­ley. Las con­clu­siones, me parece, las cor­rec­tas: tenien­do en cuen­ta el pro­gre­so en la dig­i­tal­ización de fon­dos enormes, la car­rera ya está per­di­da en cuan­to a la creación de más doc­u­men­tos, pero la creación de ser­vi­cios en torno a los archivos es el que ofrece un cam­po ilim­i­ta­do de posi­bil­i­dades, a la vez que prác­ti­ca­mente desier­to por el momen­to.

* Para los ataques de dis­tin­tos gru­pos edi­to­ri­ales Europeos y algu­nas de sus insti­tu­ciones con­tra Google Books, puede verse lo que ha pasa­do en Fran­cia (1, 2, 3 y 4) o en Ale­ma­nia. Y, por con­traste, todo (1, 2 y 3) lo que ha pasa­do en España.

* Para las bon­dades de Google Books den­tro del ámbito académi­co —fuera de artícu­los de opinión como el men­ciona­do de Darn­ton—, puede entrarse con buen pie vía el análi­sis que Gre­go­ry Crane le dedicó al auge de las bases tex­tuales en inter­net hace un par de años y a las ideas de Tim O’Reil­ly sobre las necesi­dades de com­putar toda la masa bib­li­ográ­fi­ca que apor­ta el repos­i­to­rio y algunos ejem­p­los de cómo serían mod­e­los bási­cos de análi­sis. Está claro que tam­bién puede acud­irse a este recorte del doc­u­men­tal «El mun­do según Google» que habla de Google Books:

* Por últi­mo, me que­da hac­er ref­er­en­cia a la lista de recur­sos para la inves­ti­gación en Inter­net que Antho­ny Grafton hizo en The New York­er hará cosa de un año. Es a su vez una fenom­e­nal intro­duc­ción al uso de las bases de datos y las bib­liote­cas vir­tuales por oposi­ción a los archivos clási­cos.

[^1]:

Digo de momen­to porque el pro­pio Google Books tiene her­ramien­tas para señalar estos errores de modo que puedan ser sub­sana­dos y cor­regi­dos con cier­ta celeri­dad.

Google Books: el proyecto y el mercado

La noti­cia de la sem­ana en inter­net ha sido, sin duda, el pago de 125 mil­lones de dólares que Google ha prometi­do al con­sor­cio de edi­tores norteam­er­i­canos. Hace un par de meses ya me había referi­do al proyec­to de Google Books, pero creo per­ti­nente comen­tar el movimien­to a la vista de la impor­tan­cia que ten­drá para nues­tra relación con el conocimien­to en unos años. No se tra­ta de una mate­ria que ocupe úni­ca­mente a los inves­ti­gadores, sino a cualquiera mín­i­ma­mente intere­sa­do en la lec­tura.

1. El proyecto histórico

a pesar de las defi­cien­cias de algu­nas de las repro­duc­ciones de Google Books, no cabe duda de que es el proyec­to más impor­tante, con difer­en­cia, de trasla­do de un soporte a otro en la his­to­ria de la cul­tura. Y la difer­en­cia reside tan­to en el vol­u­men de la infor­ma­ción, como en su paso de un soporte físi­co a uno vir­tu­al. Expon­er­lo sí es una impre­cisión poéti­ca: la pal­abra escri­ta, des­de tiem­pos de Sócrates, siem­pre ha sufri­do el estig­ma de la vir­tu­al­i­dad, pero tam­bién la ben­di­ción de ser per­durable.

Existe otra difer­en­cia no menos rel­e­vante: la ambi­ción. El trasla­do de la cul­tura man­u­scri­ta a la cul­tura impre­sa for­ma parte de un pro­ce­so históri­co aún inacaba­do, casi 550 años después de su comien­zo; y no cabe duda de que en cada trasla­do se pier­den cosas, inevitable­mente. La cuestión es que Google se ha prop­uesto dig­i­talizar todo en el pla­zo de diez años. Habrá que pre­gun­tarse si esta trans­for­ma­ción rad­i­cal de soporte impli­cará un cam­bio igual­mente para aque­l­los que escriben o aspi­ran a escribir libros, y si todos los pasos tradi­cionales en la creación de un tex­to se con­ser­varán o desa­pare­cerán.

Está por verse si el cam­bio de soporte con­ll­e­vará un cam­bio en la prác­ti­ca de la lec­tura y de la escrit­u­ra, puesto que todavía esta­mos en los primeros pasos de un pro­ce­so que dista mucho de haberse nat­u­ral­iza­do. Y des­de luego, la elec­ción de Google para dig­i­talizar sus tex­tos es dis­cutible des­de var­ios pun­tos de vista. Si acud­i­mos de nue­vo al paso de la for­ma man­u­scri­ta a la for­ma de los tipos móviles y sobre todo a la his­to­ria de los primeros impre­sores, ver­e­mos que fue una tarea hecha con enorme mimo, y tal vez el escanea­do, el proce­sa­do OCR y la creación de archivos pdf no sea la for­ma más ele­gante, ni la más efi­ciente. Leía esta sem­ana una colum­na que aludía al prob­le­ma con algunos ejem­p­los ilus­tra­tivos: el for­ma­to dig­i­tal es infini­ta­mente más pere­cedero que el soporte físi­co. En cada paso del pro­ce­so de trasla­do se pierde infor­ma­ción, y la posi­bil­i­dad de que se cor­rompa es infini­ta­mente supe­ri­or. Cuan­do a finales del siglo XV se pro­du­jo la ver­dadera con­frontación entre la cul­tura de los escribas y la cul­tura de los tipos móviles, la gran ven­ta­ja de estos últi­mos era el tiem­po ahor­ra­do en la impre­sión, aunque se perdía el arte man­u­al —el aura en pal­abras de Ben­jamin o la dig­nità del tex­to, en pal­abras de Ves­pasiano da Bis­tic­ci, uno de los pro­duc­tores más famosos de man­u­scritos en la Flo­ren­cia de la época— la caí­da del pre­cio del libro y su alcance a un nue­vo grupo de com­pradores se amplió de modo geométri­co, al igual que los errores. En aquel momen­to ten­er una ver­sión más o menos fidedigna de un tex­to dependía tan­to del tes­ti­mo­nio que el copista tuviera ante sí como de su propia peri­cia y capaci­dad, con la imprenta, el sim­ple error de un cajista con­den­a­ba a tiradas de 500 o de mil ejem­plares.

Aho­ra la cuestión no residirá en prob­le­mas de tran­scrip­ción, sino en prob­le­mas de lec­tura de la máquina (OCR) y en prob­le­mas no tan­to de alma­ce­namien­to y copia de seguri­dad, como de longev­i­dad de los for­matos elegi­dos para sopor­tar los tex­tos. A sim­ple vista, un pdf de 40, 80 ó 120 megas no parece el soporte del futuro. Hubiera sido preferi­ble, e infini­ta­mente más cos­toso, recu­per­ar los tex­tos medi­ante OCR y cote­jo con el orig­i­nal, adap­tar­los a un for­ma­to como el tex­to puroLaTeX hubiera sido una mag­ní­fi­ca opción y un intere­san­tísi­mo proyec­to de colab­o­ración entre pro­gra­madores e his­to­ri­adores de la cul­tura del libro— y man­ten­er la maque­tación orig­i­nal de los mis­mos. Infini­ta­mente más cos­toso, sí, pero hubiera gen­er­a­do unos doc­u­men­tos no solo más duraderos, sino menos volu­mi­nosos, y con una opción de búsque­da real y pre­cisa al 100%.

OldBooksHTBBO_JW_01282008.jpg

Ima­gen bajo licen­cia Cre­ative Com­mons: “More Old Books…”, de guldfinsken

2. La empresa y el mercado

vayamos a la noti­cia tal y como fue pub­li­ca­da en el blog de Google. En ella se puede encon­trar una clara vocación com­er­cial que, quizás, no había apare­ci­do en man­i­festa­ciones pre­vias del proyec­to. Como se sabe, Google empezó su tra­ba­jo de dig­i­tal­ización a par­tir de un acuer­do con Har­vard, Stan­ford, la Bib­liote­ca Públi­ca de Nue­va York, Michi­gan y Oxford. Por aquel entonces se lan­z­a­ban las cam­panas al vue­lo pen­san­do que el proyec­to sig­nifi­caría la aper­tu­ra de toda la lit­er­atu­ra exis­tente sobre cualquier mate­ria al alcance de un golpe de ratón. Y las cosas pare­cen haber cam­bi­a­do de raíz con este acuer­do.

Es cier­to, como dijo Kevin Kel­ly en una colum­na ya clási­ca, que el proyec­to de Google cumple con un anh­elo que se remon­ta a la fun­dación de la Bib­liote­ca de Ale­jan­dría, y hace inclu­so palide­cer a aquel sueño si ten­emos en cuen­ta el vol­u­men de infor­ma­ción y la acce­si­bil­i­dad que prometía… Sen­cil­la­mente se inter­pu­so la economía de mer­ca­do.

Google ha tenido que enfrentarse con una can­ti­dad no des­pre­cia­ble de casas edi­to­ri­ales por su proyec­to. Los dere­chos de autor, como tales, for­man parte indis­ol­u­ble de la cul­tura impre­sa, de la repro­duc­ción mecáni­ca, y parece que este trasvase, defin­i­ti­va­mente, va a ten­er que car­gar con ellos. La impre­sión que me ha dado tras leer el comu­ni­ca­do de Google es que el proyec­to se con­ver­tirá defin­i­ti­va­mente en algo más pare­ci­do a lo que es la tien­da de iTunes para la músi­ca o la Get­ty­im­ages para los archivos de ima­gen: un nue­vo dis­tribuidor glob­al de con­tenidos. Ya pasa­ba esto con el ser­vi­cio de PODPrint on Demand o Impre­sión bajo deman­da— que Google lle­va un tiem­po imple­men­tan­do. Pero este ser­vi­cio era útil para sosten­er el proyec­to y era una opción que Google daba a aque­l­los que querían acced­er a una copia impre­sa de mate­ri­ales descat­a­lo­ga­dos, man­te­nien­do siem­pre la opción gra­tui­ta de lec­tura en pan­talla. El acuer­do de Google de esta sem­ana no va, des­de luego, en esta direc­ción. Aho­ra bien, sería erró­neo cul­par a Google de esto. La pre­sión de las casas edi­to­ri­ales ha ido dirigi­da a man­ten­er los dere­chos de explotación sobre sus fon­dos y google, como empre­sa que es, sabe que la úni­ca man­era de con­tin­uar sin tra­bas con el proyec­to y ten­er una bib­liote­ca real­mente exhaus­ti­va, requería pagar los dere­chos de autor.

Has­ta aquí ningún prob­le­ma, pero lo que tam­bién parece derivarse del comu­ni­ca­do de Google es la posi­bil­i­dad de que las casas edi­to­ri­ales exploten sus fon­dos a través de Google Books. Habrá que ver­lo, pero es más que prob­a­ble que ya no nos encon­tremos con los enlaces a ama­zon y a otras platafor­mas para com­prar el libro —que en muchos casos ya no se encuen­tra ni de segun­da mano—, sino que el ser­vi­cio POD se extien­da a las edi­to­ri­ales con­vir­tien­do a google en una segun­da inter­me­di­aria. El nego­cio es redon­do para ambas, por un parte, Google accede a una cuo­ta de mer­ca­do y de ingre­sos que le esta­ba veda­da, y por otra, las casas edi­to­ri­ales pueden explotar de man­era real su catál­o­go durante el perío­do de vigen­cia de los dere­chos de autor, y esto últi­mo sin gas­tar nada en infraestruc­tura para la impre­sión de libros.

_76_172495285_9e2ba5bf28.jpg

Ima­gen bajo licen­cia Cre­ative Com­mons: “Print­ing Press”, de Thomas Hawk

3. La impresión, el mercado y la autoedición

afir­mar que con esto ganan las empre­sas y pierde el lec­tor es equiv­o­ca­do, por supuesto. Los que ten­emos for­ma­ción académi­ca y escribi­mos con­sul­tan­do numerosas fuentes descat­a­lo­gadas o de difí­cil acce­so esta­mos de enhorabue­na. Unos más que otros. Puesto que estoy en la Uni­ver­si­dad de Michi­gan este año, veré con suerte cómo se desen­vuelve Google Books de man­era gra­tui­ta, puesto que el acuer­do con­tem­pla que los archivos par­tic­i­pantes dis­fruten de este priv­i­le­gio, mien­tras que otras uni­ver­si­dades podrán suscribirse al ser­vi­cio como a día de hoy hacen con JSTOR, Ebsco, Chad­wick, Met­aL­ib y tan­tas otras empre­sas ded­i­cadas a la dig­i­tal­ización de tex­tos académi­cos. La con­clusión es que la cul­tura, al menos la cul­tura de los últi­mos 70 años, nun­ca será gratis. Y esto puede provo­car el resen­timien­to de un amplio colec­ti­vo de int­elec­tuales que con­sid­er­an que Google se ha aprovecha­do de las bib­liote­cas de acce­so públi­co para com­er­cializarlas. Algo que se cues­tionó cuan­do se anun­ció el proyec­to y que se sospech­a­ba hace un año y medio, es, a estas alturas, más que evi­dente. No deja de sor­pren­derme que se cues­tione que Google se com­porte como una cor­po­ración cuan­do lo es, lo que me eno­ja es que la ini­cia­ti­va de Google ha sido rel­a­ti­va­mente bara­ta, y se está pagan­do el hecho de que los gob­ier­nos no se hayan ocu­pa­do de esta tarea deján­do­lo en manos de un grupo pri­va­do. Exac­ta­mente igual que sucede en España con las empre­sas de gestión de los dere­chos de autor.

Pero ya que esta es la nat­u­raleza del proyec­to y su for­mu­lación y capaci­dad supera con mucho a otros movimien­tos como Libr­ere­mo, Inter­net Archive o Euro­peana —muy dis­tin­tos los tres, quede claro—, veamos las ven­ta­jas. Google Books abre posi­bil­i­dades intere­santes para la autoedi­ción y para la com­er­cial­ización de libros. Esto no es sólo bueno para poten­ciar la super­viven­cia y la creación de pequeñas casas edi­to­ri­ales, sino para favore­cer la pres­en­cia de autores inde­pen­di­entes. Google Books cobra su sen­ti­do al rela­cionarlo con Knol.

Ambos movimien­tos están hacien­do una apues­ta por elim­i­nar la mediación de la edi­to­ri­ales al for­mar una comu­nidad de exper­tos que crea, comen­ta y cal­i­fi­ca su tra­ba­jo. Si se imple­men­tan las her­ramien­tas nece­sarias para la indexación de Google Books, es decir, si se eti­que­tan los tex­tos que con­tiene y se vin­cu­lan unos a otros, entonces será nece­sario crear a su vez nuevas her­ramien­tas de escrit­u­ra. Com­pon­er un libro académi­co, por ejem­p­lo, en un entorno fun­cional de Google Book Search, será una expe­ri­en­cia dis­tin­ta, tan­to en el cita­do y el ref­er­en­ci­a­do, como en la lec­tura, generan­do una inmedi­atez en la lec­tura y el cote­jo de las fuentes citadas sin prece­dente históri­co. Aquí el lec­tor podrá estable­cer parámet­ros obje­tivos de críti­ca sin más necesi­dad que el tex­to, los enlaces a otros tex­tos y un ter­mi­nal. Son algunos movimien­tos a los que sumar la plau­si­ble creación de her­ramien­tas de autoedi­ción que nos harán más inde­pen­di­entes de límites edi­to­ri­ales —nor­mas de pub­li­cación, límites de car­ac­teres, etc— a cam­bio de hac­er­nos com­ple­ta­mente depen­di­entes de Google. Habrá que ver cómo la empre­sa ges­tiona este pro­ce­so e, insis­to, sería con­ve­niente una inter­ven­ción a dis­tin­tos nive­les para mar­car muy clara­mente cier­tos límites.

Sobre la cuestión de la cal­i­dad de los tex­tos, sobre todo en el ámbito de humanidades, no me pararé aquí, puesto que pre­tendo escribir una entra­da en breve ded­i­ca­da a los nuevos mod­os de escrit­u­ra académi­ca y los nuevas posi­bil­i­dades de cal­i­fi­cación de mate­ri­ales según sus méri­tos y alcance.

Conclusión

Es pre­ocu­pante el cariz que va toman­do la nat­u­raleza de Google Book Search. En lugar de crear una bib­liote­ca uni­ver­sal de libre acce­so, parece que los movimien­tos con­ducen a pen­sar en la com­er­cial­ización del lega­do uni­ver­sal. No se tra­ta de un mar­co agrad­able, a pesar de las ven­ta­jas de un sis­tema cer­ra­do para la creación de nue­vo instru­men­tal cien­tí­fi­co y com­pos­i­ti­vo, como he expuesto más arri­ba. En breve ver­e­mos si proyec­tos públi­cos como Euro­peana pueden plantear una alter­na­ti­va seria a Google.

*************************

Aún si puede resul­tar fasci­nante hablar del libro infini­to, esto es un blog y nece­sari­a­mente requiere que las entradas sean mucho menos exten­sas que la ante­ri­or. Si te ha intere­sa­do lo que he comen­ta­do aquí, quizás dis­frutes echán­dole un vis­ta­zo a esta lista de enlaces sobre el tema:

* Google Book Search Bib­li­og­ra­phy, de Charles W. Bai­ley Jr. La bib­li­ografía más com­ple­ta sobre el proyec­to.
* New chap­ter for Google Book Search. Google Blog
* What we learned from 1 mil­lion busi­ness­es in the cloud. La visión de Google acer­ca de la com­putación sobre Inter­net o cloud com­put­ing.
* Google, moteur de recherche ou moteur de nav­i­ga­tion?. TechCrunch
* What the Google book scan­ning deal means. The Ama­teur Human­ist.
* http://sanfordlevy.wordpress.com/2008/09/03/internet-research-and-the-writing-of-philosophy-essays/. Stan­ford Levy. Sobre la escrit­u­ra de filosofía —aunque aplic­a­ble a cualquier rama de las humanidades— en el nue­vo con­tex­to.
* What Shall It Prof­it A Man?. Sergei Lobanov-Ros­tovsky en The Keny­on Review o la lec­tura apoc­alíp­ti­ca.
* Great news about Google Book Search. Lisa Gold en su fan­tás­ti­co blog o la lec­tura opti­mista.
* Google law­suits set­tled. Bejamin Zim­mer, en Lenguage Log. Sobre otra de la ven­ta­jas: la posi­bil­i­dad de acced­er aho­ra a los libros descat­a­lo­ga­dos pero bajo dere­cho de explotación.

actu­al­iza­do (6/9/2008): Podéis ver en este enlace algu­nas de las respues­tas que el ser­vi­cio legal de Google le ha dado a Siva Vaid­hyanathan.

Me encan­taría cono­cer tu opinión sobre el anun­cio de Google de esta sem­ana, tus comen­tar­ios son impor­tantes para mejo­rar la infor­ma­ción aquí recogi­da.

Google, Robert Darnton y la República de las Letras digital

Anaclet Pons ya había tra­duci­do la primera colum­na que Robert Darn­ton escribió para la New York Review of Books acer­ca de Google Books —mis impre­siones sobre ella podéis leer­las aquí— para incor­po­rar­la a un intere­sante mono­grá­fi­co de la revista Pasajes. Hoy ha subido a su muy recomend­able blog, Clio­nau­ta, la tra­duc­ción de la segun­da colum­na que Darn­ton le ha ded­i­ca­do al tema. En vista de las moles­tias que Ana­clet se toma por difundir las ideas de Darn­ton, me he deci­di­do a tra­ducir y pon­er a vues­tra dis­posi­ción la respues­ta que Paul N. Courant —his­to­ri­ador y econ­o­mista de la Uni­ver­si­dad de Michi­gan— le ha ded­i­ca­do a este tex­to. Courant la ha subido a su blog y la ha envi­a­do a la New York Review of Books.

Como sabéis, este año estoy en la Uni­ver­si­dad en la que Courant tra­ba­ja. Esta fue, jun­to con Har­vard, el primer cen­tro académi­co de Esta­dos Unidos que se tomó seri­amente la dig­i­tal­ización de su fon­do bib­li­ográ­fi­co, mucho antes de que Google existiera. Courant ha cono­ci­do de primera mano todo el pro­ce­so —tan­to el pre­vio a Google como el pos­te­ri­or— y ofrece en su tex­to un enfoque a medio camino entre la economía y la bib­liote­conomía que puede —y debe— servir para mati­zar el pes­imis­mo de la últi­ma colum­na de Darn­ton.

Frente a los tex­tos pre­vios en la New York Review of Books, esta colum­na ha sido redac­ta­da por un econ­o­mista que ha tenido car­gos de respon­s­abil­i­dad en la Bib­liote­ca de la Uni­ver­si­dad de Michi­gan, un entorno idó­neo para cono­cer el tra­ba­jo de Google, puesto que el gigante de Cal­i­for­nia tiene una de sus cen­trales en Ann Arbor. He numer­a­do los pár­rafos del tex­to de Courant para facil­i­tar su con­sul­ta, su cita y las ref­er­en­cias a él en los comen­tar­ios.


V. C. Vickers - The Google Book (1913)

1. Mi cole­ga y ami­go Robert Darn­ton es un his­to­ri­ador mar­avil­loso y un ele­gante escritor. Su visión utópi­ca de una infraestruc­tura dig­i­tal para una nue­va Repúbli­ca de las letrasGoogle and the Future of Books», New York Review of Books, 12 de enero de 2009) ele­va el espíritu. Sin embar­go, su idea acer­ca de que hubiera cualquier posi­bil­i­dad de que el Con­gre­so y la Bib­liote­ca del Con­gre­so pudier­an haber imple­men­ta­do esa visión en la déca­da de los noven­ta es una fan­tasía utópi­ca. A su vez, su pun­to de vista sobre el mun­do que podría emerg­er como resul­ta­do del vol­ca­do dig­i­tal de obras bajo dere­cho de autor es una fan­tasía dis­tópi­ca.

2. El Con­gre­so, al que Darn­ton imag­i­na invir­tien­do dinero y real­izan­do cam­bios de leg­is­lación que hubier­an hecho que las obras descat­a­lo­gadas aún suje­tas a dere­cho de copia —la vas­ta may­oría de tex­tos pub­li­ca­dos durante el siglo XX— estu­vier­an dig­i­tal­mente disponibles bajo unos tér­mi­nos razon­ables, jamás mostró interés alguno en lle­var a cabo algo por el esti­lo. Antes bien: aprobó la Dig­i­tal Mil­len­ni­um Copy­right Act y la Son­ny Bono Copy­right Term Exten­sion Act. (Después ven­dría la High­er Edu­ca­tion Oppor­tu­ni­ty Act, que obliga a las insti­tu­ciones académi­cas a vig­i­lar su ámbito elec­tróni­co a la búsque­da de vio­la­ciones de los dere­chos de copia). No es sor­pren­dente: los comités que escriben la ley de dere­chos de copia están dom­i­na­dos por rep­re­sen­tantes que cuidan de Hol­ly­wood y de otros que poseen los dere­chos. Su idea sobre la Repúbli­ca de las Letras es una donde todo el mun­do que algu­na vez ha leí­do, escucha­do o vis­to casi cualquier cosa debería pagar… cada vez que lo haga.

3. El Tri­bunal Supre­mo, que tuvo la opor­tu­nidad de lim­i­tar la exten­sión de un dere­cho de explotación ya demasi­a­do largo (como Darn­ton, creo que 14 años ren­ov­ables otros 14 es más que sufi­ciente para lograr los propósi­tos del dere­cho de copia), rehusó hac­er­lo (con solo dos votos en con­tra) en el caso de Eldred con­tra Ashcroft, sen­ten­ci­a­do en 2003. Al con­trario: reforzó la sen­ten­cia con leg­is­lación opues­ta a los prin­ci­p­ios fun­da­men­tales del dere­cho de copia rec­om­pen­san­do a autores que lle­van tiem­po muer­tos y previnien­do así que nue­stro lega­do cul­tur­al apareciera en el dominio públi­co.

4. Resum­ien­do, durante algo más que la últi­ma déca­da la políti­ca públi­ca ha sido con­sis­ten­te­mente peor que inútil para ayu­dar a hac­er la may­or parte de las obras del siglo XX sus­cep­ti­bles de búsque­da y uso bajo for­ma dig­i­tal. Esta es la alter­na­ti­va a la que debe­mos some­ter la eval­u­ación de Google Book Search y el acuer­do de Google con edi­tores y autores.

5. En primer lugar, debe­mos recor­dar que has­ta que Google anun­ció en 2004 que iba a dig­i­talizar las colec­ciones de algu­nas de las bib­liote­cas más grandes del mun­do, abso­lu­ta­mente nadie tenía un plan para una dig­i­tal­ización masi­va a la escala requeri­da. Bib­liote­cas bien dotadas, incluyen­do Har­vard y la Uni­ver­si­dad de Michi­gan, esta­ban embar­cadas en esfuer­zos de dig­i­tal­ización a un rit­mo menor de 10.000 volúmenes anuales. Google llevó la dis­cusión direc­ta­mente a dece­nas de miles de volúmenes por sem­ana e hizo factible la meta de dig­i­talizar (casi) todo. Ten­demos a pen­sar aho­ra que la dig­i­tal­ización masi­va es tarea fácil. Hace menos de cin­co años pen­sábamos que su cos­to la hacía imprac­ti­ca­ble.

6. El cen­tro de la fan­tasía dis­tópi­ca de Darn­ton sobre el acuer­do de Google deri­va direc­ta­mente de la per­spec­ti­va de que «Google dis­fru­tará de aque­l­lo que solo puede ser denom­i­na­do como un monop­o­lio […] de acce­so a la infor­ma­ción». Pero Google no goza de nada pare­ci­do a un monop­o­lio al acce­so de la infor­ma­ción en gen­er­al, ni a la infor­ma­ción que se encuen­tra en los libros que están suje­tos a los tér­mi­nos del acuer­do. Para empezar, y esto es un enorme ben­efi­cio públi­co por sí mis­mo, has­ta el 20% de los con­tenidos de los libros podrá leerse de man­era abier­ta por cualquiera que posea una conex­ión a Inter­net, y todo su con­tenido estará index­a­do y podrá ser someti­do a búsquedas. Más aún, Google está oblig­a­do a proveer el famil­iar link «encuén­tralo en una bib­liote­ca» en todos los libros que se ofre­cen en el pro­duc­to com­er­cial. Esto es, si tras leer el 20% de un libro un usuario quiere más y encuen­tra el pre­cio por el acce­so on-line exce­si­vo, se le mostrarán una lista de las bib­liote­cas que dispo­nen de un ejem­plar, pudi­en­do diri­girse a ellas o hac­er uso del prés­ta­mo inter­bib­liote­cario. Esto debili­ta de man­era clara el poder de mer­ca­do del pro­duc­to de Google. De hecho, es mucho mejor que la situación actu­al, donde los usuar­ios de Google Book Search solo puede leer frag­men­tos, no el 20% del libro, y des­de ahí deben decidir si han encon­tra­do lo que bus­ca­ban.

7. Darn­ton está tam­bién pre­ocu­pa­do por la posi­bil­i­dad de que Google peque de avari­cia gra­van­do los pre­cios, uti­lizan­do estrate­gias comunes en muchos edi­tores de lit­er­atu­ra cien­tí­fi­ca que con­ll­e­van un enorme coste para las bib­liote­cas académi­cas, sus uni­ver­si­dades y, al menos igual­mente impor­tante, para los usuar­ios poten­ciales que sen­cil­la­mente care­cen de acce­so a ellas. Sin embar­go, las car­ac­terís­ti­cas del mer­ca­do de los artícu­los de cien­cia y tec­nología son fun­da­men­tal­mente dis­tin­tas de las que cor­re­spon­den al vas­to cor­pus de lit­er­atu­ra descat­a­lo­ga­da que alber­gan las bib­liote­cas uni­vesi­tarias. Este con­sti­tuirá el grue­so de obras que Google venderá en lugar de los propi­etar­ios de los dere­chos de copia bajo el acuer­do de aven­imien­to. En la actu­al­i­dad, la pro­duc­ción de lit­er­atu­ra cien­tí­fi­ca requiere un acce­so inmedi­a­to y de cal­i­dad al resto de lit­er­atu­ra cien­tí­fi­ca que se está pro­ducien­do: uno no puede pub­licar, o con­seguir becas y ayu­das económi­cas sin un acce­so de estas car­ac­terís­ti­cas. Los edi­tores lo saben, y gra­van con­se­cuente­mente. Par­tic­u­lar­mente los pre­cios de los artícu­los indi­vid­uales son muy ele­va­dos, lo que apoya las licen­cias escan­dalosa­mente ele­vadas que pagan las uni­ver­si­dades por el acce­so a sus bases de datos. En el caso de Google, al haber muchas vías para el acce­so a la may­or parte de los libros que se venderán gra­cias al acuer­do, su pre­cio será segu­ra­mente jus­to y bajo, lo que con­ll­e­vará bajos pre­cios por las licen­cias de acce­so a su base de datos. De nue­vo, «encuén­tralo en una bib­liote­ca» empare­ja­do con una gen­erosa vista pre­via del títu­lo, no podría diferir más de la prác­ti­ca empre­sar­i­al de muchos edi­tores de revis­tas cien­tí­fi­cas, téc­ni­cas y médi­cas.

8. Hay otra razón para creer que los pre­cios no serán “injus­tos”: Google está mucho más intere­sa­da en hac­erse con públi­co para googlizar prác­ti­ca­mente todo que en hac­er dinero a través de ven­tas direc­tas. La man­era de atraer a la gente a la lit­er­atu­ra a través de Google es con­ver­tir­lo en un pro­ce­so sen­cil­lo y que com­pense a los lec­tores. Para las obras bajo dominio públi­co, Google ya provee libre acce­so y con­tin­uará hacién­do­lo. Para las obras suje­tas al acuer­do con las casas edi­to­ri­ales, parece que ofre­cerá una inter­faz bien dis­eña­da, la vista pre­via de un 20% de la obra y pre­cios razon­ables. Jun­to a ello, las bib­liote­cas que no se suscrib­an al pro­duc­to con­tarán con un ter­mi­nal con acce­so gra­tu­ito a su fon­do para el dis­frute de los usuar­ios. Esto aumen­ta el ben­efi­cio públi­co deriva­do del acuer­do tan­to por vía direc­ta como por per­mi­tir un canal de dis­tribu­ción que no requiere pago a Google ni a los dueños de los dere­chos de explotación.

9. El acuer­do dista de ser per­fec­to. La prác­ti­ca amer­i­cana de hac­er planes públi­cos medi­ante arbi­trio pri­va­do está muy lejos de ser per­fec­ta. Pero en ausen­cia del acuer­do —inclu­so si Google se ha impuesto sobre las deman­das de edi­tores y autores— no ten­dríamos la infraestruc­tura dig­i­tal que dé soporte a la Repúbli­ca de las Letras del siglo XXI. Ten­dríamos índices y frag­men­tos y no habría man­era de leer una can­ti­dad sus­tan­cial de cualquiera de los mil­lones de libros online en juego. El acuer­do nos da una vista pre­via de una vas­ta can­ti­dad de con­tenido, y la prome­sa de fácil acce­so al resto, y de esta man­era pro­mueve enorme­mente el bien públi­co.

10. Por supuesto, preferiría la bib­liote­ca uni­ver­sal; pero estoy bas­tante con­tento con la libr­ería uni­ver­sal. A fin de cuen­tas, las libr­erías son buenos sitios para leer libros y después decidir si com­prar­los o ir a la bib­liote­ca a leer algo más.

Paul N. Courant.

Nota: Esta car­ta rep­re­sen­ta mi pun­to de vista, y no el de la Uni­ver­si­dad de Michi­gan, ni el de ninguno de sus depar­ta­men­tos o bib­liote­cas.

Sumo los vín­cu­los a algu­nas de las ref­er­en­cias de Courant: Dig­i­tal Mil­len­ni­um Copy­right Act, Son­ny Bono Copy­right Term Exten­sion Act, High­er Edu­ca­tion Oppor­tu­ni­ty Act y Eldred con­tra Ashcroft. Espero que el tex­to os haya gus­ta­do tan­to como a mí y os ani­mo a que util­icéis los comen­tar­ios.

Lo mejor de la semana, 5–9 de Agosto

No es ningún secre­to que durante agos­to la blo­gos­fera entra en esta­do semi­co­matoso. Muchos de los que escriben un blog y tratan de hac­er­lo con cier­ta cal­i­dad, ded­i­can las vaca­ciones a preparar cam­bios en el dis­eño de sus sitios o a redac­tar una batería de entradas no suje­tas tan­to a la actu­al­i­dad y sí a dis­cu­siones de fon­do. Este sitio no es una excep­ción: se reduce la fre­cuen­cia de las entradas mien­tras preparo mi propia batería para la segun­da mitad de sep­tiem­bre. Mi deseo es hac­er uno de los mejores sitios sobre his­to­ria del Renacimien­to en la red.

A pesar de lo dicho, 4 días de lec­turas en red dan para mucho, como podéis ver; de hecho, han pasa­do tan­tas cosas y tan­to intere­sante he leí­do que me he tenido que saltar la regla de los siete días.

* Satir­i­cal maps of the First World War. De mi idol­a­tra­do Pea­cay de Bib­lioOdyssey, que nun­ca recomen­daré lo sufi­ciente. Se tra­ta de una colec­ción de mapas satíri­cos sobre la I Guer­ra Mundi­al. No resul­ta sor­pren­dente, sino triste, ver que nues­tra ima­gen inter­na­cional sigue sin vari­ar no des­de 1914, sino des­de 1804. Algún día dedi­caré una entra­da a la visión de las dis­tin­tas naciones durante el Renacimien­to.

* Gov­ern­ment work­ers want social tools — but the IT dept doesn’t get it, de Mike Butch­er en Textcrunch UK (otro impre­scindible). Sobre la implantación de las redes sociales en los organ­is­mos guber­na­men­tales del Reino Unido, y la curiosa oposi­ción que se da entre los emplea­d­os —que sien­ten una cier­ta atrac­ción por los mis­mos— y el gob­ier­no, que no ve ningu­na ven­ta­ja en ello. ¿Cuál sería la situación en España, donde algunos min­istros tienen su pro­pio blog?

* Solo uno de cada diez uni­ver­si­tar­ios españoles estu­dia fuera de su comu­nidad autóno­ma. Noti­cia de 5 de agos­to de El País. Los datos, de 2004–2005, siguen sien­do rep­re­sen­ta­tivos del sis­tema uni­ver­si­tario español, donde diver­sas difi­cul­tades —vivien­da, comu­ni­ca­ciones, sis­tema de becas, etc.— siguen pesan­do.

* Two The­olo­gians Fight over Gene­va, en D.Mac’s Stuff. Buen resumen de las pos­turas de Iacopo Sado­le­to y Calvi­no en el breve debate que man­tu­vieron en 1539 medi­ante sendas car­tas y que ha sido con­sid­er­a­do en numerosas oca­siones como el nacimien­to de la Con­trar­refor­ma.

* The 5 Great­est Things ever Accom­plished while High, o “Las cin­co cosas más impor­tantes con­seguidas de subidón”, de Jack O’Brien en cracked.com. Pues eso, des­de el des­cubrim­ien­to de la cade­na de ADN por Fran­cis Crick a los 10 Man­damien­tos. Qué queréis, un poco de humor tam­poco viene mal en ver­a­no. Por cier­to, que yo lo des­cubrí vía Boing Boing.

* Snowl, Auro­ra, OAuth, OpenId y el futuro nave­g­ador web. Intere­sante entra­da de Error 500, donde se comen­tan los dos proyec­tos para nave­g­adores del futuro que la fun­dación Mozil­la —ya sabéis, la que crea ese nave­g­ador que todos deberíais usar— tiene en mente: Auro­ra y Snowl. ¡El futuro web va a ser com­pli­ca­do!

* Why the Dig­i­tal Human­i­ties?, de Brett Bob­ley, direc­tor de la Office of Dig­i­tal Human­i­ties. Intere­sante por quién lo escribe y por cómo tra­ta el prob­le­ma y sobre todo porque pro­pone cómo tra­ba­jar con lo que él denom­i­na cyber­in­fra­struc­ture en los tér­mi­nos que requería yo en esta entra­da.

* The Orwell diaries. Al igual que había suce­di­do con el Cuader­no Gris de Josep Pla, o con las expe­ri­en­cias de un sol­da­do de la I Guer­ra Mundi­al. Aho­ra ten­emos la opor­tu­nidad de leer cada día el diario de George Orwell que, afor­tu­na­dos nosotros, comien­zan el 9 de agos­to de 1938, podéis dis­fru­tar de una entra­da cada día aquí.

Funciona con WordPress & Tema de Anders Norén