Ficta eloquentia

Retórica, política y poética medieval y renacentista. Silva de varia lección

Etiqueta: websemántica

Europeana en abierto y en Beta

Euro­peana aca­ba de abrir sus puer­tas, o sus puer­tas traseras, al gran públi­co. Al igual que Klaus Graf, de Archivalia, me había hecho ilu­siones de encon­trarme con un lugar que pusiera el fon­do común europeo a la altura de las mejores colec­ciones com­pre­hen­si­vas de libros y doc­u­men­tos de Inter­net. La cosa no ha sido así.

Antes de seguir, que los habrá impa­cientes, os dejo el enlace para que podáis haceros con una cuen­ta y acced­er al sitio, solo tenéis que pin­char aquí. [actu­al­i­zo a 17 de noviem­bre: parece que se han dado cuen­ta en el servi­dor del trá­fi­co que se esta­ba redi­rigien­do des­de esta puer­ta trasera. Aho­ra habrá que esper­ar al 20.]

Tras entrar y hac­er un par de búsquedas veréis que sale mucho más a cuen­ta entrar en fon­dos par­tic­u­lares, como Gal­li­ca, por ejem­p­lo, o muchos de los que reseñé hace un par de sem­anas aquí. Es cier­to que Euro­peana ofrece una especie de motor social para estable­cer comu­nidades y gru­pos de interés, pero la ver­dad es que es tan pobre y está tan mal dis­eña­do, que direc­ta­mente lo que hace es echar para atrás. Por lo que toca al index­a­do de la infor­ma­ción, la cat­e­go­rización y demás, era de esper­ar un tra­ba­jo mucho más serio, ni siquiera fun­ciona cor­rec­ta­mente el eti­que­ta­do de los tex­tos. Sobre las imá­genes y los doc­u­men­tos, otra cosa que men­ciona Graf, la ver­dad es que son ridícu­las, minús­cu­las y mal ren­der­izadas. La edi­ción de las bib­lias de Guten­berg de Oxford se ven infini­ta­mente mejor —o, direc­ta­mente, se ven— en su lugar orig­i­nal que en este sitio. Y así un amplio etcétera.

En fin, esper­aré al lan­za­mien­to ofi­cial el día 20 a ver qué pasa. Aunque ya avisan que has­ta el año que viene el sitio no será ple­na­mente fun­cional. De momen­to podéis acced­er des­de el enlace que os he puesto. En prim­i­cia.

Espero vues­tras opin­iones y comen­tar­ios.

Búsquedas semánticas en Internet: Lumifi

Acabo de encon­trar una apli­cación para realizar búsquedas online con unas car­ac­terís­ti­cas que creía lim­i­tadas a apli­ca­ciones de escrito­rio como coper­nic para win­dows o devon­a­gent —del que ya hablé aquí y sobre el que volveré más ade­lante— para macosx. Lumi­fi es una apli­cación web dis­eña­da para la lec­tura, la inves­ti­gación y la colab­o­ración en red. Las ven­ta­jas sobre cualquier otra her­ramien­ta prece­dente con­sis­ten en la división en espa­cios dis­tin­tos dis­eña­dos para la búsque­da y para la orga­ni­zación de mate­ri­ales encon­tra­dos en el pro­ce­so. Lumi­fi per­mite la creación de dis­tin­tos note­books donde ir alma­ce­nan­do todo lo que nos vamos encon­tran­do y que nos intere­sa, y a la vez, per­mite la creación de un mar­co de relación social con los usuar­ios de la platafor­ma. En pal­abras de sus creadores:

By pro­vid­ing a means to dig deep­er into archives data­bas­es and oth­er con­tent lumi­fi emer­gence cos­tumers can lever­age their invest­ment in con­tent build a rela­tion­ship with oth­er researchers and cap­ture user ana­lyt­ics that can form the basis for future busi­ness or strate­gic deci­sions. «Lumi­fi emer­gence’s intu­itive user inter­face and rich col­lab­o­ra­tive fea­ture set will pro­vide for a more effi­cient and enjoy­able research process,» says miller, «and our goal at lumi­fi is to cre­ate a world where research is eas­i­ly extract­ed from infor­ma­tion and knowl­edge is shared.»

El tablero prin­ci­pal des­de el que tra­ba­jamos ofrece el sigu­iente aspec­to y dis­tribu­ción:

tablero (pin­cha sobre la ima­gen para ampli­ar)

Por lo que se refiere a las búsquedas, yo he esta­do juguete­an­do con el un rato y, sin­ce­ra­mente, fun­ciona bien en su selec­ción de la rel­e­van­cia, pero los resul­ta­dos que ofrece para con­cep­tos muy gen­erales es escasa, pero hay una con­tra­parti­da: si ped­i­mos a lumi­fi que se con­cen­tre en expandir la búsque­da den­tro de la lista de resul­ta­dos, ver­e­mos la mul­ti­pli­cación de enlaces rel­e­vantes con la posi­bil­i­dad de expor­tar resúmenes y eti­que­tas y aplicar toda clase de fil­tros. Todo de una man­era muy limpia y estéti­ca, como podéis ver en esta pan­talla:


pan­talla de análi­sis (pin­cha sobre la ima­gen para ampli­ar)

Según se comien­za a usar de man­era inten­si­va y a orga­ni­zar las notas, uno se da cuen­ta del poten­cial de la apli­cación y de las posi­bil­i­dades que tiene para realizar análi­sis com­ple­jos den­tro de la red. Es evi­dente que en mi caso no va a susti­tuir a devon­a­gent mien­tras no per­mi­ta la apli­cación de fór­mu­las lóg­i­cas para búsquedas cruzadas y com­ple­jas en diver­sos idiomas, pero por el camino de desar­rol­lo que está lle­van­do la apli­cación, parece que va a ser una her­ramien­ta digna de con­sid­er­arse en un futuro próx­i­mo, más si ten­emos en cuen­ta que es gra­tui­ta y que ofrece wid­gets para Win­dows y MacOSX, así como para sitios sociales como face­book, MySpace y Bebo.

———–

Tam­bién podéis ver otras ref­er­en­cias a Lumi­fi en:

* Los anun­cios de lan­za­mien­to del 2 de sep­tiem­bre de 2008 en The Earth Times, Mar­ket­watch y Forbes.
* El pro­pio blog de los desar­rol­ladores: Lumi­fi­ca­tion.
* La reseña que Mash­able le dedicó en enero de este año o la de Jon Raasch hace unos meses, que son un buen pun­to de arranque para ver la impre­sio­n­ante can­ti­dad de mejo­ras que los desar­rol­ladores han ido real­izan­do.
* Acad­emhack.

Estoy muy intere­sa­do en saber vues­tras opin­iones si le dais una opor­tu­nidad y las probáis. Así que servi­ros de los comen­tar­ios para recomen­dar otras apli­ca­ciones sim­i­lares que conozcáis y para señalar util­i­dades que, como es inevitable en una reseña tan breve, se me hayan podi­do escapar.

Digitalizando todos los libros del mundo

He leí­do con suma aten­ción el artícu­lo que Jean-Claude Gué­don ha escrito como répli­ca a otro artícu­lo que mi admi­ra­do Robert Darn­ton escribió en The New York Review of Books hace un mes y medio.

Darn­ton alaba­ba de man­era opti­mista las ven­ta­jas que tiene la dig­i­tal­ización de libros en la actu­al­i­dad, y cómo el proyec­to de Google Books con­ducirá a nue­vo modo de inves­ti­gar, deter­mi­na­do por el acce­so inmedi­a­to a la infor­ma­ción; giro este, sólo equipara­ble al que supu­so la gen­er­al­ización de la imprenta en Europa durante la segun­da mitad del siglo XV y comien­zos del siglo XVI. En sus propias pal­abras:

In 2006 Google signed agree­ments with five great research libraries—the New York Pub­lic, Har­vard, Michi­gan, Stan­ford, and Oxford’s Bodleian—to dig­i­tize their books. Books in copy­right posed a prob­lem, which soon was com­pound­ed by law­suits from pub­lish­ers and authors. But putting that aside, the Google pro­pos­al seemed to offer a way to make all book learn­ing avail­able to all peo­ple, or at least those priv­i­leged enough to have access to the World Wide Web. It promised to be the ulti­mate stage in the democ­ra­ti­za­tion of knowl­edge set in motion by the inven­tion of writ­ing, the codex, mov­able type, and the Inter­net.

Como Darn­ton sug­iere en otro lugar del artícu­lo, su acer­camien­to al proyec­to de Google es el de un entu­si­as­ta, un eru­di­to, un his­to­ri­ador de la cul­tura, que com­prende las difi­cul­tades de su ofi­cio y que ve las posi­bil­i­dades de ahor­ro de tiem­po y de recur­sos tan­to para el inves­ti­gador como para la per­sona intere­sa­da por la cul­tura. Has­ta aquí nue­stro entu­si­as­mo es com­par­tido. Sin embar­go, Gué­don pone de man­i­fiesto var­ios aspec­tos que pare­cen escapárse­le a Darn­ton:

* El modo en que Google limi­ta el libre uso de esos tex­tos.
* El modo en que Google se con­vierte en medi­ador nece­sario entre el obje­to cul­tur­al y el lec­tor.

A mí, como usuario con una pro­fun­da con­vic­ción sobre las bon­dades de los tex­tos dig­i­tales —y con una bib­liote­ca dig­i­tal propia que comien­za a ser la pesadil­la de cualquier dis­co duro— me intere­sa espe­cial­mente la primera. Pero Gué­don argu­men­ta de modo con­vin­cente la indis­ol­u­bil­i­dad de ambas.

Cuan­do uno accede a Google Books y pasa allí una tarde, aca­ba lle­gan­do a la con­clusión de que se tra­ta de un espa­cio mal pen­sa­do. Digo esto porque a mí se me ocur­ren bas­tantes más cosas que hac­er con los libros que las que se me per­miten. La primera de ellas es realizar búsquedas cruzadas medi­ante oper­adores booleanos en un con­jun­to de tex­tos que yo eli­ja, la segun­da es com­pro­bar las ocur­ren­cias de un con­jun­to deter­mi­na­do de fór­mu­las tex­tuales para iden­ti­ficar esti­los, fuentes y demás, y así un largo etcétera. Es evi­dente, como bien expli­ca Gué­don, que Google nece­si­ta lim­i­tar el acce­so y el tratamien­to de los libros en orden a pro­te­ger su “mod­e­lo de nego­cio”, y es evi­dente que el lec­tor que no hace de la lec­tura y del análi­sis tex­tu­al su tra­ba­jo ape­nas notará esta difer­en­cia a la hora de acced­er a los libros.

Aquí entramos en otro prob­le­ma impor­tante: exis­ten lec­tores intere­sa­dos en muchos de los temas que ocu­pan a los his­to­ri­adores; pero son pocos los que pueden aprox­i­marse a ellos con cier­ta desen­voltura —¿y quién lo hace?, en real­i­dad— a ellos. El tra­ba­jo del his­to­ri­ador es describir, expon­er, sin­te­ti­zar los datos de modo claro para que la inter­pretación pos­te­ri­or de los mis­mos alber­gue un mín­i­mo interés para el lec­tor cul­to; de no ser así, su tra­ba­jo habrá de rein­ter­pre­tarse o quedar rel­e­ga­do al olvi­do.

GoogleBooks

Prob­a­ble­mente todos los libros del mun­do acaben por dig­i­talizarse, y ello trans­for­mará indud­able­mente nue­stro modo de rela­cionar­los con el libro, la infor­ma­ción y la his­to­ria. En un futuro quizás no muy lejano, el tra­ba­jo de los pro­fe­sores de humanidades estará mucho más cen­tra­do en enseñar cómo ges­tionar los con­tenidos que en los con­tenidos mis­mos, o sen­cil­la­mente desa­pare­cerá. Esto plantea nuevos retos: el giro en el mod­e­lo educa­ti­vo, si las estruc­turas más escle­ro­ti­zadas del sis­tema lo per­miten, va a ser rad­i­cal. Aquí es fun­da­men­tal alla­nar el camino no al cam­bio, y sí a la dura batal­la por man­ten­er el sen­ti­do de toda esa masa informe. Está en juego, en el fon­do, el modo en que el pen­samien­to occi­den­tal se rela­ciona con su his­to­ria y, val­ga la redun­dan­cia, con la his­to­ria de su pen­samien­to. Si nos preparamos para el cam­bio, ver­e­mos estu­dios que durante el siglo pasa­do eran impens­ables por ambi­ciosos y com­ple­jos; si no, el hecho de ten­er dig­i­tal­iza­dos todos los libros del mun­do prob­a­ble­mente solo sig­nifique una excusa para la desapari­ción de la memo­ria y de las ende­bles rela­ciones que hemos crea­do entre ellos durante sig­los. Del mis­mo modo, cam­biará el hábito de lec­tura y de análi­sis con él. Aho­ra bien, para que esto suce­da es pre­ciso que se creen las her­ramien­tas nece­sarias y se com­pren­dan de modo claro las vías para sim­pli­ficar o com­plicar infini­ta­mente la con­sul­ta de tex­tos y demás mate­ri­ales.

Google limi­ta estas posi­bil­i­dades, parado­jas de los nuevos tiem­pos, al ofre­cer­los. Su papel como medi­ador, como señala Gué­don, hace que las mis­mas bib­liote­cas con las que tra­ba­ja no puedan explo­rar el autén­ti­co poten­cial de una inmen­sa bib­liote­ca dig­i­tal. Suma­do a esto, el tra­ba­jo de dig­i­tal­ización de Google es un tan­to mediocre en oca­siones, no solo por lo que toca a la cal­i­dad de la res­olu­ción, sino a errores de bul­to en repeti­ción y omisión de pági­nas, como señal­a­ba Robert B. Towsend en otro artícu­lo que —de momento[^1]— es de ref­er­en­cia sobre el par­tic­u­lar, o tam­bién las ref­er­en­cias en xml, bib­tex y demás, que son un 90% de las veces erróneas.

Hay ini­cia­ti­vas que pre­tenden cam­biar esta situación con muy diver­sos logros. En esta entra­da sólo haré ref­er­en­cia a dos de ellas como mod­e­los dis­tin­tos de tra­ba­jo y de per­spec­ti­vas:

* Por una parte, The Euro­pean Library, un proyec­to que tiene como meta a largo pla­zo dig­i­talizar todos los doc­u­men­tos del viejo con­ti­nente y que sin embar­go tiene todo el aspec­to de ir a la deri­va pre­cisa­mente porque no com­prende, como le pasa a Gal­li­ca —inclu­i­da en ésta—, que no bas­ta con la pres­en­cia de imá­genes mon­tadas en un pdf, si no ofre­cen un tex­to que pue­da ser ras­trea­do.

* Por otra, The Inter­net Archive, que últi­ma­mente se está con­vir­tien­do en mi repos­i­to­rio favorito por varias razones: la primera es que se tra­ta de una platafor­ma libre y abier­ta, donde hay tex­tos dig­i­tal­iza­dos por multi­na­cionales como microsoft, por enti­dades y archivos públi­cos, por usuar­ios par­tic­u­lares, y for­man un gran colec­ti­vo con un interés con­tin­uo por mejo­rar la cal­i­dad de sus con­tenidos y ampli­ar­la. The Inter­net Archive no se limi­ta a hac­er aco­pio de tex­tos, sino que alber­ga con­tenidos de todo tipo, que o bien han per­di­do sus dere­chos de copia pri­va­da, o bien han sido crea­d­os bajo una licen­cia Cre­ative Com­mons, o bien han sido don­a­dos por sus autores o por casas edi­to­ri­ales que poseían los dere­chos. Lo bueno de Inter­net Archive es que tiene detrás una comu­nidad muy críti­ca y muy acti­va, un grupo amplio y prepara­do de comis­ar­ios (cura­tors) que se encar­gan de revis­ar, reseñar y recomen­dar los con­tenidos.

Por supuesto, ningu­na de las dos real­iza la tarea que he men­ciona­do ante­ri­or­mente, inclu­so Google Books sigue sien­do supe­ri­or en posi­bil­i­dades de búsque­da. Pero me parece que Inter­net Archive cuen­ta con un fac­tor que va a ser esen­cial en el futuro de la lec­tura y el estu­dio en Inter­net: la creación de una comu­nidad críti­ca y espe­cial­iza­da en torno a esos con­tenidos. Se tra­ta una de las dos piezas, sien­do la otra la creación de instru­men­tal semán­ti­co y rela­cional ade­cua­do, esen­ciales para que las bib­liote­cas vir­tuales no cor­ran la suerte de las bib­liote­cas tridi­men­sion­ales. Y a mí me fasci­na la idea de con­ver­tirme en bib­liote­cario, aunque sea un bib­liote­cario modesto y acha­coso, de este mun­do vir­tu­al.

**********

Algunas lecturas de interés para una postura coherente hacia Google Books:

* Google Books vs. Bison, de Mark J. Lud­wig y Mar­garet R. Wells. Estu­pen­do artícu­lo de The Library Jour­nal escrito des­de el pun­to de vista de doc­u­men­tal­is­tas y bib­liote­car­ios, que con­trastan el uso de Google Books con el sis­tema de infor­ma­ción bib­li­ográ­fi­ca de la Uni­ver­si­dad de Buf­fa­lo (BISON), los resul­ta­dos del análi­sis derivan en la der­ro­ta abso­lu­ta de Bison ante el gigante de Sil­i­con Val­ley. Las con­clu­siones, me parece, las cor­rec­tas: tenien­do en cuen­ta el pro­gre­so en la dig­i­tal­ización de fon­dos enormes, la car­rera ya está per­di­da en cuan­to a la creación de más doc­u­men­tos, pero la creación de ser­vi­cios en torno a los archivos es el que ofrece un cam­po ilim­i­ta­do de posi­bil­i­dades, a la vez que prác­ti­ca­mente desier­to por el momen­to.

* Para los ataques de dis­tin­tos gru­pos edi­to­ri­ales Europeos y algu­nas de sus insti­tu­ciones con­tra Google Books, puede verse lo que ha pasa­do en Fran­cia (1, 2, 3 y 4) o en Ale­ma­nia. Y, por con­traste, todo (1, 2 y 3) lo que ha pasa­do en España.

* Para las bon­dades de Google Books den­tro del ámbito académi­co —fuera de artícu­los de opinión como el men­ciona­do de Darn­ton—, puede entrarse con buen pie vía el análi­sis que Gre­go­ry Crane le dedicó al auge de las bases tex­tuales en inter­net hace un par de años y a las ideas de Tim O’Reil­ly sobre las necesi­dades de com­putar toda la masa bib­li­ográ­fi­ca que apor­ta el repos­i­to­rio y algunos ejem­p­los de cómo serían mod­e­los bási­cos de análi­sis. Está claro que tam­bién puede acud­irse a este recorte del doc­u­men­tal «El mun­do según Google» que habla de Google Books:

* Por últi­mo, me que­da hac­er ref­er­en­cia a la lista de recur­sos para la inves­ti­gación en Inter­net que Antho­ny Grafton hizo en The New York­er hará cosa de un año. Es a su vez una fenom­e­nal intro­duc­ción al uso de las bases de datos y las bib­liote­cas vir­tuales por oposi­ción a los archivos clási­cos.

[^1]:

Digo de momen­to porque el pro­pio Google Books tiene her­ramien­tas para señalar estos errores de modo que puedan ser sub­sana­dos y cor­regi­dos con cier­ta celeri­dad.

Funciona con WordPress & Tema de Anders Norén