La numérisation de tous les livres dans le monde

par Jorge Ledo le 1 er août, 2008 · 3 commentaires

dans les notes

H e lu avec beaucoup d'attention l'article de Jean-Claude Guédon a écrit en réponse à un autre article que j'ai admiré Robert Darnton a écrit dans le New York Review of Books New dernier mois et demi.

Darnton optimisme loué les avantages de la numérisation des livres d'aujourd'hui, et comment le projet de Google Livres conduire à nouvelle façon d'enquêter, déterminée par l'accès immédiat à l'information, tournez vers l'est, seulement comparable à celui assumé généralisée de l'imprimerie en Europe au cours de la seconde moitié du XVe et début du XVIe siècle. Dans ses propres mots:

En 2006, Google a signé des accords avec cinq bibliothèques de recherche du grand-public de New York, Harvard, Michigan, Stanford et d'Oxford Bodleian "leurs livres à numériser. Livres en droit d'auteur pose un problème, qui a été composé par des procès dès la part des éditeurs et des auteurs. Mais cette mise à part, la proposition de Google semblent offrir un moyen de faire tous les apprentissages livre à la disposition de toutes les personnes, ou du moins ceux privilège d'avoir accès au World Wide Web. Il a promis d'être le stade ultime de la démocratisation du savoir Septembre en mouvement par l'invention de l'écriture, le codex, Movable Type, et de l'Internet.

Comme Darnton suggère d'ailleurs dans l'article, son approche au projet Google est celle d'un passionné, un savant, un historien de la culture, qui comprend les difficultés de son bureau et voit le potentiel de gain de temps et de ressources pour le chercheur et la personne intéressée à la culture. Jusqu'à présent, notre enthousiasme est partagé. Toutefois, Guédon souligne plusieurs aspects qui semblent échapper à Darnton:

  • La façon dont Google limite l'utilisation gratuite de ces textes.
  • La façon dont Google devient médiateur nécessaire entre l'objet culturel et le lecteur.

Pour moi, en tant qu'utilisateur avec une profonde conviction sur les mérites de textes numériques, et même d'une bibliothèque numérique qui devient la bête noire de tout le disque dur-moi un intérêt particulier dans le premier. Mais Guédon soutient de façon convaincante l'insolubilité des deux.

Lorsque je clique sur Google Livres et passe un après-midi là, juste à venir à la conclusion que l'espace est une mauvaise idée. Je dis cela parce que je suis tout à fait un peu plus de choses à voir avec les livres qui me permettent. La première est croisée recherche en utilisant les opérateurs booléens dans un ensemble de textes que je choisis, la seconde est de vérifier les occurrences d'un ensemble donné de formules pour l'identification des styles de texte, polices, etc, et bien plus encore. De toute évidence, comme nous l'avons expliqué Guédon, Google doit limiter l'accès et le traitement des livres afin de protéger leur «business model», et il est clair que le lecteur qui ne rend pas la lecture et le travail d'analyse textuelle juste la différence quand il s'agit de l'accès aux livres.

Ici nous entrons dans un autre problème: il ya des lecteurs intéressés par les nombreuses questions qui occupent les historiens, mais peu de gens peuvent les aborder avec une certaine facilité - et qui le fait?, En fait, pour eux. Le travail de l'historien est de décrire, d'expliquer, de synthétiser les données si claires pour l'interprétation ultérieure de l'auberge même au moins pour l'intérêt lecteur instruit, sinon, votre travail sera réinterprété ou relégué dans l'oubli.

Googlebooks

Probablement tous les livres du monde finissent numérisés, et ce sans aucun doute transformé la façon dont notre rapport au livre, l'information et de l'histoire. Dans un lointain avenir, peut-être pas trop, le travail des enseignants en sciences humaines sera beaucoup plus axé sur l'enseignement de la façon de gérer le contenu dans le contenu lui-même, ou tout simplement disparaître. Cela pose de nouveaux défis: le changement dans le modèle éducatif, où plus de structures sclérosées système de permis, sera radicale. Cela est essentiel pour ouvrir la voie à ne pas changer, et oui à la bataille difficile de maintenir le sens de tout ce que bouillie. L'enjeu, en fin de compte, la manière dont la pensée occidentale est liée à son histoire et, malgré la redondance, l'histoire de sa pensée. Si nous préparer au changement, nous allons étudier au cours du siècle dernier ont été impensable ambitieux et complexe, sinon, après avoir scanné tous les livres dans le monde sans doute signifie simplement une excuse pour la perte de mémoire et les relations faibles nous avons créé entre eux depuis des siècles. De même, le changement des habitudes de lecture et d'analyse avec lui. Cependant, pour cela il faut créer les outils nécessaires et la compréhension tant de manières claires afin de simplifier ou de compliquer infiniment consultation des textes et autres matériaux.

Google limite ces possibilités et les paradoxes de l'époque, à leur offrir. Son rôle en tant que médiateur, dit Guédon, fait les mêmes bibliothèques avec lesquelles il travaille ne peut pas découvrir le vrai potentiel d'une vaste bibliothèque numérique. Ajouté à cela, le travail de numérisation de Google est un peu médiocre par moments, non seulement parce qu'il touche à la qualité de la résolution, mais des erreurs flagrantes dans la répétition et d'omission de pages, comme l'a noté Robert B. Townsend dans un autre article ce moment- une - est une référence sur le sujet, et aussi des références au format XML, bibtex et d'autres qui sont de 90% du temps mauvais.

Il existe des initiatives qui visent à changer cette situation, avec des réussites diverses. Dans ce post, je ne citerai que deux d'entre eux travaillent comme des modèles et des perspectives différentes:

  • D'une part, la Bibliothèque européenne , un projet dont l'objectif à long terme de numériser tous les documents du vieux continent et pourtant a toutes les apparences de la dérive précisément parce qu'il ne comprend pas, comme il arrive à Gallica -inclus il, "pas simplement la présence d'images monté dans un format PDF, si elle n'est pas de fournir un texte qui peut être suivi.

  • En outre, The Internet Archive , qui est récents devenir mon référentiel de prédilection pour plusieurs raisons: la première est qu'il s'agit d'une plate-forme ouverte et libre, où les multinationales numérisées des textes comme Microsoft, les institutions et les archives publiques, l'utilisateur individus, et forment un grand groupe avec un intérêt soutenu pour l'amélioration de la qualité de son contenu et l'agrandir. L'Internet Archive ne se limite pas à convoquer les textes, mais a un contenu de toutes sortes, qui ont perdu leur droit à la copie privée, ou ont été créés en vertu d'une licence Creative Commons , ou ont été donnés par leurs auteurs ou des éditeurs qui possédait les droits. La bonne chose à propos d'Internet Archive est une communauté derrière lui très critique et très actif, et a préparé un vaste groupe de commissaires (conservateurs) qui sont chargés d'examiner, examiner et recommander le contenu.

Bien entendu, ni ne le travail que j'ai mentionné plus tôt, même Google Livres est encore des capacités de recherche de qualité supérieure. Mais je pense que l'Internet Archive a un facteur qui sera essentiel pour l'avenir de la lecture et l'étude sur l'Internet: la création d'une communauté critique spécialisée autour de ce contenu. C'est l'une des deux pièces, l'autre étant la création d'une sémantique appropriée et relationnelles instrumentales qui sont essentiels pour bibliothèques virtuelles ne sont pas subir le sort de dimensions bibliothèques trois. Et j'aime l'idée de devenir bibliothécaire, même une modeste bibliothèque et malade, dans ce monde virtuel.


Certains ouvrages récents d'intérêt pour une position cohérente sur Google Books:

  • Google Books vs Bison , Mark J. Ludwig et Margaret R. Wells. Grand article dans Le Journal bibliothèque écrite du point de vue des professionnels de l'information, ce qui contraste l'utilisation de Google Books avec le système d'information bibliographique de l'Université de Buffalo ( Bison ), les résultats de l'analyse tirée dans la défaite absolue Bison le géant de la Silicon Valley. Les conclusions, je pense, de rectification: compte tenu des progrès dans la numérisation des fonds énormes, la course est déjà perdue en termes de création de plusieurs documents, mais la création de services liés aux fichiers qui offre une champ illimité de possibilités, alors que pratiquement déserte à l'heure actuelle.

  • Pour les attaques de divers groupes d'édition européennes et certains de ses institutions contre Google Livres, vous pouvez voir ce qui s'est passé en France ( 1 , 2 , 3 et 4 ) ou en Allemagne . Et, en revanche, tous les ( 1 , 2 et 3 ) ce qui s'est passé en Espagne.

  • Pour les avantages de Google Livres dans le domaine universitaire en dehors des essais et Darnton-dessus, le pied droit peut être saisi par l'intermédiaire du l'analyse que Gregory Crane consacrée à la montée des bases textuelles internet pour un couple d'années et les idées de Tim O'Reilly sur les besoins de calcul de la masse entière de la littérature qui fournit le référentiel et quelques exemples de modèles de base serait envisagée. De toute évidence, vous pouvez aussi aller à cette coupe du documentaire "Le monde selon Google" qui parle de Google Books:

  • Enfin, je me référerai à la liste de ressources pour la recherche sur l'Internet qui Anthony Grafton dans le New Yorker ne font environ un an. Est en soi une excellente introduction à l'utilisation de bases de données et de bibliothèques virtuelles, par opposition aux archives traditionnelles.

  1. Je le dis pour le moment car Google Livres a lui-même des outils pour identifier ces erreurs afin qu'elles puissent être corrigées et corrigées avec un peu de vitesse.

trackbacks } (3 trackbacks)

Laissez un commentaire

Le post précédent:

Next message: