vendredi 13 mai 2005

Google l'africain?

Très modeste contribution au débat sur la numérisation des bibliothèques par Google.

Depuis quelques mois un débat s'est engagé au sujet du projet Google Print visant à numériser 15 millions d'ouvrages provenant de quelques-unes des plus grandes biblothèques anglo-saxonnes.
Dans le Monde du 24 janvier 2005, Jean-Noel Jeanneney, Président de la Bibliothèque nationale de France (BNF), réagissait par un article intitulé "Quand Google défie l'Europe" dans lequel il s'inquiétait du "risque d’une domination écrasante de l’Amérique dans la définition de l’idée que les prochaines générations se feront du monde".

Je ne suis pas assez compétent sur le plan technique pour dire si les outils d'indexation qu'utilise Google tendraient ou non à imposer une définition américaine de la culture. Je voudrais juste rapporter mon expérience d'utilisateur de la fonction Alertes de Google qui me signale chaque jour les articles publiés sur des thèmes qui m'intéressent (en l'occurence "communication politique"). Assez étonnamment, 70 à 80% des articles signalés proviennent de publications africaines, le reste provenant de Suisse, du Québec ou de Belgique, et parfois de France. Peut-être Google n'a-t-il pas obtenu des journaux français les droits de signaler leurs articles? Ou alors Google aurait-il un tropisme africain?

PS: Pour numériser ses ouvrages, la BNF a choisi un mode image alors que Google a adopté un mode texte. La première méthode a l'avantage de conserver la mise en page, et éventuellement l'iconographie, originale. Mais, hélas, les images ne sont pas toujours très lisibles comme on peut en juger ici avec
la reproduction de l'article de JN Jeanneney dans le Monde.
Derrière ce choix technique, on voit bien que ce sont deux conceptions de l'archivage qui sont en concurrence:
- l'une, sans doute préférée des historiens et des chercheurs, veut conserver l'intégrité des documents originaux, mais pose, je crois, des problèmes d'indexation (qui est plus difficile en mode image et nécessite en général une intervention humaine);
- l'autre est plus axée sur la facilité de recherche et de lecture de la substance de textes, mais fait disparaître toutes les informations attachées à leur mise en forme.

Pour aller plus loin:
-
Revue de presse sur le débat sur la numérisation sur le site de la BNF : principalement des articles hostiles au projet Google.
-
biblioacid : un blog malin et bien informé sur les enjeux du numérique pour les bibliothèques.

Aucun commentaire: