mercredi 29 mai 2013

Quand l’intelligence artificielle rencontre l’histoire du peuple juif



Si l’informatique revêt la plupart du temps la forme de nouveaux matériels ou logiciels, elle se met également au service de domaines très divers. Cette fois, elle rencontre l’histoire du peuple juif, qu’elle pourrait bien aider dans la quête de son passé, grâce à une intelligence artificielle conçue pour trier et assembler des centaines de milliers de très anciens documents.
 
La Guenizah du Caire est une collection unique de documents. Elle compte environ 200 000 pièces et représente un ensemble particulièrement hétéroclite de renseignements. On y trouve ainsi des documents juridiques, des recettes de cuisine, des correspondances privées, des contrats, des livres de prières, de la poésie et ainsi de suite. Une véritable avalanche de détails sur la vie du peuple juif à travers des documents datant d’une période de plus d’un millénaire (870 à 1880).
Collecter, rassembler, organiser et trier ces documents a déjà été fait à plusieurs reprises. La collection représente un trésor historique en plus de pouvoir renseigner sur le passé de tout un peuple à travers les siècles, et donc de suivre son évolution. Seulement voilà, le travail se heurte à une difficulté de taille : les documents sont en désordre. Pourquoi ? Parce qu’une guenizah est essentiellement une « remise ». Les documents portant le nom de Dieu ne doivent en effet pas être détruits, mais enterrés. Le processus de reconnaissance et d’appairage est également rendu complexe par un autre problème : la plupart de ces documents sont en langue arabe, mais avec un alphabet hébraïque.

Un grand travail de numérisation

Le travail d’identification, de compréhension et de recherche est particulièrement lent et rébarbatif et n’a produit à ce jour qu’environ 4 000 documents reconstitués. C’est ici qu’intervient l’informatique. Elle a commencé par un très long travail de numérisation, sur 301 000 fragments de papiers, répartis sur toute la planète dans des musées et des collections privées.
Puis, comme l’indique le New York Times, 450 000 photographies en haute qualité ont été prises sur fond bleu afin d’en faire ressortir les détails et les éléments significatifs. Mais si la numérisation est une étape cruciale, elle n’accélère pas nécessairement le travail général, même si un site web avait été mis en ligne pour aider les chercheurs.


Source Lemondejuif.info