Un nouvel enjeu clef pour l’économie du savoir :
la capacité de reconnaître et d’extraire du texte dans les images
Laura Garcia Vitoria,
Directrice scientifique de la Fondation des Territoires de Demain

Une avancée technologique très significative dans le domaine de la recherche vient d’être confirmée. La capacité de reconnaître du texte dans les images - qu’ARENOTECH évoquait au sein des débats de Ruraltic fin août - a été confirmée très récemment au travers du brevet à présent rendu public et qui en effet avait été déposé par Google en juillet 2007: cette technologie permet à des robots de lire et de comprendre du texte placé dans des images et vidéos. Le résultat est que ce système permettrait à Google d’indexer dans les recherches, du texte placé dans des images et vidéos; ce qui n’était guère possible jusque là. Ce sera notamment le cas au travers de Google Maps Street View. Ce système permettra d’accéder (Google Book Search) dans un contexte cartographié et localisé aux livres Google disponibles, ainsi qu’aux documents YouTube, Flickr et bien d’autres.
Le constat est clair : les images numériques peuvent inclure un grand nombre de contenus de toute nature : paysages et scènes urbaines, personnes et objets. On imagine aisément la portée pédagogique et didactique d’une telle possibilité, tous les usages quotidiens dérivés d’activités culturelles ou commerciales. Comme le soulignent les deux scientifiques qui sont à l’origine de cette percée technologique - Luc Vincent et Adrian Ulges, on songe aussi à l’enrichissement de tous les contenus géolocalisables (scènes de rues historiques, textes nés dans des contextes géographiques déterminés) : l’utilisation pour les nouvelles formes de tourisme sur lesquelles nous travaillons actuellement s’avère ainsi tout à fait considérables
Le web sémantique et toutes les applications qui seront dès 2008 celles du web 3 trouveront de même un champ de développement considérable au travers de cette association plus intime de textes et d’images et de l’enrichissement majeur des données localisées au travers des images. Une nouvelle étape s’esquisse - dans une histoire déjà demi-millénaire - des rapports entre les images et les textes…