Un nouvel enjeu clef pour l’économie du savoir :
la capacité de reconnaître et d’extraire du texte
dans les images
Laura Garcia Vitoria,
Directrice scientifique de la Fondation
des territoires de demain
Une avancée technologique très significative
dans le domaine de la recherche vient d’être
confirmée.
La capacité de reconnaître du texte dans les images - qu’ARENOTECH
évoquait au sein des débats de Ruraltic fin août
- a été confirmée très récemment
au travers du brevet à présent rendu public et qui
en effet avait été déposé par Google en
juillet 2007: cette technologie permet à des robots de lire et
de comprendre du texte placé dans des images et vidéos.
Le résultat est que ce système permettrait à Google
d’indexer dans les recherches, du texte placé dans des
images et vidéos; ce qui n’était guère possible
jusque là. Ce sera notamment le cas au travers de Google Maps
Street View. Ce système permettra d’accéder (Google
Book Search) dans un contexte cartographié et localisé
aux livres Google disponibles, ainsi qu’aux documents YouTube,
Flickr et bien d’autres.
Le constat est clair : les images numériques peuvent inclure
un grand nombre de contenus de toute nature : paysages et scènes
urbaines, personnes et objets. On imagine aisément la portée
pédagogique et didactique d’une telle possibilité,
tous les usages quotidiens dérivés d’activités
culturelles ou commerciales. Comme le soulignent les deux scientifiques
qui sont à l’origine de cette percée technologique
- Luc Vincent et Adrian Ulges, on songe aussi à l’enrichissement
de tous les contenus géolocalisables (scènes de rues historiques,
textes nés dans des contextes géographiques déterminés) :
l’utilisation
pour les nouvelles formes de tourisme sur lesquelles nous travaillons
actuellement s’avère ainsi tout à fait considérables…
Le web sémantique et toutes les applications qui seront dès
2008 celles du web 3 trouveront de même un champ de développement
considérable au travers de cette association plus intime de textes
et d’images et de l’enrichissement majeur des données
localisées au travers des images. Une nouvelle étape s’esquisse
- dans une histoire déjà demi-millénaire - des
rapports entre les images et les textes…