Il motore semantico

Volete partire in vacanza? La vostra domanda per esempio è: "Vorrei andare in una città del Mediterraneo dove fa più di 25 gradi in novembre". Una ricerca così mirata sul Web oggi non si può farla. Se volete tentare, vi tocca visitare decine e decine di siti turistici e di previsioni meteo e fare voi i confronti. "Un computer non sa trovarvi la risposta. Anche se un motore di ricerca esplora sulla base di parole chiave come Mediterraneo e 25 gradi,  non c'è niente che gli dica che quella è la temperatura di una tale città, in un dato periodo dell'anno. Quindi non fa che recuperare dai server migliaia di pagine dove appare 25 gradi, ma solo come cifra,  che può corrispondere a mille cose diverse" spiega Daniel Dardailler, direttore per l'Europa del W3C, il consorzio internazionale diretto da Tim Berners-Lee, che promuove lo sviluppo futuro del Web. Dardailler e la sua équipe di ricercatori erano il 14 settembre all'Inria- l'istituto nazionale francese di ricerca in informatica e automazione- nel parco tecnologico di Sophia Antipolis, per asssitere alla nascita di un motore di ricerca di nuova concezione, di tipo semantico: "Corese", che significa Conceptual Resource Search Engine. A presentare il prototipo, Olivier Corby, 44 anni, ricercatore informatico all'Inria e professore all'l'università di Nizza-Sophia Antipolis: "E' un motore di ricerca che lavora a livello dei concetti- spiega Corby- anzichè lavorare solo sui nomi, sulle parole chiave. Un motore dunque che sfrutta la modelizzazione delle conoscenze. Si può dire che conosce il senso delle parole che utilizza, quindi può comprendere meglio le questioni che gli vengono poste. Può fare delle deduzioni e capire quale tipo di informazione interessa veramente all'utilizzatore".  Corese, che  usa  agenti intelligenti per trovare le informazioni, è basato su due standard emessi dal W3C: il già noto e diffuso Xml e il più recente Rfid (Resource Description Framework).  Questi linguaggi sono i mattoni di base che permettono la costruzione del Semantic Web. Dardailler lo spiega così: "Il Semantic Web permette di fare domande ed avere risposte in modo più intelligente e preciso. Perchè questo avviene attraverso le ontologie". Cosa significa? "Le ontologie permettono di dare delle descrizioni di concetti che vengono riconosciuti da tutti, perchè rientrano in una serie di categorie. Ci sono categorie che tutti comprendono, come il prezzo di un oggetto. Poi ci sono categorie  che appartengono a campi specifici: per esempio la temperatura, nel campo della meteorologia. Quindi c'è un ontologia che riguarda tutto il settore delle previsioni meteo. Nella ricerca semantica, i dati presenti sui documenti sono messi in corrispondenza con le categorie, quindi riconosciuti concettualmente. I nuovi linguaggi, tra cui anche l'ultimo standard Owl (Onthology Web Language), forniscono i formati per poter creare queste associazioni". Secondo il W3C il Semantic Web, avviato da quattro-cinque anni, rappresenterà una piattaforma che man mano si sovrapporrà al Web attuale. L'adozione è cominciata nel mondo della ricerca, ma ora interessa già le grandi aziende.

Ed è proprio al mondo delle imprese che si rivolge ora il motore semantico Corese ( sarà lanciato entro la fine dell'anno come prodotto tramite una spin-off dei ricercatori dell'Inria). Per capire come verrà utilizzato, è utile ripercorre la storia: il progetto è nato nell'ambito del programma di ricerca europeo Acacia, diretto all'Inria da Rose Dieng, una signora senegalese, ingegnere, con un dottorato in Informatica e una solida esperienza di ricercatrice in Intelligenza artificiale. Acacia è dedicato alla gestione della conoscenza, tramite interazione di agenti intelligenti: "Se si considerano

Rose Dieng

le grandi organizzazioni, come le imprese, le istituzioni, o gli enti ospedalieri, che hanno bisogno di conservare le conoscenze, uno dei problemi è che parte di queste conoscenze si trovano nella testa delle persone, e rischiano di andare perdute con la mobilità interna, altre si trovano nei documenti dell'impresa, e altre ancora nei data-base. Ci siamo resi conto dell'importanza di legare queste fonti insieme e poi con  l'arrivo delle Intranet è stato fatto il passo successivo: il Web è diventato l'aggregatore. Ma ancora di più lo sarà il Web semantico" spiega Rose Dieng. "Ora il problema è quello della ricerca dell'informazione in questo insieme, particolarmete di un'informazione che sia il più possibile pertinente"  E' a questo bisogno che risponderà Corese? "In un primo tempo, sì. All'interno delle Intranet, Corese serve a reperire le informazioni dalla memoria d'impresa. E' già utilizzato dai nostri partner come Renault e Dassault, per esempio. Ma  questo motore semantico può  essere utilizzato anche per trovare le informazioni all'esterno dell'impresa: nella analisi della concorrenza, o dei mercati. Per esempio se cercate uno specialista di un settore preciso con particolari competenze, Corese può trovare proprio la persona di cui avete bisogno". Il problema, in attesa di una più ampia diffusione del Semantic Web, è che l'affidabilità delle informazioni trovate sulla grande rete non sempre è garantita. E anche un motore intelligente potrebbe cadere nelle trappole dello spam o del phishing.