Webvocal

Finora abbiamo navigato a vista. D’ora in poi potremo navigare anche a voce. Usando la parola al posto della tastiera. E’ l’ultimo sviluppo delle tecnologie di Internet. Il 19 giugno Il W3C ( World Wide Web Consortium) l’organismo internazionale fondato da Tim Berners-Lee che si occupa di uniformare l’adozione di nuove tecnologie per la rete, ha annuciato due nuovi standard per creare “interfacce voice” e “browser vocali”. Sono il linguaggio VoiceXml 2.1 (la prima versione è già usata nella telefonia cellulare) e l’interprete di riconoscimento vocale Sisr1.0. “Stiamo completando la piattaforma di interfaccia vocale, che andrà a integrarsi con altre due iniziative in via di standardizzazione, il Mobile Web e il Semantic Web” precisa Daniel Dardailler direttore delle relazioni internazionali e coordinatore europeo del W3C. “E’ un’archittetura software composta da diversi mattoni, che favorisce la convergenza. Per esempio, un fornitore di servizi di call center ora può scrivere la sua applicazione una sola volta ed ha la possibilità di offrirla allo stesso modo sulla telefonia fissa, su quella mobile o sul Web”.
A cosa serve il VoiceXml? “Molta gente ha già familiarità con i servizi telefonici automatici: sono utilizzati per ottenere informazioni come gli orari dei voli, i film in programmazione, per consultare la bolletta elettrica, o il conto bancario. La crescita esplosiva del Web ha spinto i fornitori dei servizi telefonici ad estendere la propria offerta sulla rete” spiegano a Voxeo Corporation, uno dei leader mondiali nei servizi vocali. “Il VoiceXml è il linguaggio standard che ci consente di realizzare i migliori servizi per i due mondi: la telefonia e Internet. I provider di servizi vocali telefonici possono ora offrirli ai clienti con la stessa interfaccia vocale su un sito Web. Significa ridurre i costi ed estendere l’uso”. A costruire il VoiceXml 2.1 hanno contribuito i maggiori protagonisti del mercato dei servizi vocali, come Tellme Networks (da poco acquistato da Microsoft), Voxeo, Nuance Communications, Voxpilot, Comverse, oltre a Hewlett-Packard e all’italiana Loquendo. Un altro gruppo di lavoro al W3C è quello del Voice Browser. “Come un browser tradizionale usa le combinazioni tra il linguaggio Html e la tastiera, o il mouse, per permettere all’utente di interrogare il Web, allo stesso modo con il VoiceXml diventa possibile interagire a voce, dal microfono del computer, da un telefono Voip o da un cellulare” precisa Dardailler. Per creare i software che gestiscono gli input e gli output vocali e renderli standard c’è stato un lungo lavoro di ricerca che dura dal 1999. “Negi ultimi tre anni il W3C ha raccomandato l’adozione di tecnologie successive: la grammatica per il riconoscimento vocale, il linguaggio per la sintesi vocale, seguita dall’interprete semantico per il riconoscimento vocale e dalla specifica per la fonetica che sarà rilasciata entro la fine dell’anno” spiega Paolo Baggia, ricercatore di Intelligenza artificiale e linguaggi naturali, che partecipa al gruppo di lavoro Voice Browser ed è direttore degli standard internazionali a Loquendo, società del gruppo Telecom. Per i servizi « VoxNauta » Loquendo ha già realizzato browser vocali ed altre applicazioni voice, come Avatar che riconoscono domande a voce e rispondono in sintesi vocale. “I servizi vocali sul Web sono un mercato emergente. Con molte applicazioni utili, come prenotare un’esame medico sul sito di una Asl, o chiedere un’informazione turistica, o consultare in modalità vocale le ultime notizie sul sito di un giornale. Significa poter accedere facilmente a queste informazioni anche dal cellulare, quando si è in movimento”. Il passo successivo sarà sui motori di ricerca. Anche Google si sta preparando a introdurre le interrogazioni vocali. “Ma bisognerà vedere come risolveranno la presentazione delle risposte” osserva Baggia. “Dovranno essere più sintetiche e pertinenti. E’ lì che diventa difficile”. Chiara Sottocorona