Webvocal
Finora abbiamo navigato a vista. D’ora in poi potremo navigare
anche a voce. Usando la parola al posto della tastiera. E’ l’ultimo
sviluppo delle tecnologie di Internet. Il 19 giugno Il W3C ( World Wide
Web Consortium) l’organismo internazionale fondato da Tim Berners-Lee
che si occupa di uniformare l’adozione di nuove tecnologie per la
rete, ha annuciato due nuovi standard per creare “interfacce voice”
e “browser vocali”. Sono il linguaggio VoiceXml 2.1 (la prima
versione è già usata nella telefonia cellulare) e l’interprete
di riconoscimento vocale Sisr1.0. “Stiamo completando la piattaforma
di interfaccia vocale, che andrà a integrarsi con altre due iniziative
in via di standardizzazione, il Mobile Web e il Semantic Web” precisa
Daniel Dardailler direttore delle relazioni internazionali e coordinatore
europeo del W3C. “E’ un’archittetura software composta
da diversi mattoni, che favorisce la convergenza. Per esempio, un fornitore
di servizi di call center ora può scrivere la sua applicazione
una sola volta ed ha la possibilità di offrirla allo stesso modo
sulla telefonia fissa, su quella mobile o sul Web”.
A cosa serve il VoiceXml? “Molta gente ha già familiarità
con i servizi telefonici automatici: sono utilizzati per ottenere informazioni
come gli orari dei voli, i film in programmazione, per consultare la bolletta
elettrica, o il conto bancario. La crescita esplosiva del Web ha spinto
i fornitori dei servizi telefonici ad estendere la propria offerta sulla
rete” spiegano a Voxeo Corporation, uno dei leader mondiali nei
servizi vocali. “Il VoiceXml è il linguaggio standard che
ci consente di realizzare i migliori servizi per i due mondi: la telefonia
e Internet. I provider di servizi vocali telefonici possono ora offrirli
ai clienti con la stessa interfaccia vocale su un sito Web. Significa
ridurre i costi ed estendere l’uso”. A costruire il VoiceXml
2.1 hanno contribuito i maggiori protagonisti del mercato dei servizi
vocali, come Tellme Networks (da poco acquistato da Microsoft), Voxeo,
Nuance Communications, Voxpilot, Comverse, oltre a Hewlett-Packard e all’italiana
Loquendo. Un altro gruppo di lavoro al W3C è quello del Voice Browser.
“Come un browser tradizionale usa le combinazioni tra il linguaggio
Html e la tastiera, o il mouse, per permettere all’utente di interrogare
il Web, allo stesso modo con il VoiceXml diventa possibile interagire
a voce, dal microfono del computer, da un telefono Voip o da un cellulare”
precisa Dardailler. Per creare i software che gestiscono gli input e gli
output vocali e renderli standard c’è stato un lungo lavoro
di ricerca che dura dal 1999. “Negi ultimi tre anni il W3C ha raccomandato
l’adozione di tecnologie successive: la grammatica per il riconoscimento
vocale, il linguaggio per la sintesi vocale, seguita dall’interprete
semantico per il riconoscimento vocale e dalla specifica per la fonetica
che sarà rilasciata entro la fine dell’anno” spiega
Paolo Baggia, ricercatore di Intelligenza artificiale e linguaggi naturali,
che partecipa al gruppo di lavoro Voice Browser ed è direttore
degli standard internazionali a Loquendo, società del gruppo Telecom.
Per i servizi « VoxNauta » Loquendo ha già
realizzato browser vocali ed altre applicazioni voice, come Avatar che
riconoscono domande a voce e rispondono in sintesi vocale. “I servizi
vocali sul Web sono un mercato emergente. Con molte applicazioni utili,
come prenotare un’esame medico sul sito di una Asl, o chiedere un’informazione
turistica, o consultare in modalità vocale le ultime notizie sul
sito di un giornale. Significa poter accedere facilmente a queste informazioni
anche dal cellulare, quando si è in movimento”. Il passo
successivo sarà sui motori di ricerca. Anche Google si sta preparando
a introdurre le interrogazioni vocali. “Ma bisognerà vedere
come risolveranno la presentazione delle risposte” osserva Baggia.
“Dovranno essere più sintetiche e pertinenti. E’ lì
che diventa difficile”. Chiara Sottocorona |