Come Nuance sta aprendo un varco verso una Siri più intelligiente

07.02.2019

La soluzione Project Pathfinder, recentemente annunciata da Nuance, ci dà un'idea del futuro più intelligente di Siri.

Cos'è Project Pathfinder?

Rendere più intelligenti Siri e altri assistenti vocali significa che le macchine devono migliorare molto nell'analisi e nella comprensione delle conversazioni nel mondo reale e nello sviluppo di modelli di IA in grado di gestirne il contesto e la complessità.

Nuance ha un grande impatto nelle interfacce utente basate su conversazioni. È stata la prima azienda a cui Apple si è rivolta nei primi tempi di Siri, e suppongo che ci siano un sacco di ex ingegneri di Nuance che stanno facendo a pezzi l'assistente vocale di Apple all'interno delle miniere di innovazione R & S protette da password all'interno di Cupertino.

[Approfondimenti: i progressi di intelligenza artificiale e discorso portano gli assistenti virtuali a lavorare ]

Gran parte delle attività attuali di Nuance è incentrata sullo sviluppo di chatbot per i clienti aziendali.

Ecco dove Nuance Pathfinder entra in gioco.

"Project Pathfinder dimostra come l'apprendimento automatico e l'intelligenza artificiale possano automatizzare la creazione di modelli di dialogo imparando dai registri di conversazioni umane", ha spiegato Nuance.

Pathfinder può estrarre enormi raccolte di trascrizioni conversazionali tra agenti e clienti e creare automaticamente modelli di dialogo che possono essere utilizzati per informare le conversazioni bidirezionali tra assistenti virtuali e utenti. Ciò dovrebbe aiutare i progettisti di conversazioni a sviluppare chatbot più intelligenti. Inoltre, rende molto più facile individuare anomalie nel flusso della conversazione, suggerendo problemi nello script che i tuoi chatbots già utilizzano.

[ Segui questo corso per la gestione dei dispositivi mobili da PluralSight e scopri come proteggere i dispositivi nella tua azienda senza compromettere l'esperienza utente. ]

Costruire la conversazione

Quando parli con qualsiasi tipo di assistente vocale, stai davvero interagendo con i modelli di riferimento, che cercano di trovare una soluzione all'intento della tua domanda.

Per ottenere la risposta giusta, gli assistenti si affidano a designer di conversazioni. Questi sono veri e propri umani che di solito hanno bisogno di costruire un flusso di conversazione sulla base di ciò che apprendono dagli esperti in materia e di alcuni tentativi ed errori sul comportamento. Pathfinder consente loro di integrare la loro attuale base di conoscenze con approfondimenti raccolti da vere e proprie interazioni conversazionali che avvengono all'interno dei call center.

Ho parlato con Paul Tepper, capo del Technology Advancement Group AI Lab per Nuance Communications .

Ha spiegato che il software non impara semplicemente ciò che le persone stanno discutendo, ma capisce anche come gli agenti umani guidano gli utenti attraverso le transazioni.

Queste informazioni consentono quindi di aggiungere più intelligenza agli assistenti vocali / ai chatbot.

C'è una ragione per cui Nuance si concentra sui chatbots piuttosto che affrontare le esigenze più ampie degli assistenti vocali come Siri: focus.

Analisi della conversazione in autoapprendimento

Siri e altri assistenti vocali hanno limitazioni.

In parte, questo è dovuto al fatto che sono costruiti per il mercato di massa, il che significa che devono gestire richieste molto più diverse rispetto ai chatbos incentrati sull'attività commerciale.

Questo crea una mancanza di concentrazione. È molto, molto più difficile progettare intelligenza artificiale in grado di rispondere agli input vocali su tutti gli argomenti del mondo e quindi offrire una risposta ragionevole a qualsiasi tipo di domanda di follow-up. È molto più facile sviluppare strumenti di intelligenza artificiale che rispondono a esigenze specifiche.

Ecco perché la vera innovazione si trova attualmente nelle soluzioni aziendali. Perché queste soluzioni sono costruite per gestire una gamma molto più ristretta di potenziali richieste. Tale mancanza di ampiezza è un vantaggio, poiché rende gli algoritmi che guidano queste cose un po 'più facilmente da costruire in quanto le conversazioni sono leggermente più prevedibili.

Il chatbot della tua società di servizi è incentrato sul tipo di domande che potresti chiedere a questa utility. Le conversazioni umane - il tipo di cose che potremmo chiedere a Siri - sono meno mirate e meno prevedibili.

La vedo in questo modo:

Puoi urlare "Hey, Siri" sul tuo HomePod per cambiare traccia o accendere le luci, e sa di aspettarsi queste cose. Ma se vuoi chiederti un paio di domande sulla disponibilità di magazzino nel tuo centro commerciale locale o entrare in una conversazione approfondita su cosa cercare quando ordini il legno con cui costruire mobili esterni, Siri diventa un po 'fuori dalla sua profondità.

E mentre altri assistenti vocali possono (o non possono) offrire risposte migliori a semplici domande, non sono ancora in grado di mantenere una chat con più dichiarazioni. Non puoi chiedere a Siri una domanda e poi chiederne molte altre sulla base della sua risposta a questa domanda.

Quindi, come si costruisce l'intelligenza artificiale più capace di gestire il tipo di richieste complesse che caratterizzano le interazioni uomo / macchina nel mondo reale?

 E' inizia al call center

I chatbots del call center sono progettati per gestire le richieste di routine in modo che gli umani che lavorano in quei luoghi possano sudare compiti complessi. Naturalmente, poiché questi sistemi funzionano in un ristretto ambito di argomenti, possono gestire conversazioni leggermente più complesse.

In uso, Pathfinder è abbastanza intelligente da capire cosa vogliono le persone (intenti), selezionare una varietà di chat relative all'intento all'interno del proprio database, per capire quali conversazioni in quella raccolta di dati hanno quell'intento e quindi prendere componenti di quelle chat e metterle insieme in un'interfaccia simile a un albero del flusso.

Fare clic in qualsiasi punto dell'albero per vedere la trascrizione conversazionale correlata.

Il risultato finale? Un albero di flusso basato su più conversazioni correlate all'argomento che possono essere utilizzate per informare lo sviluppo delle interfacce di parole pronunciate.

L'iniziativa Pathfinder di Nuance renderà queste macchine capaci di gestire conversazioni più complesse. Infine. Mentre ci vorrà un po 'per essere davvero realizzato (non sarà disponibile fino all'estate 2019), mostra come l'analisi conversazionale, l'analisi dei dati e l'intelligenza artificiale possano potenziare le interfacce vocali di nuova generazione, oltre a supportare molto più sofisticati umani / computer interazioni.

Come sarà la tecnologia Nuance ad aiutare Siri?

Se Pathfinder può essere utilizzato per accelerare lo sviluppo di interfacce vocali per intenti verticali più stretti - come la navigazione, le informazioni meteorologiche o la conversazione con call center - allora dovrebbe anche accelerare lo sviluppo di modelli di conversazione più complessi.

"La promessa di questi sistemi è abbastanza grande", mi ha detto Tepper."Penso che possiamo capire come passare da domini di conversazione più stretti e verticali a conversazioni più sofisticate."

Questi sono i tipi di chat che dovrebbero veramente sbloccare il potere dell'IA piuttosto che solo chiedere a Siri o Alexa di spegnere le luci.

Stiamo parlando dell'evoluzione inevitabile delle conversazioni a due vie legittime con i robot e gli assistenti vocali che potrebbero sbloccare ulteriormente la potenza dell'IA.

E riguardo la privacy?

C'è una nota malata a questo. Se ogni interazione colloquiale che hai con un chatbot o un assistente vocale viene registrata, diventa ricercabile e può essere analizzata per scopi, cosa è successo alla tua privacy?

So che la maggior parte di noi è pronta a consentire alle aziende che gestiscono un compito specifico: la propria banca o società di servizi pubblici, ad esempio, di registrare una chiamata effettuata.

Molti di noi non sono ancora consapevoli del fatto che alcune tecnologie di assistente vocale del mercato di massa registrano e mantengono le nostre conversazioni in modi che possono essere ricondotti a noi.

Apple no. Allo stesso tempo, mantiene le registrazioni offuscate che non possono essere collegate alla tua identità o al tuo account per un tempo molto breve, quindi ha questi dati.

Gli Apple [ingegneri] erano "pionieri in termini di cose simili a nascondere i dati in modo che potessero aggregarsi su più utenti senza che fosse effettivamente rintracciabile per i singoli utenti", mi dice Tepper.

Questa è una sfida per il design della conversazione.

"Se sapessimo lavorare con Apple, ad esempio, e lasciare che utilizzassero Pathfinder per accelerare la loro teoria, lo sviluppo della conversazione lì, sai, dovrebbero essere in grado di prendere in considerazione la privacy dei loro utenti e caricarlo in il sistema, "osservò Tepper.

Il fatto è che, una volta che una conversazione è stata offuscata, è possibile per un'azienda analizzare il contenuto della chat per sviluppare macchine più efficaci.

Macchine che capiscono il contesto

Ora, ho zero indizi se Apple intende utilizzare Pathfinder, ma il fatto che esista la soluzione Nuance significa che ora è possibile per l'IA tradurre, analizzare e trarre conclusioni sul retro dell'interazione conversazionale nella vita reale.

Inoltre ora sta diventando sempre più possibile per le smart machine capire l'intento di una conversazione.

Sembra ragionevole pensare che una volta che l'intelligenza artificiale possa capire quante più informazioni, dovrebbe anche essere in grado di usare la sua conoscenza dell'intento di conversazione di una persona per capire in quale dominio argomento dovrebbe apparire al fine di raggiungere una risposta appropriata.

Questa è la grande sfida degli assistenti vocali del mercato di massa oggi: comprendono la query in termini molto semplici, ma (al di là degli stack di dati a cui viene dato l'accesso) non sanno ancora dove cercare.

Ciò che va bene per il business oggi sarà inevitabilmente utile ai consumatori domani. Si tratta di creare macchine che hanno una profonda comprensione del nostro intento e della capacità di rispondere in modo intelligente in termini di conversazione.

Nuance ha reso disponibile Project Pathfinder a un piccolo numero di clienti strategici e prevede di rendere la soluzione più ampiamente disponibile entro l'estate 2019.

2019 Mole G.P. Technologies, Corso Venezia 29, 10147 Torino
Creato con Webnode
Crea il tuo sito web gratis! Questo sito è stato creato con Webnode. Crea il tuo sito gratuito oggi stesso! Inizia