Nuovo modello AI di Amazon
Amazon ha lanciato Nova Sonic, un modello AI che unifica comprensione e generazione del parlato, migliorando le conversazioni vocali nelle applicazioni. Disponibile in Amazon Bedrock, semplifica lo sviluppo in vari settori.

Amazon ha lanciato Amazon Nova Sonic, un modello fondazionale che unifica la comprensione e la generazione del parlato in un'unica soluzione. Questo modello è progettato per migliorare le conversazioni vocali nelle applicazioni AI, rendendole più simili a quelle umane. È disponibile tramite una nuova API in Amazon Bedrock, semplificando lo sviluppo di applicazioni vocali in vari settori, come il servizio clienti, l'istruzione e l'intrattenimento.
Tradizionalmente, le applicazioni vocali richiedono l'uso di più modelli, come il riconoscimento vocale per convertire il parlato in testo, modelli di linguaggio per generare risposte e sintesi vocale per restituire audio. Questo approccio frammentato aumenta la complessità dello sviluppo e non riesce a mantenere il contesto acustico necessario per conversazioni naturali. Nova Sonic affronta queste sfide unificando le capacità di comprensione e generazione in un solo modello, adattando le risposte vocali al contesto acustico e all'input parlato.
Un esempio pratico è un agente virtuale per i viaggi che interagisce con un cliente riguardo a un viaggio alle Hawaii. Quando il tono del cliente cambia da entusiasta a preoccupato per i costi, il tono dell'AI diventa più rassicurante, fornendo informazioni sui prezzi. Inoltre, Nova Sonic genera una trascrizione del parlato dell'utente, permettendo agli sviluppatori di utilizzare quel testo per chiamare strumenti e API specifici per costruire agenti vocali AI. Queste capacità rendono le applicazioni vocali più naturali e utili.
In un altro esempio, un assistente AI per le aziende mostra come i clienti possano beneficiare della capacità di Nova Sonic di basare le risposte sui dati aziendali. L'assistente estrae report e condivide dati accurati in un tono conversazionale naturale, ponendo domande di follow-up pertinenti. Questo dialogo fluido consente scambi multi-turno senza richiedere un contesto esplicito da parte dell'oratore. Con oltre 135 corsi di formazione AWS disponibili, Amazon continua a innovare con modelli fondazionali all'avanguardia che offrono valore reale a tutti i clienti Amazon.