Abbiamo recentemente introdotto una nuova funzionalità vocale avanzata che sfrutta la tecnologia GPT-4o Realtime per gestire interazioni audio in tempo reale. La nostra API, basata sul modello GPT-4o, consente di realizzare applicazioni vocali a bassa latenza ideali per assistenti virtuali, sistemi di traduzione in tempo reale e supporto clienti, offrendo esperienze fluide e naturali in cui il nostro modello risponde istantaneamente agli input vocali dell'utente.
Anche noi di Azure OpenAI ci siamo dotati di questa tecnologia e offriamo le medesime API da incorporare nelle nostre soluzioni. Per provare questa tecnologia velocemente, dobbiamo prima di tutto accedere al nostro progetto tramite l'indirizzo https://ai.azure.com. Accediamo alla sezione Model catalog dal menu a sinistra e selezioniamo il modello gpt-4o-realtime-preview dalla collezione di modelli Azure OpenAI. Successivamente, cliccando su Deploy, possiamo configurare le impostazioni di deployment, specificare un nome per la distribuzione e scegliere la risorsa Azure OpenAI appropriata.

Una volta terminato il deploy, possiamo interagire con il modello direttamente nel Real-time audio playground: basta selezionare il modello appena distribuito, attivare l'accesso al microfono e iniziare la conversazione in tempo reale.

Nel playground possiamo impostare il prompt iniziale e configurare vari parametri, come il livello di soglia (threshold) per l'attivazione della risposta, la temperatura che regola la creatività delle risposte, e la gestione del silenzio per ottimizzare l'interazione vocale.
Attualmente, il nostro modello gpt-4o-realtime-preview è disponibile nelle regioni East US 2 e Sweden Central di Azure.
Commenti
Per inserire un commento, devi avere un account.
Fai il login e torna a questa pagina, oppure registrati alla nostra community.
Approfondimenti
Utilizzare Azure Cosmos DB con i vettori
Generare la software bill of material (SBOM) in GitHub
Filtrare i dati di una QuickGrid in Blazor con una drop down list
Popolare una classe a partire dal testo, con Semantic Kernel e ASP.NET Core Web API
Recuperare l'ultima versione di una release di GitHub
Aggiornare a .NET 9 su Azure App Service
Bloccare l'esecuzione di un pod in mancanza di un'artifact attestation di GitHub
Migliorare l'organizzazione delle risorse con Azure Policy
Configurare il nome della run di un workflow di GitHub in base al contesto di esecuzione
Sfruttare gli embedding e la ricerca vettoriale con Azure SQL Database
Gestione dei nomi con le regole @layer in CSS
Potenziare la ricerca su Cosmos DB con Full Text Search