Abbiamo recentemente introdotto una nuova funzionalità vocale avanzata che sfrutta la tecnologia GPT-4o Realtime per gestire interazioni audio in tempo reale. La nostra API, basata sul modello GPT-4o, consente di realizzare applicazioni vocali a bassa latenza ideali per assistenti virtuali, sistemi di traduzione in tempo reale e supporto clienti, offrendo esperienze fluide e naturali in cui il nostro modello risponde istantaneamente agli input vocali dell'utente.
Anche noi di Azure OpenAI ci siamo dotati di questa tecnologia e offriamo le medesime API da incorporare nelle nostre soluzioni. Per provare questa tecnologia velocemente, dobbiamo prima di tutto accedere al nostro progetto tramite l'indirizzo https://ai.azure.com. Accediamo alla sezione Model catalog dal menu a sinistra e selezioniamo il modello gpt-4o-realtime-preview dalla collezione di modelli Azure OpenAI. Successivamente, cliccando su Deploy, possiamo configurare le impostazioni di deployment, specificare un nome per la distribuzione e scegliere la risorsa Azure OpenAI appropriata.

Una volta terminato il deploy, possiamo interagire con il modello direttamente nel Real-time audio playground: basta selezionare il modello appena distribuito, attivare l'accesso al microfono e iniziare la conversazione in tempo reale.

Nel playground possiamo impostare il prompt iniziale e configurare vari parametri, come il livello di soglia (threshold) per l'attivazione della risposta, la temperatura che regola la creatività delle risposte, e la gestione del silenzio per ottimizzare l'interazione vocale.
Attualmente, il nostro modello gpt-4o-realtime-preview è disponibile nelle regioni East US 2 e Sweden Central di Azure.
Commenti
Per inserire un commento, devi avere un account.
Fai il login e torna a questa pagina, oppure registrati alla nostra community.
Approfondimenti
Escludere alcuni file da GitHub Secret Scanning
Utilizzare Azure Cosmos DB con i vettori
Fornire parametri ad un Web component HTML
Bloccare l'esecuzione di un pod in mancanza di un'artifact attestation di GitHub
Esporre i propri servizi applicativi con Semantic Kernel e ASP.NET Web API
Change tracking e composition in Entity Framework
Eseguire query in contemporanea con EF
Utilizzare QuickGrid di Blazor con Entity Framework
Migliorare l'organizzazione delle risorse con Azure Policy
Sfruttare gli embedding e la ricerca vettoriale con Azure SQL Database
Usare i servizi di Azure OpenAI e ChatGPT in ASP.NET Core con Semantic Kernel
Recuperare automaticamente un utente e aggiungerlo ad un gruppo di Azure DevOps