Sfruttare GPT-4o realtime su Azure Open AI per conversazioni vocali

Cristian Civera, in API Management, il 5 novembre 2024 alle 08:00

AzureOpenAI

Abbiamo recentemente introdotto una nuova funzionalità vocale avanzata che sfrutta la tecnologia GPT-4o Realtime per gestire interazioni audio in tempo reale. La nostra API, basata sul modello GPT-4o, consente di realizzare applicazioni vocali a bassa latenza ideali per assistenti virtuali, sistemi di traduzione in tempo reale e supporto clienti, offrendo esperienze fluide e naturali in cui il nostro modello risponde istantaneamente agli input vocali dell'utente.

Anche noi di Azure OpenAI ci siamo dotati di questa tecnologia e offriamo le medesime API da incorporare nelle nostre soluzioni. Per provare questa tecnologia velocemente, dobbiamo prima di tutto accedere al nostro progetto tramite l'indirizzo https://ai.azure.com. Accediamo alla sezione Model catalog dal menu a sinistra e selezioniamo il modello gpt-4o-realtime-preview dalla collezione di modelli Azure OpenAI. Successivamente, cliccando su Deploy, possiamo configurare le impostazioni di deployment, specificare un nome per la distribuzione e scegliere la risorsa Azure OpenAI appropriata.

Una volta terminato il deploy, possiamo interagire con il modello direttamente nel Real-time audio playground: basta selezionare il modello appena distribuito, attivare l'accesso al microfono e iniziare la conversazione in tempo reale.

Nel playground possiamo impostare il prompt iniziale e configurare vari parametri, come il livello di soglia (threshold) per l'attivazione della risposta, la temperatura che regola la creatività delle risposte, e la gestione del silenzio per ottimizzare l'interazione vocale.

Attualmente, il nostro modello gpt-4o-realtime-preview è disponibile nelle regioni East US 2 e Sweden Central di Azure.

Commenti

Visualizza/aggiungi commenti

| Condividi su: Twitter, Facebook, LinkedIn

Per inserire un commento, devi avere un account.

Fai il login e torna a questa pagina, oppure registrati alla nostra community.

Sfruttare GPT-4o realtime su Azure Open AI per conversazioni vocali

Commenti

Approfondimenti

Escludere alcuni file da GitHub Secret Scanning

Utilizzare Azure Cosmos DB con i vettori

Fornire parametri ad un Web component HTML

Bloccare l'esecuzione di un pod in mancanza di un'artifact attestation di GitHub

Esporre i propri servizi applicativi con Semantic Kernel e ASP.NET Web API

Change tracking e composition in Entity Framework

Eseguire query in contemporanea con EF

Utilizzare QuickGrid di Blazor con Entity Framework

Migliorare l'organizzazione delle risorse con Azure Policy

Sfruttare gli embedding e la ricerca vettoriale con Azure SQL Database

Usare i servizi di Azure OpenAI e ChatGPT in ASP.NET Core con Semantic Kernel

Recuperare automaticamente un utente e aggiungerlo ad un gruppo di Azure DevOps

I più letti di oggi

Script via e-mail

In primo piano

.NET Conference Italia 2024 - Milano

.NET Conference Italia 2023 - Milano e Online

Le novità di .NET 7 e C# 11

Le novità in ASP.NET Core e Blazor con .NET 7

In evidenza

Misc

Utilizziamo i cookie per analisi, contenuti personalizzati e pubblicità.