Con tecnologiaChatGPTClaudeGoogle Gemini
Funziona conGoogle DriveDropboxOneDrive
Disponibile suWebExtensionPrestoDesktopPrestoWindowsPrestoAndroidPrestoiOSPrestoMacPresto
Funziona inChromeFirefoxSafariEdge
API speech-to-text

Un'API speech-to-text per sviluppatori

Integra la trascrizione nel tuo prodotto con una REST API pulita, chiavi rtvk_, webhook e JSON prevedibile con timestamp a livello di parola, etichette dei parlanti e oltre 100 lingue.

Provalo ora, senza registrazione

Registra dal vivo o trascina un file (fino a 30 MB) e guardalo trascrivere.

Tocca per iniziare a registrare dal microfono

RealtimeVoiceKIT ti offre lo speech-to-text come una semplice API HTTP. Autenticati con una chiave rtvk_, invia audio o video tramite caricamento o URL, e ricevi JSON prevedibile con la trascrizione, i timestamp a livello di parola, i punteggi di affidabilità e le etichette dei parlanti. I job sono asincroni: invia e chiamiamo il tuo webhook nel momento in cui un risultato è pronto, nessun polling. La stessa API alimenta sottotitoli, traduzione e riepiloghi AI, così puoi costruire una pipeline completa con un'unica integrazione.

Cosa costruiscono gli sviluppatori

Trascrizione nel prodotto

Aggiungi la trascrizione alla tua app senza eseguire tu stesso i modelli vocali.

Pipeline automatizzate

Collega la trascrizione all'ingestione e all'elaborazione con i webhook.

Sottotitolazione su larga scala

Genera SRT e VTT per grandi librerie multimediali a livello programmatico.

Analisi vocale

Alimenta timestamp, parlanti e riepiloghi nella tua analisi.

Cosa è incluso

REST API con chiavi rtvk_Webhook (nessun polling)Timestamp a livello di parolaEtichette dei parlantiSottotitoli, traduzione e riepiloghiOltre 100 lingue

Come funziona

Drop audio · video · URLinterview.mp3
01

Crea una chiave

Genera una chiave API rtvk_ dalla tua dashboard.

Speaker 1
02

Invia l'audio

Esegui il POST di un file o di un URL; lo trascriviamo in modo asincrono.

ENES · FR · DE
TXTSRTVTT
03

Ricevi i risultati

Chiamiamo il tuo webhook con JSON prevedibile, testo, timestamp, parlanti e altro.

Domande frequenti

Come viene autenticata l'API speech-to-text?

Con chiavi API rtvk_ di tipo bearer che crei nella tua dashboard. Le stesse chiavi funzionano anche con il nostro server MCP.

Usa webhook o polling?

Webhook. Invia un job e RealtimeVoiceKIT chiama il tuo endpoint quando termina, così non devi fare polling.

Cosa contiene una risposta?

JSON prevedibile con il testo della trascrizione, timestamp a livello di parola, punteggi di affidabilità ed etichette dei parlanti, oltre all'output di sottotitoli, traduzione e riepiloghi.

Esiste un piano gratuito?

Sì. 10 minuti ogni mese, gratis, così puoi costruire e testare prima di scalare. L'accesso all'API è incluso nei piani Premium e Business.

Costruisci con l'API speech-to-text

Crea una chiave rtvk_ e aggiungi la trascrizione al tuo prodotto, inizia gratis con 10 minuti al mese.