API speech-to-text

Un'API speech-to-text per sviluppatori

Integra la trascrizione nel tuo prodotto con una REST API pulita, chiavi rtvk_, webhook e JSON prevedibile con timestamp a livello di parola, etichette dei parlanti e oltre 100 lingue.

Provalo ora, senza registrazione

Registra dal vivo o trascina un file (fino a {maxMb} MB) e guardalo trascrivere.

Trascina qui audio o video, oppure clicca per sfogliareMP3, WAV, M4A, MP4 e altro

RealtimeVoiceKIT ti offre lo speech-to-text come una semplice API HTTP. Autenticati con una chiave rtvk_, invia audio o video tramite caricamento o URL, e ricevi JSON prevedibile con la trascrizione, i timestamp a livello di parola, i punteggi di affidabilità e le etichette dei parlanti. I job sono asincroni: invia e chiamiamo il tuo webhook nel momento in cui un risultato è pronto, nessun polling. La stessa API alimenta sottotitoli, traduzione e riepiloghi AI, così puoi costruire una pipeline completa con un'unica integrazione.

Cosa costruiscono gli sviluppatori

Trascrizione nel prodotto

Aggiungi la trascrizione alla tua app senza eseguire tu stesso i modelli vocali.

Pipeline automatizzate

Collega la trascrizione all'ingestione e all'elaborazione con i webhook.

Sottotitolazione su larga scala

Genera SRT e VTT per grandi librerie multimediali a livello programmatico.

Analisi vocale

Alimenta timestamp, parlanti e riepiloghi nella tua analisi.

Cosa è incluso

REST API con chiavi rtvk_Webhook (nessun polling)Timestamp a livello di parolaEtichette dei parlantiSottotitoli, traduzione e riepiloghiOltre 100 lingue

Come funziona

↑MP3 · MP4 · URLinterview.mp3

Crea una chiave

Genera una chiave API rtvk_ dalla tua dashboard.

Invia l'audio

Esegui il POST di un file o di un URL; lo trascriviamo in modo asincrono.

EN→ES · FR · DE

TXTSRTVTT

Ricevi i risultati

Chiamiamo il tuo webhook con JSON prevedibile, testo, timestamp, parlanti e altro.

Domande frequenti

Come viene autenticata l'API speech-to-text?

Con chiavi API rtvk_ di tipo bearer che crei nella tua dashboard. Le stesse chiavi funzionano anche con il nostro server MCP.

Usa webhook o polling?

Webhook. Invia un job e RealtimeVoiceKIT chiama il tuo endpoint quando termina, così non devi fare polling.

Cosa contiene una risposta?

JSON prevedibile con il testo della trascrizione, timestamp a livello di parola, punteggi di affidabilità ed etichette dei parlanti, oltre all'output di sottotitoli, traduzione e riepiloghi.

Esiste un piano gratuito?

Sì. Ogni account riceve 10 minuti di API gratis per costruire e testare prima di scalare, poi è a consumo al minuto a $0,005 al minuto, senza alcun piano richiesto.

Strumenti correlati

API di trascrizione per sviluppatori Software di trascrizione AI che trascrive le parole correttamente Traduzione AI di audio e video

Costruisci con l'API speech-to-text

Crea una chiave rtvk_ e aggiungi la trascrizione al tuo prodotto, inizia gratis con 10 minuti al mese.