Con la tecnología deChatGPTClaudeGoogle Gemini
Compatible conGoogle DriveDropboxOneDrive
Disponible enWebExtensionProntoDesktopProntoWindowsProntoAndroidProntoiOSProntoMacPronto
Funciona enChromeFirefoxSafariEdge
API de voz a texto

Una API de voz a texto para desarrolladores

Integra la transcripción en tu producto con una API REST limpia, claves rtvk_, webhooks y un JSON predecible con marcas de tiempo a nivel de palabra, etiquetas de hablante y más de 100 idiomas.

Pruébalo ahora, sin registro

Graba en vivo o suelta un archivo (hasta 30 MB) y míralo transcribirse.

Toca para empezar a grabar desde tu micrófono

RealtimeVoiceKIT te ofrece voz a texto como una sencilla API HTTP. Autentícate con una clave rtvk_, envía audio o vídeo mediante subida o URL, y recibe un JSON predecible con la transcripción, marcas de tiempo a nivel de palabra, puntuaciones de confianza y etiquetas de hablante. Los trabajos son asíncronos: envía y llamamos a tu webhook en el momento en que un resultado está listo, sin sondeo. La misma API impulsa subtítulos, traducción y resúmenes con IA, así que puedes crear un pipeline completo con una sola integración.

Qué crean los desarrolladores

Transcripción en el producto

Añade transcripción a tu app sin ejecutar tú mismo modelos de voz.

Pipelines automatizados

Conecta la transcripción a la ingesta y el procesamiento con webhooks.

Subtitulado a escala

Genera SRT y VTT para grandes bibliotecas de medios de forma programática.

Analítica de voz

Alimenta marcas de tiempo, hablantes y resúmenes a tu propio análisis.

Qué incluye

API REST con claves rtvk_Webhooks (sin sondeo)Marcas de tiempo a nivel de palabraEtiquetas de hablanteSubtítulos, traducción y resúmenesMás de 100 idiomas

Cómo funciona

Drop audio · video · URLinterview.mp3
01

Crea una clave

Genera una clave de API rtvk_ desde tu panel.

Speaker 1
02

Envía audio

Haz un POST de un archivo o URL; lo transcribimos de forma asíncrona.

ENES · FR · DE
TXTSRTVTT
03

Recibe los resultados

Llamamos a tu webhook con un JSON predecible, texto, marcas de tiempo, hablantes y más.

Preguntas frecuentes

¿Cómo se autentica la API de voz a texto?

Con claves de API rtvk_ de tipo bearer que creas en tu panel. Las mismas claves también funcionan con nuestro servidor MCP.

¿Usa webhooks o sondeo?

Webhooks. Envía un trabajo y RealtimeVoiceKIT llama a tu endpoint cuando termina, así que no tienes que sondear.

¿Qué contiene una respuesta?

Un JSON predecible con el texto de la transcripción, marcas de tiempo a nivel de palabra, puntuaciones de confianza y etiquetas de hablante, además de la salida de subtítulos, traducción y resumen.

¿Hay un plan gratuito?

Sí: 10 minutos cada mes, gratis, para que puedas crear y probar antes de escalar. El acceso a la API se incluye en los planes Premium y Business.

Crea con la API de voz a texto

Crea una clave rtvk_ y añade transcripción a tu producto: empieza gratis con 10 minutos al mes.