Com tecnologia deChatGPTClaudeGoogle Gemini
Funciona comGoogle DriveDropboxOneDrive
Disponível emWebExtensionEm breveDesktopEm breveWindowsEm breveAndroidEm breveiOSEm breveMacEm breve
Funciona emChromeFirefoxSafariEdge
API de fala em texto

Uma API de fala em texto para desenvolvedores

Integre transcrição ao seu produto com uma API REST limpa, chaves rtvk_, webhooks e JSON previsível com marcações de tempo por palavra, identificação de locutores e mais de 100 idiomas.

Experimente agora, sem cadastro

Grave ao vivo ou solte um arquivo (até 30 MB) e veja a transcrição acontecer.

Toque para começar a gravar pelo seu microfone

O RealtimeVoiceKIT oferece fala em texto como uma API HTTP simples. Autentique com uma chave rtvk_, envie áudio ou vídeo por upload ou URL, e receba JSON previsível com a transcrição, marcações de tempo por palavra, índices de confiança e identificação de locutores. Os trabalhos são assíncronos: envie e chamamos seu webhook no momento em que um resultado estiver pronto, sem polling. A mesma API alimenta legendas, tradução e resumos com IA, para que você possa construir um pipeline completo em uma única integração.

O que os desenvolvedores constroem

Transcrição no produto

Adicione transcrição ao seu app sem executar modelos de fala você mesmo.

Pipelines automatizados

Conecte a transcrição à ingestão e ao processamento com webhooks.

Legendagem em escala

Gere SRT e VTT para grandes bibliotecas de mídia programaticamente.

Análise de voz

Alimente marcações de tempo, locutores e resumos na sua própria análise.

O que está incluído

API REST com chaves rtvk_Webhooks (sem polling)Marcações de tempo por palavraIdentificação de locutoresLegendas, tradução e resumosMais de 100 idiomas

Como funciona

Drop audio · video · URLinterview.mp3
01

Crie uma chave

Gere uma chave de API rtvk_ no seu painel.

Speaker 1
02

Envie o áudio

Faça um POST de um arquivo ou URL; nós o transcrevemos de forma assíncrona.

ENES · FR · DE
TXTSRTVTT
03

Receba os resultados

Chamamos seu webhook com JSON previsível, texto, marcações de tempo, locutores e mais.

Perguntas frequentes

Como a API de fala em texto é autenticada?

Com chaves de API rtvk_ do tipo bearer que você cria no seu painel. As mesmas chaves também funcionam com nosso servidor MCP.

Ela usa webhooks ou polling?

Webhooks. Envie um trabalho e o RealtimeVoiceKIT chama seu endpoint quando ele termina, então você não precisa fazer polling.

O que uma resposta contém?

JSON previsível com o texto da transcrição, marcações de tempo por palavra, índices de confiança e identificação de locutores, além de saída de legendas, tradução e resumo.

Existe um plano gratuito?

Sim. 10 minutos por mês, grátis, para que você possa construir e testar antes de escalar. O acesso à API está incluído nos planos Premium e Business.

Construa com a API de fala em texto

Crie uma chave rtvk_ e adicione transcrição ao seu produto, comece grátis com 10 minutos por mês.