Propulsé parChatGPTClaudeGoogle Gemini
Compatible avecGoogle DriveDropboxOneDrive
Disponible surWebExtensionBientôtDesktopBientôtWindowsBientôtAndroidBientôtiOSBientôtMacBientôt
Fonctionne dansChromeFirefoxSafariEdge
API de reconnaissance vocale

Une API de reconnaissance vocale pour développeurs

Intégrez la transcription à votre produit avec une API REST claire, clés rtvk_, webhooks et JSON prévisible avec horodatages au niveau du mot, identification des intervenants et plus de 100 langues.

Essayez-le maintenant, sans inscription

Enregistrez en direct ou déposez un fichier (jusqu'à 30 Mo) et regardez-le se transcrire.

Appuyez pour démarrer l'enregistrement depuis votre microphone

RealtimeVoiceKIT vous offre la reconnaissance vocale sous la forme d'une simple API HTTP. Authentifiez-vous avec une clé rtvk_, soumettez de l'audio ou de la vidéo par import ou URL, et recevez un JSON prévisible avec la transcription, les horodatages au niveau du mot, les scores de confiance et l'identification des intervenants. Les travaux sont asynchrones : soumettez et nous appelons votre webhook dès qu'un résultat est prêt, sans interrogation continue. La même API alimente sous-titres, traduction et résumés IA, pour bâtir un pipeline complet avec une seule intégration.

Ce que les développeurs construisent

Transcription intégrée au produit

Ajoutez la transcription à votre application sans exécuter vous-même de modèles de parole.

Pipelines automatisés

Branchez la transcription sur l'ingestion et le traitement à l'aide de webhooks.

Sous-titrage à grande échelle

Générez du SRT et du VTT pour de vastes bibliothèques média par programmation.

Analyse vocale

Alimentez votre propre analyse avec horodatages, intervenants et résumés.

Ce qui est inclus

API REST avec clés rtvk_Webhooks (sans interrogation continue)Horodatages au niveau du motIdentification des intervenantsSous-titres, traduction et résumésPlus de 100 langues

Comment ça marche

Drop audio · video · URLinterview.mp3
01

Créer une clé

Générez une clé API rtvk_ depuis votre tableau de bord.

Speaker 1
02

Soumettre l'audio

Envoyez un fichier ou une URL en POST ; nous le transcrivons de façon asynchrone.

ENES · FR · DE
TXTSRTVTT
03

Recevoir les résultats

Nous appelons votre webhook avec un JSON prévisible, texte, horodatages, intervenants et plus.

Questions fréquentes

Comment l'API de reconnaissance vocale est-elle authentifiée ?

Avec des clés API rtvk_ de type bearer que vous créez dans votre tableau de bord. Les mêmes clés fonctionnent aussi avec notre serveur MCP.

Utilise-t-elle des webhooks ou l'interrogation continue ?

Des webhooks. Soumettez un travail et RealtimeVoiceKIT appelle votre point de terminaison lorsqu'il se termine, vous n'avez donc pas à interroger en continu.

Que contient une réponse ?

Un JSON prévisible avec le texte de la transcription, les horodatages au niveau du mot, les scores de confiance et l'identification des intervenants, ainsi que la sortie en sous-titres, traduction et résumé.

Existe-t-il une offre gratuite ?

Oui. 10 minutes chaque mois, gratuitement, pour construire et tester avant de passer à l'échelle. L'accès à l'API est inclus dans les offres Premium et Business.

Construisez avec l'API de reconnaissance vocale

Créez une clé rtvk_ et ajoutez la transcription à votre produit, commencez gratuitement avec 10 minutes par mois.