API de reconnaissance vocale

Une API de reconnaissance vocale pour développeurs

Intégrez la transcription à votre produit avec une API REST claire, clés rtvk_, webhooks et JSON prévisible avec horodatages au niveau du mot, identification des intervenants et plus de 100 langues.

Essayez-le maintenant, sans inscription

Importez un fichier, enregistrez en direct, collez un lien ou importez depuis votre cloud, puis regardez la transcription.

Déposez un audio ou une vidéo ici, ou cliquez pour parcourirMP3, WAV, M4A, MP4 et plus

RealtimeVoiceKIT vous offre la reconnaissance vocale sous la forme d'une simple API HTTP. Authentifiez-vous avec une clé rtvk_, soumettez de l'audio ou de la vidéo par import ou URL, et recevez un JSON prévisible avec la transcription, les horodatages au niveau du mot, les scores de confiance et l'identification des intervenants. Les travaux sont asynchrones : soumettez et nous appelons votre webhook dès qu'un résultat est prêt, sans interrogation continue. La même API alimente sous-titres, traduction et résumés IA, pour bâtir un pipeline complet avec une seule intégration.

Ce que les développeurs construisent

Transcription intégrée au produit

Ajoutez la transcription à votre application sans exécuter vous-même de modèles de parole.

Pipelines automatisés

Branchez la transcription sur l'ingestion et le traitement à l'aide de webhooks.

Sous-titrage à grande échelle

Générez du SRT et du VTT pour de vastes bibliothèques média par programmation.

Analyse vocale

Alimentez votre propre analyse avec horodatages, intervenants et résumés.

Ce qui est inclus

API REST avec clés rtvk_Webhooks (sans interrogation continue)Horodatages au niveau du motIdentification des intervenantsSous-titres, traduction et résumésPlus de 100 langues

Comment ça marche

↑MP3 · MP4 · URLinterview.mp3

Créer une clé

Générez une clé API rtvk_ depuis votre tableau de bord.

Soumettre l'audio

Envoyez un fichier ou une URL en POST ; nous le transcrivons de façon asynchrone.

EN→ES · FR · DE

TXTSRTVTT

Recevoir les résultats

Nous appelons votre webhook avec un JSON prévisible, texte, horodatages, intervenants et plus.

Questions fréquentes

Comment l'API de reconnaissance vocale est-elle authentifiée ?

Avec des clés API rtvk_ de type bearer que vous créez dans votre tableau de bord. Les mêmes clés fonctionnent aussi avec notre serveur MCP.

Utilise-t-elle des webhooks ou l'interrogation continue ?

Des webhooks. Soumettez un travail et RealtimeVoiceKIT appelle votre point de terminaison lorsqu'il se termine, vous n'avez donc pas à interroger en continu.

Que contient une réponse ?

Un JSON prévisible avec le texte de la transcription, les horodatages au niveau du mot, les scores de confiance et l'identification des intervenants, ainsi que la sortie en sous-titres, traduction et résumé.

Existe-t-il une offre gratuite ?

Oui. Chaque compte bénéficie de 10 minutes d'API gratuites pour construire et tester avant de passer à l'échelle, puis c'est facturé à la minute à 0,005 $ par minute, sans abonnement requis.

Outils associés

API de transcription pour développeurs Un logiciel de transcription IA qui retranscrit les mots avec justesse Traduction audio et vidéo par IA

Construisez avec l'API de reconnaissance vocale

Créez une clé rtvk_ et ajoutez la transcription à votre produit, commencez gratuitement avec 10 minutes par mois.