Jetzt ausprobieren, ohne Registrierung
Nehmen Sie live auf oder ziehen Sie eine Datei hinein (bis zu 30 MB) und sehen Sie zu, wie sie transkribiert wird.
Tippen Sie, um die Aufnahme über Ihr Mikrofon zu starten
RealtimeVoiceKIT bietet Ihnen Sprache-zu-Text als einfache HTTP-API. Authentifizieren Sie sich mit einem rtvk_-Schlüssel, senden Sie Audio oder Video per Upload oder URL und erhalten Sie vorhersagbares JSON mit dem Transkript, Zeitstempeln auf Wortebene, Konfidenzwerten und Sprecherkennzeichnung. Aufträge sind asynchron: Senden Sie sie, und wir rufen Ihren Webhook in dem Moment auf, in dem ein Ergebnis bereit ist, kein Polling. Dieselbe API speist Untertitel, Übersetzung und KI-Zusammenfassungen, sodass Sie eine komplette Pipeline auf einer einzigen Integration aufbauen können.
Was Entwickler bauen
Transkription im Produkt
Fügen Sie Ihrer App Transkription hinzu, ohne selbst Sprachmodelle zu betreiben.
Automatisierte Pipelines
Verdrahten Sie Transkription mit Ingestion und Verarbeitung über Webhooks.
Untertitelung im großen Maßstab
Generieren Sie SRT und VTT für große Medienbibliotheken programmatisch.
Sprachanalyse
Speisen Sie Zeitstempel, Sprecher und Zusammenfassungen in Ihre eigene Analyse ein.
Was enthalten ist
So funktioniert es
Schlüssel erstellen
Erstellen Sie einen rtvk_-API-Schlüssel über Ihr Dashboard.
Audio senden
Senden Sie per POST eine Datei oder URL; wir transkribieren sie asynchron.
Ergebnisse erhalten
Wir rufen Ihren Webhook mit vorhersagbarem JSON auf, Text, Zeitstempel, Sprecher und mehr.
Häufig gestellte Fragen
Wie wird die Speech-to-Text-API authentifiziert?
Mit rtvk_-API-Schlüsseln als Bearer-Token, die Sie in Ihrem Dashboard erstellen. Dieselben Schlüssel funktionieren auch mit unserem MCP-Server.
Verwendet sie Webhooks oder Polling?
Webhooks. Senden Sie einen Auftrag, und RealtimeVoiceKIT ruft Ihren Endpunkt auf, wenn er abgeschlossen ist, sodass Sie nicht pollen müssen.
Was enthält eine Antwort?
Vorhersagbares JSON mit dem Transkripttext, Zeitstempeln auf Wortebene, Konfidenzwerten und Sprecherkennzeichnung sowie Untertitel-, Übersetzungs- und Zusammenfassungsausgabe.
Gibt es einen kostenlosen Tarif?
Ja. 10 Minuten pro Monat, kostenlos, sodass Sie vor dem Skalieren entwickeln und testen können. API-Zugriff ist in den Tarifen Premium und Business enthalten.