Überlegen Sie einmal, wo Sie während eines Arbeitstags tatsächlich Dinge anhören. Das Webinar, für das Sie sich vor Wochen angemeldet haben, läuft in einem Tab. Der Konferenzvortrag, den Sie verpasst haben, läuft in einem Tab. Das Podcast-Interview mit dem lautesten Vordenker Ihrer Branche, das aufgezeichnete All-Hands, die Produktdemo eines Anbieters, die Vorlesung, die Ihr Professor hochgeladen hat: alles Tabs. Der Browser ist still und leise zu dem Ort geworden, an dem gesprochene Information lebt, und trotzdem ist der Weg von dieser Sprache zum Text seltsam mühsam geblieben. Datei herunterladen, Datei wiederfinden, Datei irgendwo hochladen, warten.
Die kommende RealtimeVoiceKIT Browser-Erweiterung verdichtet all das auf einen Klick. Sie erfasst den Ton eines beliebigen Browser-Tabs und transkribiert ihn live, während er abgespielt wird. Öffnen Sie das Webinar, klicken Sie auf das Symbol in der Symbolleiste, wählen Sie den Tab, und sehen Sie den Worten beim Erscheinen zu. Wenn die Sitzung endet, liegt das vollständige Transkript in Ihrer RealtimeVoiceKIT-Bibliothek, bereit zum Durchsuchen, Zusammenfassen, Übersetzen oder Exportieren. Die Erweiterung basiert auf Manifest V3 und funktioniert mit Google Chrome und Microsoft Edge.
Die Mechanik ist absichtlich simpel. Eine Tab-Aufnahme hält exakt das fest, was der Tab abspielt. Es gibt also nichts zu konfigurieren und kein Format, über das Sie nachdenken müssten. Sie brauchen weder die Datei hinter dem Player noch eine Erlaubnis der Website, und Sie müssen das Popup nicht offen halten: Sitzungen laufen im Hintergrund weiter, bis Sie sie über die Symbolleiste beenden. Starten Sie die Aufnahme zu Beginn eines zweistündigen Webinars, beantworten Sie zwischendurch E-Mails und kommen Sie zu einem fertigen Transkript zurück.
Was macht das in der Praxis möglich? Webinar-Teilnehmer müssen sich nicht mehr zwischen Zuhören und Mitschreiben entscheiden: Das Transkript fängt alles ein, und die KI-Zusammenfassung macht aus neunzig Minuten eine Seite mit Entscheidungen und Erkenntnissen. Studierende verwandeln aufgezeichnete Vorlesungen in durchsuchbare Lernnotizen und springen direkt zu der Stelle, an der der Professor genau das erklärt, was garantiert in der Prüfung drankommt. Forschende und Journalisten ziehen wörtliche Zitate aus Interviews und Podiumsrunden, ohne im Player hin und her zu spulen. Podcast-Hörer behalten eine schriftliche Fassung zitierwürdiger Folgen. Vertriebs- und Support-Teams erfassen browserbasierte Calls und Demos, ohne auf fremden Rechnern irgendetwas zu installieren.
Nicht einmal eine laufende Wiedergabe ist nötig. Sie sehen auf einer Seite einen Link zu einer Audiodatei oder einem Video? Klicken Sie mit rechts darauf und schicken Sie ihn direkt zur Transkription. Die Erweiterung übergibt den Link an RealtimeVoiceKIT, das ihn serverseitig abruft und transkribiert, während Sie weitersurfen. Es ist der Unterschied zwischen „Das höre ich mir später an", was meistens nie bedeutet, und dem fertigen Text in fünf Minuten.
Das Transkript, das in Ihrer Bibliothek landet, ist keine Wand aus rohem Text. Jede Aufnahme kommt mit einer KI-Zusammenfassung an, auf Basis modernster KI, dazu das vollständige Transkript, das Sie durchsuchen und bearbeiten können. Sie können der Aufnahme in normaler Sprache Fragen stellen: Was waren die drei Ankündigungen, was wurde über Preise gesagt, welche Einwände kamen auf. Sie können das Transkript in mehr als 50 Sprachen übersetzen, womit aus einem englischen Webinar Notizen werden, die Ihr Team auf Spanisch oder Deutsch liest. Und wenn Sie Untertitel brauchen, sind SRT- und VTT-Export eingebaut.
Die Tab-Aufnahme ist einer von fünf Aufnahmewegen in der Erweiterung. Derselbe Button in der Symbolleiste deckt also den Rest Ihres Audio-Alltags ab. Ein Sprachrekorder mit einem Tipp macht aus gesprochenen Gedanken transkribierte Sprachnotizen. Das Live-Diktat bringt Ihre Worte in Echtzeit in jedes Textfeld. Die Meeting-Aufnahme kümmert sich um Google Meet und Zoom im Browser, ohne dass ein Bot beitritt. Und das Rechtsklick-Menü greift Links und Medien überall im Web auf.
Ein Wort zum Datenschutz, denn ein Werkzeug, das Ihren Browser hören kann, sollte klar sagen, wann es zuhört. Die Erweiterung erfasst Audio nur, wenn Sie eine Sitzung starten, und stoppt in dem Moment, in dem Sie sie beenden. Audio wird verschlüsselt übertragen, Transkripte liegen in Ihrer privaten Bibliothek, und Sie können jedes davon jederzeit löschen. Es gibt kein dauerhaftes Mithören und keine Aufnahme, die Sie nicht selbst gestartet haben.
Die Erweiterung kommt demnächst in den Chrome Web Store, zum Start mit Unterstützung für Chrome und Edge. Bis dahin funktioniert der Kern des Workflows schon heute: Fügen Sie einen Link zu fast jedem Audio oder Video ein oder laden Sie eine Datei auf realtimevoicekit.com hoch, und Sie halten in wenigen Minuten ein präzises Transkript mit Sprecherkennzeichnung, Zusammenfassung und Untertiteln in den Händen. Der kostenlose Tarif enthält jeden Monat Transkriptionsminuten ohne Kosten. Registrieren Sie sich jetzt, und Sie erfahren als Erster, wenn die Erweiterung live ist.
The RealtimeVoiceKIT team schreibt über Audio, KI und die Workflows, die Aufnahmen für das RealtimeVoiceKIT-Team in Reichweite verwandeln.