Sie kennen den Moment. Der Anruf beginnt, alle begrüßen sich, und dann erscheint eine Kachel: „Recording Bot ist dem Meeting beigetreten." Das Gespräch wird steif. Jemand fragt, wozu der Bot da ist, jemand anderes will wissen, wo die Aufnahme am Ende landet, und aus der offenen Diskussion, auf die Sie gehofft hatten, wird eine vorsichtige. Viele Unternehmen blockieren Meeting-Bots inzwischen grundsätzlich, und etliche Kunden weigern sich schlicht, mit einem Bot im Raum zu sprechen. Das Bedürfnis, das den Bot überhaupt erst in den Anruf gebracht hat, ist damit aber nicht verschwunden: Irgendjemand muss sich weiterhin merken, was gesagt wurde, wer was zugesagt hat und was als Nächstes passiert.
Es gibt einen leiseren Weg zu einem Transkript, und er verlangt nicht, irgendetwas in Ihr Meeting einzuladen. Die kommende RealtimeVoiceKIT Browser-Erweiterung für Chrome und Edge erfasst den Ton des Browser-Tabs, in dem Ihr Meeting läuft, und transkribiert ihn live. Google Meet gibt die Stimme jedes Teilnehmers ohnehin über diesen Tab wieder. Die Erweiterung hört einfach auf das, was Ihr Browser bereits abspielt, direkt auf Ihrem eigenen Rechner. Kein Bot tritt dem Anruf bei, kein zusätzlicher Name taucht in der Teilnehmerliste auf, und niemand muss einen fremden Gast genehmigen.
Die Bedienung ist mit Absicht unspektakulär. Sie treten Ihrem Google Meet-Anruf wie gewohnt bei, klicken auf das RealtimeVoiceKIT-Symbol in der Symbolleiste und starten eine Tab-Aufnahme. Ab diesem Moment verwandelt die Erweiterung den Meeting-Ton in Echtzeit in Text, sodass Sie jederzeit einen Blick auf das Live-Transkript werfen können, wenn Sie den Faden verlieren. Weil die Aufnahme zu Ihrem Browser gehört und nicht zum Meeting, funktioniert sie ohne Kalenderzugriff, ohne Freigabe durch die IT und ohne dass die Gegenseite irgendetwas an ihrer Teilnahme ändern muss.
Das Live-Transkript ist nur die halbe Geschichte. Während die Sitzung läuft, steht Ihnen ein KI-Assistent zur Seite, auf Basis modernster KI, für all die Fragen, die Sie sonst an den Rand kritzeln würden. Bitten Sie um eine kurze Zusammenfassung der letzten zehn Minuten, bevor Sie das Wort ergreifen. Fragen Sie nach den bisher vereinbarten Aufgaben. Lassen Sie sich eine Antwort vorschlagen, wenn im Chat eine heikle Frage aufschlägt. Statt Ihre Aufmerksamkeit zwischen Zuhören und Mitschreiben aufzuteilen, bleiben Sie im Gespräch und überlassen dem Transkript das Erinnern.
Ein Detail, das in der Praxis zählt: Die Sitzung hängt nicht davon ab, dass das Popup geöffnet bleibt. Schließen Sie das Popup, wechseln Sie den Tab, um etwas nachzuschlagen, präsentieren Sie ein Dokument, kommen Sie zurück. Die Aufnahme läuft im Hintergrund weiter, bis Sie sie über die Symbolleiste beenden. Wenn das Meeting endet, wartet das vollständige Transkript bereits in Ihrer RealtimeVoiceKIT-Bibliothek.
In dieser Bibliothek beginnt das Transkript, sich zu bezahlen. Jede Aufnahme kommt mit einer KI-Zusammenfassung an, aus dem sechzigminütigen Anruf wird also ein Absatz, den Sie direkt in die Follow-up-E-Mail einfügen können. Sie können in ganz normaler Sprache Fragen zum Gespräch stellen und bekommen Antworten, die auf dem beruhen, was tatsächlich gesagt wurde. Fand der Anruf in einer anderen Sprache statt, oder soll er zu Kollegen wandern, die eine andere sprechen, übersetzen Sie das Transkript in mehr als 50 Sprachen. Und wenn Sie Untertitel brauchen, ist der SRT- und VTT-Export nur einen Klick entfernt.
Der Unterschied zu einem Bot verdient einen klaren Blick, denn er verändert mehr als nur die Stimmung. Ein Bot ist ein Teilnehmer: Er braucht eine Einladung oder Kalenderzugriff, er belegt einen Platz, er ist für alle sichtbar, und er unterliegt den Meeting-Richtlinien des gastgebenden Unternehmens. Eine Tab-Aufnahme ist Ihr eigener Browser, der festhält, was er ohnehin für Sie abspielt, wie Mitschreiben mit sehr guter Handschrift. Ein ehrlicher Hinweis zu Anstand und Recht: Die Regeln für Aufnahmen unterscheiden sich je nach Land und Unternehmen. Sagen Sie den Beteiligten also, dass Sie den Anruf transkribieren, und holen Sie eine Einwilligung ein, wo Ihre lokalen Regeln das verlangen. Ein Transkript sollte niemals eine Überraschung sein.
Google Meet ist der naheliegende Fall, aber dieselbe Aufnahme funktioniert mit allem, was Ihr Browser abspielt. Zoom-Meetings im Browser, Webinare, Podiumsdiskussionen, Schulungen, ein YouTube-Video, aus dem Sie Zitate brauchen: Wenn der Tab Ton erzeugt, kann die Erweiterung ihn in Text verwandeln. Damit ist sie weniger ein Meeting-Werkzeug als eine allgemeine Antwort auf die Frage: „Dieses Audio läuft in meinem Browser, warum kann ich es nicht als Text haben?"
Die Erweiterung ist noch nicht verfügbar: Sie kommt demnächst in den Chrome Web Store und wird vom ersten Tag an mit Chrome und Edge funktionieren. Auf den Nutzen müssen Sie trotzdem nicht warten. RealtimeVoiceKIT transkribiert Meeting-Aufzeichnungen schon heute: Laden Sie die Datei aus Meet oder einem beliebigen Rekorder auf realtimevoicekit.com hoch, und Sie erhalten präzise Spracherkennung mit Sprecherkennzeichnung, eine KI-Zusammenfassung, Übersetzung und Untertitel-Export. Der kostenlose Tarif enthält jeden Monat Transkriptionsminuten, ganz ohne Kreditkarte. Erstellen Sie jetzt Ihr Konto, und wir benachrichtigen Sie, sobald die Erweiterung live geht.
The RealtimeVoiceKIT team schreibt über Audio, KI und die Workflows, die Aufnahmen für das RealtimeVoiceKIT-Team in Reichweite verwandeln.