Conoces el momento. La llamada empieza, todos saludan y de pronto aparece un recuadro: «El bot de grabación se ha unido a la reunión». La conversación se tensa. Alguien pregunta para qué sirve el bot, otro se pregunta dónde acabará la grabación, y esa charla franca que esperabas se convierte en una charla cautelosa. Muchas empresas ya bloquean los bots de reuniones sin contemplaciones, y no pocos clientes se niegan directamente a hablar con uno en la sala. Sin embargo, la necesidad que trajo al bot no ha desaparecido: alguien tiene que recordar qué se dijo, quién se comprometió a qué y qué viene después.
Hay una forma más discreta de conseguir una transcripción, y no implica invitar a nada a tu reunión. La próxima extensión de navegador de RealtimeVoiceKIT para Chrome y Edge captura el audio de la pestaña del navegador donde transcurre tu reunión y lo transcribe en vivo. Google Meet ya reproduce la voz de cada participante a través de esa pestaña. La extensión simplemente escucha lo que tu navegador ya está reproduciendo, directamente en tu propio equipo. Ningún bot se une a la llamada, ningún nombre extra aparece en la lista de participantes y nadie tiene que aprobar a un invitado de terceros.
Usarla es deliberadamente aburrido. Entras a tu llamada de Google Meet como siempre, haces clic en el icono de RealtimeVoiceKIT en la barra de herramientas e inicias una captura de pestaña. Desde ese momento, la extensión convierte el audio de la reunión en texto en tiempo real, así que puedes echar un vistazo a la transcripción en vivo cada vez que pierdas el hilo. Como la captura pertenece a tu navegador y no a la reunión, funciona sin acceso al calendario, sin aprobación de un administrador y sin pedirle a la otra parte que cambie nada en su forma de conectarse.
La transcripción en vivo es solo la mitad. Mientras la sesión avanza, tienes disponible un asistente de IA integrado, con IA de última generación, para esas preguntas que normalmente garabatearías en los márgenes. Pide un resumen rápido de los últimos diez minutos antes de intervenir. Pide los puntos de acción acordados hasta el momento. Pide una respuesta sugerida cuando aterriza una pregunta difícil en el chat. En lugar de dividir tu atención entre escuchar y tomar notas, te quedas en la conversación y dejas que la transcripción cargue con la memoria.
Un detalle que importa en la práctica: la sesión no depende de que la ventana emergente siga abierta. Ciérrala, cambia de pestaña para buscar algo, presenta un documento, vuelve. La captura sigue funcionando en segundo plano hasta que la detienes desde la barra de herramientas. Cuando la reunión termina, la transcripción completa ya te espera en tu biblioteca de RealtimeVoiceKIT.
Esa biblioteca es donde la transcripción empieza a ganarse el sueldo. Cada captura llega con un resumen de IA, así que la llamada de sesenta minutos se convierte en un párrafo que puedes pegar en un correo de seguimiento. Puedes hacer preguntas sobre la conversación en lenguaje natural y obtener respuestas basadas en lo que realmente se dijo. Si la llamada fue en otro idioma, o tiene que llegar a colegas que hablan otro, puedes traducir la transcripción a más de 50 idiomas. Y si necesitas subtítulos, la exportación en SRT y VTT está a un clic.
Vale la pena dejar clara la diferencia entre esto y un bot, porque cambia mucho más que el ambiente. Un bot es un participante: necesita una invitación o acceso al calendario, ocupa un asiento, es visible para todos y está sujeto a las políticas de reuniones que aplique la empresa del anfitrión. La captura de pestaña es tu propio navegador dejando constancia de lo que ya reproduce para ti, como tomar apuntes con muy buena letra. Una nota honesta sobre etiqueta y legalidad: las normas de grabación varían según el país y la empresa, así que avisa a los demás de que estás transcribiendo la llamada y pide consentimiento donde tus reglas locales lo exijan. Una transcripción nunca debería ser una sorpresa.
Google Meet es el caso obvio, pero la misma captura funciona con cualquier cosa que reproduzca tu navegador. Reuniones de Zoom desde el navegador, webinars, mesas redondas, sesiones de formación, un video de YouTube del que necesitas citas: si la pestaña suena, la extensión puede convertirla en texto. Eso la hace menos una herramienta de reuniones y más una respuesta general a la pregunta «este audio está sonando en mi navegador, ¿por qué no puedo tenerlo como texto?».
La extensión todavía no está disponible: llegará próximamente a la Chrome Web Store y funcionará tanto en Chrome como en Edge desde el primer día. Aun así, no tienes que esperar para sacarle partido. RealtimeVoiceKIT ya transcribe grabaciones de reuniones hoy mismo: sube el archivo desde Meet o desde cualquier grabadora en realtimevoicekit.com y obtienes una conversión de voz a texto precisa con etiquetas de hablante, un resumen de IA, traducción y exportación de subtítulos. El plan gratuito incluye minutos de transcripción cada mes sin necesidad de tarjeta de crédito. Crea tu cuenta ahora y te avisaremos en cuanto la extensión esté disponible.
The RealtimeVoiceKIT team escribe sobre audio, IA y los flujos de trabajo que convierten las grabaciones en alcance para el equipo de RealtimeVoiceKIT.