Piensa en dónde escuchas realmente las cosas durante una jornada de trabajo. El webinar al que te apuntaste hace semanas suena en una pestaña. La charla de la conferencia que te perdiste suena en una pestaña. La entrevista del pódcast con el pensador más ruidoso de tu sector, la reunión general grabada, la demo de producto de un proveedor, la clase que subió tu profesor: pestañas, todas. El navegador se ha convertido sin hacer ruido en el lugar donde vive la información hablada y, aun así, pasar esa voz a texto ha seguido siendo extrañamente manual. Descarga el archivo, encuentra el archivo, súbelo a algún sitio, espera.
La próxima extensión de navegador de RealtimeVoiceKIT reduce todo eso a un clic. Captura el audio de cualquier pestaña del navegador y lo transcribe en vivo, mientras se reproduce. Abre el webinar, haz clic en el icono de la barra de herramientas, elige la pestaña y mira cómo aparecen las palabras. Cuando la sesión termina, la transcripción completa está en tu biblioteca de RealtimeVoiceKIT, lista para buscar, resumir, traducir o exportar. Está construida sobre Manifest V3 y funciona tanto en Google Chrome como en Microsoft Edge.
La mecánica es simple a propósito. Una captura de pestaña graba exactamente lo que la pestaña reproduce, así que no hay nada que configurar ni formatos de los que preocuparse. No necesitas el archivo que hay detrás del reproductor, no necesitas permiso del sitio y no necesitas mantener abierta la ventana emergente: las sesiones siguen corriendo en segundo plano hasta que las detienes desde la barra de herramientas. Inicia una captura al comienzo de un webinar de dos horas, ve a contestar correos y vuelve a una transcripción terminada.
¿Qué desbloquea esto en la práctica? Los asistentes a webinars dejan de elegir entre escuchar y tomar notas: la transcripción lo recoge todo, y el resumen de IA convierte noventa minutos en una página de decisiones y conclusiones. Los estudiantes convierten clases grabadas en apuntes donde se puede buscar y saltan directo a la parte donde el profesor explicó eso que obviamente caerá en el examen. Investigadores y periodistas extraen citas exactas de entrevistas y mesas redondas sin ir adelante y atrás por un reproductor. Los oyentes de pódcasts conservan un registro escrito de los episodios que vale la pena citar. Los equipos de ventas y soporte capturan llamadas y demos en el navegador sin instalar nada en el equipo de nadie más.
Ni siquiera hace falta una reproducción en vivo. ¿Ves en una página un enlace a un archivo de audio o a un video? Haz clic derecho y envíalo directo a transcripción. La extensión le pasa el enlace a RealtimeVoiceKIT, que lo descarga y lo transcribe en el servidor mientras tú sigues navegando. Es la diferencia entre «lo escucharé más tarde», que normalmente significa nunca, y tener el texto dentro de cinco minutos.
La transcripción que llega a tu biblioteca no es un muro de texto en bruto. Cada captura viene con un resumen generado con IA de última generación, además de la transcripción completa que puedes buscar y editar. Puedes hacer preguntas sobre la grabación en lenguaje natural: cuáles fueron los tres anuncios, qué dijeron sobre los precios, qué objeciones surgieron. Puedes traducir la transcripción a más de 50 idiomas, lo que convierte un webinar en inglés en apuntes que tu equipo puede leer en español o alemán. Y cuando necesitas subtítulos, la exportación en SRT y VTT viene incorporada.
La captura de pestaña es una de las cinco vías de captura de la extensión, así que el mismo botón de la barra de herramientas cubre el resto de tu vida sonora. Una grabadora de micrófono de un toque convierte tus ideas habladas en notas de voz transcritas. El dictado en vivo pone tus palabras en cualquier campo de texto en tiempo real. La captura de reuniones se encarga de Google Meet y de las llamadas de Zoom en el navegador sin que se una ningún bot. Y el menú de clic derecho recoge enlaces y archivos multimedia en cualquier parte de la web.
Unas palabras sobre privacidad, porque una herramienta capaz de oír tu navegador debe ser explícita sobre cuándo escucha. La extensión captura audio solo cuando inicias una sesión y se detiene en el momento en que la terminas. El audio viaja cifrado en tránsito, las transcripciones viven en tu biblioteca privada y puedes eliminar cualquiera cuando quieras. No hay escucha permanente ni capturas que tú no hayas iniciado.
La extensión llegará próximamente a la Chrome Web Store, con soporte para Chrome y Edge desde el lanzamiento. Mientras tanto, el flujo principal ya funciona hoy: pega un enlace a casi cualquier audio o video, o sube un archivo en realtimevoicekit.com, y tendrás en minutos una transcripción precisa con etiquetas de hablante, un resumen y subtítulos. El plan gratuito te da minutos de transcripción cada mes sin costo. Regístrate ahora y serás de los primeros en saber cuándo la extensión está disponible.
The RealtimeVoiceKIT team escribe sobre audio, IA y los flujos de trabajo que convierten las grabaciones en alcance para el equipo de RealtimeVoiceKIT.