Pense onde é que realmente ouve coisas durante um dia de trabalho. O webinar em que se inscreveu há semanas toca num separador. A palestra da conferência que perdeu toca num separador. A entrevista em podcast com o pensador mais ruidoso do seu setor, a reunião geral gravada, a demonstração de produto de um fornecedor, a aula que o professor carregou: separadores, todos eles. O navegador tornou-se discretamente o lugar onde vive a informação falada e, mesmo assim, passar essa fala para texto continua a ser estranhamente manual. Transferir o ficheiro, encontrar o ficheiro, carregar o ficheiro para algum lado, esperar.
A futura extensão RealtimeVoiceKIT para o navegador reduz tudo isso a um clique. Capta o áudio de qualquer separador do navegador e transcreve-o ao vivo, à medida que toca. Abra o webinar, clique no ícone da barra de ferramentas, escolha o separador e veja as palavras a aparecer. Quando a sessão termina, a transcrição completa está na sua biblioteca RealtimeVoiceKIT, pronta para pesquisar, resumir, traduzir ou exportar. É construída sobre o Manifest V3 e funciona tanto no Google Chrome como no Microsoft Edge.
A mecânica é simples de propósito. Uma captura de separador grava exatamente o que o separador reproduz, por isso não há nada para configurar nem formatos com que se preocupar. Não precisa do ficheiro por trás do leitor, não precisa de autorização do site e não precisa de manter o popup aberto: as sessões continuam a correr em segundo plano até as parar a partir da barra de ferramentas. Inicie uma captura no começo de um webinar de duas horas, vá responder a emails e volte para encontrar a transcrição pronta.
O que é que isso permite na prática? Quem assiste a webinars deixa de ter de escolher entre ouvir e tomar notas: a transcrição apanha tudo, e o resumo com IA transforma noventa minutos numa página de decisões e conclusões. Estudantes transformam aulas gravadas em apontamentos pesquisáveis e saltam diretamente para a parte em que o professor explicou aquilo que vai obviamente sair no exame. Investigadores e jornalistas retiram citações exatas de entrevistas e painéis sem andar para trás e para a frente num leitor. Ouvintes de podcasts guardam um registo escrito dos episódios que vale a pena citar. Equipas de vendas e de apoio ao cliente captam chamadas e demonstrações no navegador sem instalar nada na máquina de mais ninguém.
Nem sequer é preciso que o áudio esteja a tocar. Vê uma ligação para um ficheiro de áudio ou para um vídeo numa página? Clique com o botão direito e envie diretamente para transcrição. A extensão entrega a ligação ao RealtimeVoiceKIT, que a vai buscar e transcreve do lado do servidor enquanto continua a navegar. É a diferença entre "depois oiço isto", que normalmente significa nunca, e ter o texto daqui a cinco minutos.
A transcrição que chega à sua biblioteca não é uma parede de texto em bruto. Cada captura vem com um resumo feito com IA de última geração, além da transcrição completa que pode pesquisar e editar. Pode fazer perguntas sobre a gravação em linguagem natural: quais foram os três anúncios, o que disseram sobre preços, que objeções surgiram. Pode traduzir a transcrição para mais de 50 idiomas, o que transforma um webinar em inglês em notas que a sua equipa pode ler em espanhol ou alemão. E quando precisar de legendas, a exportação SRT e VTT já está incluída.
A captura de separador é um dos cinco caminhos de captura da extensão, por isso o mesmo botão da barra de ferramentas cobre o resto da sua vida sonora. Um gravador de microfone com um toque transforma pensamentos falados em notas de voz transcritas. O ditado ao vivo coloca as suas palavras em qualquer campo de texto em tempo real. A captura de reuniões trata do Google Meet e do Zoom no navegador sem nenhum bot a entrar na chamada. E o menu de clique direito apanha ligações e multimédia em qualquer ponto da web.
Uma palavra sobre privacidade, porque uma ferramenta capaz de ouvir o seu navegador deve ser explícita sobre quando ouve. A extensão só capta áudio quando inicia uma sessão e para no momento em que a termina. O áudio viaja encriptado em trânsito, as transcrições vivem na sua biblioteca privada e pode eliminar qualquer uma delas quando quiser. Não há escuta permanente nem capturas que não tenha iniciado.
A extensão chega em breve à Chrome Web Store, com suporte para Chrome e Edge logo no lançamento. Até lá, o fluxo essencial já funciona hoje: cole uma ligação para quase qualquer áudio ou vídeo, ou carregue um ficheiro em realtimevoicekit.com, e terá em minutos uma transcrição precisa com identificação de quem fala, um resumo e legendas. O plano gratuito dá-lhe minutos de transcrição todos os meses sem custos. Registe-se agora e será o primeiro a saber quando a extensão estiver disponível.
The RealtimeVoiceKIT team escreve sobre áudio, IA e os fluxos de trabalho que transformam gravações em alcance para a equipa da RealtimeVoiceKIT.