Ferramenta gratuíta para converter texto em fala

Uma mago manipulando uma fogueira tecnológica

📣📣📣
 
Hoje é quarta-feira, dia 08/02/2023...

Nas entranhas da minha fortaleza, olho severamente para o enorme caldeirão de aço negro à minha frente. Em seu interior o líquido borbulhante e fumaçento começa a brilhar e convulsionar como se estivesse  ganhando vida.
Diante da sua força esmagadora o caldeirão pesado vibra sobre o chão de pedra.
Estou tentando evocar um espírito sombrio para lhe pedir conselhos. Sabe? O tipo de conselho que um artesão das trevas costuma pedir quando se vê em apuros. E eu estou em apuros (há bastante tempo), pois a quantidade de projetos aumenta em meus pergaminhos, enquanto que a quantidade de experiências realizadas tem se mantido estável em minhas galerias subterrâneas.
Faço alguns encantamentos e mentalizo símbolos cripticos, fazendo aquecer o líquido viscoso que exala um cheiro apimentado.
Nada acontece...
Hoje as coisas estão demorando a acontecer.
Resmungo uma praga, pois estou com pressa e o tempo urge acelerado à minha volta.
Então a mistura luminescente se acalma e a sua superfície torna-se lisa como um espelho.
Encaro essa superfície e me vejo refletido ali...
Um ser atarefado e cujo espírito dotado de vontade criativa (e também destrutiva) se vê atado pelas amarras das responsabilidades e necessidades corpóreas.

Pergunto: O que fazer?

E o meu rosto refletido naquele líquido quente e pulsante responde com malevolência, sarcasmo e ironia: crie autômatos para ajudá-lo, faça-os de servos e use de estratégia e malícia para aumentar seu tempo, sua eficiência e seus resultados... Sem vassalos, um susserano é como uma águia sem asas.

Claro que seria essa a resposta.

Que tipo de conselho eu poderia esperar ouvir de um espírito sombrio?

Mas ele diz a verdade. Chega o momento na vida da pessoa em que ela precisa sim de mais braços e pernas em seus afazeres. E como minha área é a tecnologia, nada mais lógico do que fazer uso de robôs para conseguir mais braços e pernas em meus afazeres.

No caso, os robôs a que me refiro são softwares; entidades baseadas em dados que nos permitem adquirir poderes e habilidades que demorariamos anos para obter de outra forma.

Eu interrompi as gravações do podcast devido a alguns fatores: tempo, ambiente silencioso, etc.

Pensando nisso e pretendendo retomar o Caravana Sombria, resolvi usar sentetizadores de texto em fala, pois dessa forma não dependo de um ambiente (ou de um momento) silencioso para obter a narração das histórias que pretendo levar para o formato de podcast.

Claro que prefiro eu mesmo narrar as histórias. Mas isso vai ficar para um futuro próximo (ao menos espero que esteja próximo, pois depende de alguns projetos pessoais na minha vida; que envolvem mudanças de espaço e rotina).

Até lá, vou fazer uma experiência usando uma ferramenta já minha conhecida das minhas experiências anteriores com podcast e aúdio-livro. Falo do Balabolka.

Um emoji de um rosto redondo e amarelo usando um headfone
O Balabolka é uma ferramenta gratuíta do tipo TTS (Text-To-Speech ou Texto Para Fala). Ele permite que o usuário digite o texto nele mesmo ou carregue um arquivo de texto. Salva o áudio gerado em vários formatos (WAV, MP3, MP4, OGG ou WMA).

Quando usei o software pela primeira vez, as vozes disponíveis eram muito robóticas e eu achei que isso poderia dificultar quem estivesse ouvindo o livro a imergir na história. Assim, acabei desistindo de usar o Balabolka da forma como pretendo usar agora, isto é, deixar todo o áudio ser gerado por ele. Mas eu usei para fazer alguns trailers e até mesmo alguns trechos de áudio do Caravana Sombria faz uso dessa ferramenta.

Mas, nos últimos anos pesquisando sobre o assunto, me deparei com um vídeo no Youtube que ensina a usar o Balabolka com algumas vozes mais naturais através de uma integração com outros serviços online. Infelizmente não tenho o link do Youtube comigo agora (mas se eu encontrá-lo, coloco aqui).

Felizmente eu lembro do que aprendi com o vídeo, e vou deixar dois prints abaixo para ajudar o usuário já familiariazado com softwares do tipo a usarem o recurso e obterem áudios mais naturais em seus projetos.

O primeiro passo (após instalar a ferramenta e abri-la), é clicar no menu Ferramentas e em seguida em "Use Online TSS Service", ou seja, "Usar o serviço de Texto para Fala Online" ou algo parecido.
Uma tela com os passos do guia

Após isso o software apresentará uma janela que permitira você escrever o texto ou carregar um arquivo de texto. Vou explicar a opção mais simples, que é escrever o texto direto na janela, como no print abaixo, clicando na guia "Texto" e digitando ou colando o texto desejado.

Em seguida, basta clica no botão localizar e após navegar até a pasta desejada, escolher o nome do arquivo de áudio desejado (para isso basta escrever o nome do arquivo, mesmo que ele não exista o Balabolka o criará quando você concluir o processo).

Na sequência, basta escolher o serviço desejado. Eu prefiro usar o Microsoft Azure. Mas como esses serviços estão sempre mudando, recebendo atualizações e melhorias, o ideal é sempre testá-los, em busca daquele que mais servirá aos seus propósitos.

Também alerto que não é impossível que em algum momento, por qualquer que seja o motivo, as empresas (listadas nesse print: como Google, Amazon, Microsoft, IBM, etc) venham a remover seus serviços de TTS do ar e com isso o Balabolka não conseguirá mais usá-los (mas todos vamos torcer e rezar aos espíritos para que isso não ocorra, combinado?).

Após escolher o serviço desejado, você vai ajustar os parâmetros conforme sua preferência e, para isso, você precisará fazer alguns testes. Além disso, os parâmetros variam conforme o serviço escolhido (se da Amazon, Microsoft, etc).

Como eu uso o Microsoft Azure, os que ajusto são "Idioma", "Voz", "Velocidade", "Tonalidade", etc (conforme o que está sendo exibido no print abaixo).

Uma tela com os passos do guia

Encerro por aqui este meu Caos Diário: minha terapia escrita para colocar um pouco de ordem na bagunça da minha mente.