Categoria: Plug-ins

Removendo ou extraindo vocal de músicas com precisão

Tempo de leitura: 6 minutos

Olá pessoal!
Espero que estejam todos muitíssimo bem!

Neste post estou inspirado para falar de um assunto que é de muito interesse dos profissionais e até mesmo de entusiastas da música, e que continua sendo objeto de muitas pesquisas já há um bom tempo: Será que é possível remover o vocal de uma música já mixada e masterizada? Ou então, extrair a voz retirando o instrumental?
Bom, muitos com certeza ainda vão dizer que não; outros vão dizer que sim , mas de forma parcial.

Remover ou isolar o vocal de uma música com 100% de precisão sempre foi um grande desafio e, até então, era considerado algo praticamente impossível. Mas o fato é que, com os primeiros sinais da inteligência artificial nesse sentido, que começou por volta de 2019, isso está mudando para melhor, com resultados que surpreendem a cada novo algoritmo desenvolvido e pré-treinado.
Dependendo da música, a precisão pode chegar em torno de 75 a 90%.
Ótimo para inúmeras finalidades:

  • Ensaiar a música ouvindo todo ou parte do instrumental; útil quando o arranjo é muito complexo e se deseja ouvir algo com mais detalhes
  • Extrair o vocal para usar em uma nova versão da música, como um remix ou mashup, mesmo sem ter as tracks ou pedir autorização para o artista ou gravadora
  • Gerar o playback da música para cantar por cima (a qualidade pode ficar um pouco prejudicada dependendo de qual for escolhida)

É claro que, para ambos os casos como acabei de dizer, e dependendo do algoritmo escolhido, ainda pode haver alguma perda de qualidade, mas já está bem melhor do que se podia fazer no passado.
Estamos falando aqui de engenharia reversa. Pense nisso como a tentativa de descompilar um software de código fechado… É a mesma coisa.

Numa música finalizada, tudo está incluído: A voz, os instrumentos e os efeitos e demais elementos de produção.
Uma vez que você não está de posse das tracks separadas, não é possível ouví-las individualmente, com a mesma qualidade com que foi gravado ou captado.
Então, assim como é estabelecido no acordo de licença do uso de um aplicativo de código fechado, você não tem autorização para descompilar, desmontar ou fazer alguma modificação de forma ilegal. É daí que vem a pirataria e os crackers fazem justamente isso.

E na música não é diferente.
Eu tenho essa consciência e acredito que você que produz e já imaginou fazendo coisas legais com elas também tem, mas existe situações em que realmente é muito complicado pedir autorização para obter o projeto aberto à um artista ou gravadora, por diversas razões:

  • O artista pode já ter falecido
  • A gravadora pode não existir mais
  • Sem uma grande negociação que beneficie mais o artista ou a própria gravadora do que o interessado, é provável que a proposta seja recusada
  • Não há garantia de que a gravadora ainda tenha o projeto arquivado

Entra em cena a manifestação artística através dos meios digitais quando não há outra possibilidade melhor, de forma que nem sempre isso representa um problema grave.
Por exemplo: Num show em público, é livre a interpretação de músicas populares tanto por artistas independentes quanto profissionais, sem que seja necessário uma autorização para isso.
Num remix ou produção bem criativa de uma música já existente, o autor não deixará de ter seus ganhos pela criação original, mas o produtor da versão remixada também poderia ser recompensado pelo trabalho e por mostrar ao mundo a peça musical de um novo jeito, com um novo estilo e alcançando um público ainda maior.

Assim, A possibilidade de isolar e principalmente remover o vocal das músicas com o surgimento de novas ferramentas inteligentes já está sendo uma mão na roda, gerando resultados cada vez melhores e de acesso imediato para o público em geral, músicos e não músicos.
Então, se ficou interessado, continue lendo e vamos ver as técnicas possíveis para remover ou isolar o vocal de uma música!

Isolando ou retirando a voz através da inversão de fase

No caso de isolar o vocal de uma música dessa forma, é necessário possuir a versão original da música e outra versão que contenha apenas o playback, ambas com a mesma qualidade de áudio em bitrate e sample rate.
Esse processo envolve o fenômeno físico da inversão de fase, que se aplica ao áudio por causa das ondas sonoras e das vibrações que geram no ar.

Ao ouvirmos um som, percebemos as variações na pressão que são geradas pelas ondas. Durante a gravação, o diafragma do microfone age de forma semelhante ao tímpano, vibrando de acordo com essas ondas.
Os picos de onda movem o diafragma em uma direção, enquanto os períodos de menor intensidade geram movimento na direção oposta.
Com isso em mente, podemos dizer que ao juntarmos a versão original com a versão playback, ambas sincronizadas perfeitamente, podemos utilizar a técnica de inversão de fase em uma delas. Isso fará com que a voz seja reproduzida isoladamente, já que essa é a única parte da música que não aparece no playback e, portanto, não será anulada.

Para fazer o inverso, você precisaria ter, além da original, uma versão apenas com a voz.
É importante ressaltar que é incomum encontrar a voz separada da música com qualidade 100% original, o que dificulta esse processo de gerar o Playback por inversão de fase.
Além disso, a maioria dos artistas não disponibiliza os playbacks de suas músicas oficialmente, sendo mais comum encontrá-los em músicas do estilo gospel ou gerados a partir de multitracks vazados de músicas internacionais mais antigas que circulam na internet.

Sendo assim, é melhor deixar isso para a IA, não é mesmo? ☺
Continue lendo!

Isolando ou retirando a voz com plugins, programas e ferramentas online

No passado, alguns plugins que tentavam remover o vocal das músicas muitas vezes prejudicavam a qualidade do áudio, destruindo a imagem stereo e transformando o resultado em mono.
Hoje, já existe a técnica de machine learning por trás, como no site Phonicmind , onde você consegue, online, remover e isolar o vocal de músicas com bastante precisão e salvar o resultado em arquivo mp3.
Este foi o primeiro site que descobri na época, com resultados bem satisfatórios.

De lá pra cá, muitos outros sites e algoritmos surgiram com o mesmo propósito, como o Moises.ai (plano gratuito e pago) e o Melody.ml ; todos utilizam o algorítmo avançado de separação de áudio criado pelo Deezer (sim, uma das empresas de streaming de música).
O projeto chama-se Spleeter e o código é open source e disponível para desenvolvedores.
Sobre o Moises, além de ter a ferramenta para separar a música em várias partes, também é possível descobrir a tonalidade, o BPM (batidas por minuto) e os acordes cifrados, fora um recurso bem interessante para masterizar suas próprias músicas para deixar com uma cara mais profissional.

Mais recentemente ainda, também surgiu outro site chamado Lalal.ai , que promete resultados melhores do que os que usam a tecnologia spleeter, usando o Phoenix como algoritmo.
Por fim, esse aqui possibilita escolher o algoritmo que será utilizado (demusc, Ultimate Vocal Remover HQ, etc). Aliás, até agora, o Ultimate Vocal Remover foi o que mais me surpreendeu, principalmente para remover o vocal de músicas e usando a versão Offline em forma de programa (falarei mais sobre isso adiante).

Para os demais algoritmos, particularmente noto que, ao isolar a voz de músicas em que ela aparece com muito reverb, o noise reduction (ou gate) aplicado durante a extração faz com que a sobra do efeito seja cortado.

Na categoria de programas e plugins, uma ferramenta muito inteligente é o aplicativo RX da Izotop .
Um de seus módulos (music rebalance) permite ajustar o ganho de elementos de uma música já mixada em tempo real, o que ajuda a resolver problemas de volume. É possível também isolar ou remover a voz, bateria ou percussão, baixo e outros instrumentos.
Para o Demucs citado anteriormente em um dos sites, existe uma interface gráfica adaptada (GUI) , que permite utilizá-lo sem precisar de internet.
O mesmo vale também para o Ultimate Vocal Remover GUI, disponível para Windows, Mac e Linux, que reúne vários outros algoritmos tudo em um mesmo aplicativo.
Alguns já vem no pacote, outros podem ser baixados separadamente. Destaque aqui para o modelo UVR-DeEcho-DeReverb da categoria VR Architecture, que simplesmente tira o reverb ou o eco da voz extraída, ou mesmo de qualquer outro material de áudio que contenha o efeito.
Impressionante, não? 😯

Na minha opinião, o resultado produzido pelos dois são muito melhores se comparado ao RX.
O Demucs se destaca por ter melhor precisão para extrair baixo e bateria. O Ultimate Vocal Remover além de gerar a versão da música sem a voz com uma precisão muito boa, não deixa a desejar ao isolá-la, preservando os detalhes como a respiração e a sobra do efeito aplicado, com o mínimo de artefatos.

Uma outra alternativa é o Extra Boy pro da Elevayta, que funciona como um plugin VST e também permite ter controle do espectro sonoro, deletando um ou múltiplos instrumentos.
Por fim, o Voice Trap da Clone Ensemble, que é o mais antigo das ferramentas de remoção e isolamento de voz.
Na época que ele foi lançado, era o que havia de melhor. Tem plugin para VST e DirectX.

Bom galera, é isso.
Espero que tenham gostado!
Deixem suas impressões nos comentários.
Vou gostar de saber de outras ferramentas.
Até a próxima!

tudo sobre controladores MIDI, como funcionam e como utilizar

Tempo de leitura: 3 minutos

Olá galerinha, em especial aos músicos!
Este post é dedicado a dar uma breve explicação do que são controladores, como funcionam e como utilizá-los na produção musical. Vou me basear no outro artigo que escrevi contando sobre o midi e os instrumentos virtuais, e que prometi dar uma definição mais clara sobre a função de um controlador. então vamos lá!

Um controlador pode ser definido como um dispositivo que controla outro.
Um exemplo comum é o controle remoto da televisão, que nos permite acessar os recursos do aparelho sem precisar levantar do sofá.
Controladores são usados em uma ampla variedade de equipamentos, incluindo aparelhos de som, DVD players e muitos outros.

Quando o padrão MIDI surgiu, foi possível gerar comandos em tempo real e decodificá-los para reproduzir sons. Para isso, foram desenvolvidos controladores, como os teclados, que além de reproduzir timbres, também podem atuar como dispositivos de controle MIDI.
Com o uso de um teclado, é possível executar timbres realistas. Para isso, é necessário conectar o teclado a um cabo MIDI convencional, que possui uma ponta circular com vários conectores de 5 pinos.
Esse cabo é usado para interligar dispositivos MIDI, como teclados e placas de som externas, e transmitir comandos MIDI para o computador, que pode manipulá-los usando softwares de produção musical, como o Sonar, o Reaper e o Cubase.

Para fazer a conexão corretamente, é preciso configurar o software para reconhecer as informações enviadas pela conexão MIDI, seja de entrada (MIDI input) ou de saída (MIDI output).
Se for necessário reproduzir um arquivo MIDI em um instrumento compatível, é possível conectar um segundo cabo MIDI na saída MIDI do teclado e na entrada MIDI da placa de som, ou retirar o cabo MIDI conectado na entrada MIDI do teclado e colocá-lo na saída do instrumento e na entrada da placa.

Além do cabo MIDI convencional, existe o cabo MIDI USB, que é usado em teclados que não possuem a conexão convencional.
Para usá-lo, é necessário baixar um driver, geralmente fornecido pelo fabricante do teclado ou do instrumento MIDI, para enviar e receber comandos MIDI entre o teclado e o computador.
Com esse tipo de cabo, é possível transmitir sinais MIDI do teclado para o computador e vice-versa, tudo usando uma única conexão USB.
Há ainda as chamadas interfaces midi, que possuem numa extremidade os conectores de 5 pinos para midi in/out, e do outro lado a ponta USB para conectar no computador.
Na maioria das vezes, vem também com um pequeno transformador com led para indicar se tudo está funcionando corretamente.

Com a conexão MIDI, é possível controlar vários dispositivos simultaneamente, permitindo a interação com vários teclados ao mesmo tempo e o acesso a alguns de seus recursos. Essa mesma ligação seria usada mais tarde nos computadores e nas placas de som compatíveis para controle de instrumentos virtuais.

Antes do surgimento dos instrumentos virtuais de computador, os módulos de timbres eram usados para reproduzir sons GM (General MIDI), controlados pelo teclado.
Para ter acesso a mais timbres, era necessário o uso de módulos de timbres externos. Com as possibilidades ilimitadas de criação de músicas com infinitos timbres, os módulos de timbres acabaram sendo substituídos por instrumentos virtuais, que podem ser controlados diretamente pelo teclado ou por outros dispositivos MIDI.
Hoje em dia, é possível conectar e controlar uma ampla variedade de instrumentos musicais usando controladores MIDI, abrindo muitas possibilidades para a criação de música.

A competição entre as principais marcas de instrumentos eletrônicos e outras que investem em softwares para produzir timbres inovadores é extremamente acirrada. Além disso, os computadores portáteis, como notebooks e ultrabooks que possuem processamento eficiente, permitem que os músicos usem plugins ao vivo em shows, alterando os timbres diretamente no controlador.
No entanto, é importante ressaltar que esses computadores, mesmo com bom desempenho, ainda apresentam certa incerteza em relação à estabilidade dos softwares. Portanto, é recomendável utilizá-los apenas para gravação e produção de músicas, embora muitos músicos tenham relatado que não tiveram problemas ao usá-los em shows ao vivo.

É isso, pessoal. Espero que tenham gostado!
Agora, bora fazer música com essas ferramentas!

o nascimento do midi e a história dos plugins

Tempo de leitura: 6 minutos

Olá pessoal!
Segue mais um post para os fascinados por produção musical.
E para tanto, nada melhor do que começar com uma breve introdução e, em seguida, discorrer um pouco mais do assunto para ficar entendível, não é?
Então vamos lá!

Você já imaginou como os produtores faziam para gravar um grupo enorme de orquestra enquanto acompanhavam a cena já gravada dos filmes?
Difícil até pensar em como se conseguia ter tanta concentração do papel que cada instrumentista teria de desenvolver nas trilhas, ao mesmo tempo prestando atenção nos cenários que apareciam numa tela grandíssima para deixar tudo sincronizado.
Posso citar como exemplo os filmes de Star-Wars, que apesar de serem quase todos daquela época, tiveram suas trilhas gravadas por um grupo imenso de orquestra.
Impossível não era, mas dava muito trabalho.
Havia uma certa demora na produção dessas trilhas, fato que talvez explique o atraso nos lançamentos.
Mas a tecnologia veio para dar um jeito nisso.

Antes de conhecermos a história dos instrumentos virtuais e o que são, é preciso saber como foi possível gerar notas musicais com o que existia naquele tempo.
Como isso poderia ser possível, já que a multimídia ainda estava engatinhando?
Diante desta situação, uns malucos aí (diga-se de passagem) de algumas empresas do japão e de outros países resolveram criar o que a gente conhece hoje como MIDI.
“MIDI? Que diabos é isso?!?!?”
Calma, ainda não falei grego. ?

Inicialmente, o MIDI (sigla para Musical Instrument Digital Interface, do inglês) surgiu através das primeiras placas de som para computadores, em que era mandado codificações representando as notas musicais e a interface conseguia gerar o som dessas notas com bastante precariedade, claro.
Esta técnica inclusive é usada até hoje por placas de som mais atuais e robustas através de arquivos MIDI.

“Mas eu pensei que os arquivos MIDI fossem como os arquivos de música!”
É, pensava. Os arquivos MIDI, por si só, não fazem nada. A única coisa que contém dentro deles são uma sequência de instruções.
Essa sequência é lida por um player qualquer, que envia essas informações diretamente para a placa de som, que por sua vez interpreta e as decodifica, gerando a sequência de sons que foram instruídas nesse arquivo.
Nele também são indicados outros comandos, como por exemplo o tipo de instrumento a ser executado e a quantidade deles (máximo de 16 por canal).
Os timbres que são gerados após a decodificação continuam sendo até hoje das próprias placas de som.
Interessante, né?

Você já experimentou dar uma olhadinha no que geralmente está escrito nesses arquivos, trocando suas extensões para poder visualizá-los num editor de texto puro como o bloco de notas?
É isso mesmo que você leu. Arquivos MIDI são textos puros que contém comandos codificados.
Abaixo vai um exemplo que mostra exatamente isso:

“MThd # # # xMTrk # ÿY# ÿQ##ï‘ ÿX##### ÿ/ MTrk A# ÿ##Piano 1&À °]# [P
Yb%Wb Db Tb Mb =b Y 6Rb Ub T W $Wb#Tb R U ?M W #Rb Ub T D #= U R Db JbPb”

Retirei de um arquivo MIDI que obviamente contém muito mais do que isso, mas acho que deu para você perceber que, conclusivamente, são como se fossem partituras codificadas. Só os dispositivos compatíveis entendem.
A primeira linha de código até que não nos parece assim tão ininteligível, pois já de cara nos apresenta a palavra “piano” que está indicando que as notas deverão ser reproduzidas com som de piano.

Podemos concluir assim que, na área da informática, as placas de som foram as primeiras a reproduzir sons sintetizados, juntamente com os primeiros teclados e outros instrumentos sintetizadores.
Foi quando novamente tiveram uma brilhante ideia vinda de malucos (tinha que ser) de implementar no MIDI um esquema que permitisse a execução desses comandos que você viu acima em realtime (tempo real), para que o som fosse gerado instantaneamente.
Isso explica basicamente como funcionam os teclados até hoje.
Como?
Simples…
Você aperta as teclas do instrumento e, dentro dele, é gerado comandos MIDI a serem decodificados e, por fim, reproduzidos com o som próprio do teclado.
Coisa de maluco mesmo, né? ?

Mais do que uma linguagem, o MIDI também acabou virando um protocolo de comunicação entre instrumentos compatíveis.
O som MIDI é conhecido até hoje por tentar imitar os instrumentos de forma bem precária para aquela época e razoável para um uso caseiro atualmente. Além disso, esteve dominando os celulares com aqueles toques polifônicos, lembram? é, era MIDI! ?

Coincidentemente, os celulares passaram quase pelo mesmo processo de evolução até conseguirem reproduzir uma música de verdade. Antes disso, reproduzia toques monofônicos (Ringtones), ou seja, só podia tocar uma única nota por vez.
Isso também aconteceu com o primeiro e enorme sintetizador feito antes da existência de teclados eletrônicos portáteis, o tão conhecido e famoso
Moog , desenvolvido por
Robert Moog .

O sintetizador era monofônico e o Álbun que se tem conhecimento com os sons dele teve que passar por uma gravação de 8 pistas separadas para colocar mais de uma nota e um instrumento ao mesmo tempo.

Switched on Bach, a música clássica de Bach usando o sintetizador Moog

Já naquela época (distante ao tempo em que o mesmo aconteceu com os toques dos primeiros celulares),
Keith Emerson (um exímio tecladista que fez pelos teclados o que Jimi Hendrix fez pela guitarra) teve conhecimento do sintetizador, ficou encantado com sua sonoridade e já queria usá-lo ao vivo, nos palcos.
Robert Moog, que era o músico e engenheiro daquele trambolho grande, o desaconselhava, porque pensava que seria de utilidade apenas em estúdios por ter instabilidades na afinação.
Não existia manual de montagem e uso do equipamento e vários complementos adicionais (como os módulos) vinham separado.
Mas pela insistência do grande músico surgia o
Minimoog , uma versão mais compacta do seu irmão mais velho que deu origem aos outros sintetizadores e também aos teclados eletrônicos.

À medida em que tudo foi evoluindo, também melhorava cada vez mais a precisão para sintetizar o som do instrumento desejado da forma mais idêntica possível a um instrumento real.
Neste processo de evolução é que o processamento de áudio começava a surgir em grande estilo.

Os teclados já contavam com memória suficiente para reproduzir timbres fiéis e próximos dos instrumentos acústicos; hoje com possibilidade para recursos adicionais como gravação em áudio de uma performance musical com efeitos diversos; a mesma gravação pode ser facilmente copiada para o computador, editada, masterizada e gravada em CD. Pode-se inclusive expandir o teclado com novos timbres sampleados.
O computador que até então era usado para tarefas muito peculiares e particulares, aos poucos também foi aprimorado.

E em meio a tudo isso, mais um grupo de malucões de uma empresa alemã conhecida como
Steinberg resolveu inovar, criando uma plataforma que permitia simular efeitos que eram comumente utilizados por outros equipamentos de hardware em estúdios, como processadores de efeito e pedaleiras.
Aos poucos eles deixaram de ser frequentemente usados.
Hoje basta plugar uma guitarra e/ou um violão elétrico e mandar o sinal de áudio para um computador com o software rodando um plugin de pedaleira virtual, que o mesmo efeito é fielmente reproduzido, como se estivesse vindo mesmo do equipamento.

No final das contas e aproveitando o sucesso disso e o grande impacto que deve ter causado, os espertinhos tiveram a ideia também de desenvolver uma nova tecnologia para possibilitar a execução de instrumentos reais pelo computador, usando o nosso bom e velho MIDI já explicado, em conjunto com algum outro instrumento musical que fosse compatível com o protocolo como teclados, que atuariam agora como controladores.
Controladores? Que que é isso?

Explicarei num próximo artigo.
Mas os teclados que foram os primeiros a serem feitos para tentar reproduzir os instrumentos (em especial acústicos) seriam usados para enviar comandos MIDI codificados em tempo real a um instrumento virtual, que os interpretaria e executaria com o seu próprio som em vez do som MIDI: No caso o instrumento tal como ele soa, gravado por diversas vezes, nota a nota, com inúmeras amostras (samples), em diferentes ângulos de captação, intensidade e articulação.
Sim, um clone quase perfeito de um instrumento real dentro do computador! ?

Agora, não necessariamente preciso ir atrás dos músicos para alcançar o perfeito realismo, basta um computador e um teclado e, o mais importante, saber como tocar os instrumentos, mesmo que seja num instrumento de teclas.
Se conseguir, então o resultado será uma reprodução fiel, como se eu estivesse tocando nele ou como se alguém tocasse na minha frente.
Se bem que tem gente que também pensa ao contrário.

A quem prefira gravar os instrumentos vindos dos seus instrumentistas.
De fato, podem existir algumas nuances que sejam difíceis de “clonar”, ainda mais considerando a performance única de cada músico.
Mesmo assim, com essa grande invenção, os produtores e músicos não precisam mais depender sempre do instrumento em mãos para alcançarem a sonoridade desejada, principalmente se a ideia é reduzir custos e o orçamento do cliente está muito apertado.
Na produção de trilhas para cinema, não é mais necessário contratar uma orquestra inteira, basta ter todos os instrumentos no PC e saber como sequenciá-los usando o teclado e softwares de produção musical!

E aqui termina a história de todo esse avanço tecnológico.
Graças a todos esses acontecimentos, novas alternativas estão a disposição para se fazer música.
O limite? Bem, isso vai da criatividade da pessoa!

a! e antes que eu me esqueça, as duas plataformas também receberam suas siglas como no MIDI. A primeira é chamada de VST (Virtual Studio Tecnology) e a segunda se chama VSTI (Virtual Studio Instrument Tecnology).
a primeira é para efeitos e a segunda para instrumentos virtuais, dos mais diversos: Acústicos, sintetizados…
E a quantidade de instrumentos possíveis de serem reproduzidos com uso de computador é infinita, que já existem plugins como os da
Arturia que te dão a possibilidade de conhecer, brincar e usar os primeiros dois importantes sintetizadores que citei acima: O Moog e o Minimoog.

E você, quais plugins VST e VSTI que mais gosta de usar?
Deixe nos comentários e vamos trocar conhecimento!
Grande abraço!