Rimuovi le voci dai file audio con la GUI Ultimate Vocal Remover (basata su AI)

GUI Linux per la rimozione vocale definitiva

Ultimate Vocal Remover è uno strumento GUI gratuito e open source per rimuovere voci (e altro) dai file audio utilizzando reti neurali profonde. È disponibile per Windows, macOS e Linux.

Lo strumento, pubblicizzato come “la migliore applicazione di rimozione vocale su Internet” dai suoi sviluppatori, utilizza per la maggior parte modelli addestrati dagli sviluppatori di UVR (ad eccezione dei modelli Demucs v1, v2, v3 e v4 4-stem e 6-stem) .

Ultimate Vocal Remover è uno strumento basato sull’intelligenza artificiale progettato per rimuovere le voci dalle tracce audio. Questo può essere utile per una varietà di scopi, come la creazione di versioni karaoke di brani, l’isolamento di parti strumentali di una traccia o persino la rimozione di voci indesiderate da una registrazione.

Sebbene il suo scopo principale sia rimuovere qualsiasi voce dalle tracce audio, il software può anche eseguire altre attività, a seconda del modello che stai utilizzando. Ad esempio (utilizzando il metodo di elaborazione MDX-Net), può anche rimuovere gli strumenti da un file audio.

Ultimate Vocal Remover può lavorare con file WAV in modo nativo e con altri formati come MP3, FLAC, OGG e molti altri grazie a FFmpeg e può produrre in WAV, FLAC o MP3. Ciò significa che gli utenti possono rimuovere facilmente la voce dalle loro canzoni preferite, indipendentemente dal formato, e senza dover convertire i file stessi.

Ti potrebbe piacere anche: SonoBus è un’applicazione di streaming audio peer-to-peer open source a bassa latenza

Il software è anche facile da usare, con un’interfaccia semplice che consente agli utenti di rimuovere rapidamente e facilmente le voci da qualsiasi traccia audio.

Per utilizzare la GUI di Ultimate Vocal Remover per rimuovere voci o strumenti dai file audio:

selezionare l’input e l’output desiderati nella parte superiore della GUI
scegli il metodo di elaborazione, ad esempio MDX-Net per ottenere una traccia che ha solo voci o solo strumenti,
scegli il modello (il Choose Model il menu a discesa ha un’opzione per scaricare i modelli; Ho usato UVR-MDX-NET Main nel mio test e ha funzionato alla grande),
se scegli il metodo di elaborazione MDX-Net, seleziona la casella per ottenere una traccia che abbia Vocals Only o Instrumental Only,
facoltativamente, selezionare la casella accanto a GPU Conversion se utilizzi una scheda grafica Nvidia supportata (vedi sotto),
e infine clicca Start Processing.

C’è anche un’opzione per la modalità di campionamento se vuoi eseguire un test (che per impostazione predefinita è di 30 secondi del brano). Puoi anche modificare varie impostazioni facendo clic sull’icona della chiave inglese mostrata a sinistra del Start Process pulsante.

Vale la pena notare che per poter utilizzare la GPU per l’elaborazione di file audio durante l’utilizzo di questo strumento basato sull’intelligenza artificiale, avrai bisogno di Nvidia RTX 1060 da 6 GB o più, con almeno 8 GB di V-RAM consigliati. Le GPU AMD Radeon non sono ancora supportate, né lo sono piattaforme diverse da 64 bit. L’applicazione funziona senza una scheda grafica Nvidia, ma ci vorrà più tempo per l’elaborazione (usando il mio vecchio Asus Zenbook con CPU Intel i5-10210, ci sono voluti circa 15 minuti per una traccia di 3:40).

Relativo all’intelligenza artificiale: usa ChatGPT dalla riga di comando con questo wrapper

Scarica / Installa la GUI di Ultimate Vocal Remover

Su Linux, dovrai installare FFmpeg, Python3 PIP e TK, quindi installare i requisiti tramite PIP. Vale la pena notare che i requisiti installati occupano più di 3 GB di spazio su disco e avrai anche bisogno di spazio libero per scaricare i modelli da utilizzare con questo software basato sull’intelligenza artificiale.

Relativo a FFmpeg: FFmpeg: estrarre l’audio dal video nel formato originale o convertirlo in MP3 o Ogg Vorbis

Per eseguire la GUI di Ultimate Vocal Remover su Linux, devi avere alcuni pacchetti installati: FFmpeg (per usare file audio che non sono WAV), python3-pip e python3-tk. Puoi installarli ed eseguire la GUI di Ultimate Vocal Remover seguendo le istruzioni riportate di seguito.

Installa le dipendenze:

Debian / Ubuntu / Linux Mint / Pop!_OS / ecc.:

sudo apt install ffmpeg python3-pip python3-tk

Fedora (dovrai prima abilitare i repository RPMFusion per poter installare FFmpeg):

sudo dnf install ffmpeg python3-pip python3-tkinter

sudo pacman -S ffmpeg python-pip tk

Successivamente, scarica l’ultimo zip del repository della GUI di Ultimate Vocal Remover da qui (l’ultimo archivio di rilascio non include requirements.txtpotrebbe funzionare se copi quello dal repository), estrailo, quindi apri un terminale e vai alla sua cartella (ad es. cd ~/Downloads/ultimatevocalremovergui-master), e lì esegui il seguente comando per installare i suoi requisiti tramite PIP:

python3 -m pip install --user -r requirements.txt

Questo richiederà del tempo poiché il software ha alcune grandi dipendenze. Al termine, puoi eseguire la GUI di Ultimate Vocal Remover utilizzando il seguente comando (nella cartella in cui hai estratto lo zip):