Ultimate Vocal Remover è uno strumento GUI gratuito e open source per rimuovere voci (e altro) dai file audio utilizzando reti neurali profonde. È disponibile per Windows, macOS e Linux.
Lo strumento, pubblicizzato come “la migliore applicazione di rimozione vocale su Internet” dai suoi sviluppatori, utilizza per la maggior parte modelli addestrati dagli sviluppatori di UVR (ad eccezione dei modelli Demucs v1, v2, v3 e v4 4-stem e 6-stem) .
Ultimate Vocal Remover è uno strumento basato sull’intelligenza artificiale progettato per rimuovere le voci dalle tracce audio. Questo può essere utile per una varietà di scopi, come la creazione di versioni karaoke di brani, l’isolamento di parti strumentali di una traccia o persino la rimozione di voci indesiderate da una registrazione.
Sebbene il suo scopo principale sia rimuovere qualsiasi voce dalle tracce audio, il software può anche eseguire altre attività, a seconda del modello che stai utilizzando. Ad esempio (utilizzando il metodo di elaborazione MDX-Net), può anche rimuovere gli strumenti da un file audio.
Ultimate Vocal Remover può lavorare con file WAV in modo nativo e con altri formati come MP3, FLAC, OGG e molti altri grazie a FFmpeg e può produrre in WAV, FLAC o MP3. Ciò significa che gli utenti possono rimuovere facilmente la voce dalle loro canzoni preferite, indipendentemente dal formato, e senza dover convertire i file stessi.
Ti potrebbe piacere anche: SonoBus è un’applicazione di streaming audio peer-to-peer open source a bassa latenza
Il software è anche facile da usare, con un’interfaccia semplice che consente agli utenti di rimuovere rapidamente e facilmente le voci da qualsiasi traccia audio.
Per utilizzare la GUI di Ultimate Vocal Remover per rimuovere voci o strumenti dai file audio:
- selezionare l’input e l’output desiderati nella parte superiore della GUI
- scegli il metodo di elaborazione, ad esempio MDX-Net per ottenere una traccia che ha solo voci o solo strumenti,
- scegli il modello (il
Choose Model
il menu a discesa ha un’opzione per scaricare i modelli; Ho usato UVR-MDX-NET Main nel mio test e ha funzionato alla grande), - se scegli il metodo di elaborazione MDX-Net, seleziona la casella per ottenere una traccia che abbia
Vocals Only
oInstrumental Only
, - facoltativamente, selezionare la casella accanto a
GPU Conversion
se utilizzi una scheda grafica Nvidia supportata (vedi sotto), - e infine clicca
Start Processing
.
C’è anche un’opzione per la modalità di campionamento se vuoi eseguire un test (che per impostazione predefinita è di 30 secondi del brano). Puoi anche modificare varie impostazioni facendo clic sull’icona della chiave inglese mostrata a sinistra del Start Process
pulsante.
Vale la pena notare che per poter utilizzare la GPU per l’elaborazione di file audio durante l’utilizzo di questo strumento basato sull’intelligenza artificiale, avrai bisogno di Nvidia RTX 1060 da 6 GB o più, con almeno 8 GB di V-RAM consigliati. Le GPU AMD Radeon non sono ancora supportate, né lo sono piattaforme diverse da 64 bit. L’applicazione funziona senza una scheda grafica Nvidia, ma ci vorrà più tempo per l’elaborazione (usando il mio vecchio Asus Zenbook con CPU Intel i5-10210, ci sono voluti circa 15 minuti per una traccia di 3:40).
Relativo all’intelligenza artificiale: usa ChatGPT dalla riga di comando con questo wrapper
Scarica / Installa la GUI di Ultimate Vocal Remover
Su Linux, dovrai installare FFmpeg, Python3 PIP e TK, quindi installare i requisiti tramite PIP. Vale la pena notare che i requisiti installati occupano più di 3 GB di spazio su disco e avrai anche bisogno di spazio libero per scaricare i modelli da utilizzare con questo software basato sull’intelligenza artificiale.
Relativo a FFmpeg: FFmpeg: estrarre l’audio dal video nel formato originale o convertirlo in MP3 o Ogg Vorbis
Per eseguire la GUI di Ultimate Vocal Remover su Linux, devi avere alcuni pacchetti installati: FFmpeg (per usare file audio che non sono WAV), python3-pip e python3-tk. Puoi installarli ed eseguire la GUI di Ultimate Vocal Remover seguendo le istruzioni riportate di seguito.
Installa le dipendenze:
- Debian / Ubuntu / Linux Mint / Pop!_OS / ecc.:
sudo apt install ffmpeg python3-pip python3-tk
- Fedora (dovrai prima abilitare i repository RPMFusion per poter installare FFmpeg):
sudo dnf install ffmpeg python3-pip python3-tkinter
sudo pacman -S ffmpeg python-pip tk
Successivamente, scarica l’ultimo zip del repository della GUI di Ultimate Vocal Remover da qui (l’ultimo archivio di rilascio non include requirements.txt
potrebbe funzionare se copi quello dal repository), estrailo, quindi apri un terminale e vai alla sua cartella (ad es. cd ~/Downloads/ultimatevocalremovergui-master
), e lì esegui il seguente comando per installare i suoi requisiti tramite PIP:
python3 -m pip install --user -r requirements.txt
Questo richiederà del tempo poiché il software ha alcune grandi dipendenze. Al termine, puoi eseguire la GUI di Ultimate Vocal Remover utilizzando il seguente comando (nella cartella in cui hai estratto lo zip):
python3 UVR.py