VALL-E-X Web UIをMacで動かしてみる

たった6秒間の音声データから似せた音声の生成ができるVALL-E-Xというモデルが気になり、サクッと動作確認用でMacでインストールしてみた。

基本はリポジトリのREADME通りに従えば問題なく動かせた

動作環境

Python: 3.10系

macOS: Ventura 13.5.1

CPU: M1 Max

1. VALL-E-XのリポジトリをCloneする

git clone 

2. ライブラリのインストール

pip install -r requirements.txt

3. モデルのダウンロード&指定の場所に設置

vallex-checkpoint.ptを./checkpoint配下にDLして設置(checkpointsディレクトリがない場合は作成する)

medium.ptを./whisper配下にDLして設置(whisperディレクトリがない場合は作成する)

DLリンクはすべてREADME内に存在する

4. Web UIを起動

python ./launch-ui.py

これで問題なくWeb UIが起動するはず