VALL-E-X Web UIをMacで動かしてみる
たった6秒間の音声データから似せた音声の生成ができるVALL-E-Xというモデルが気になり、サクッと動作確認用でMacでインストールしてみた。
基本はリポジトリのREADME通りに従えば問題なく動かせた
動作環境
Python: 3.10系
macOS: Ventura 13.5.1
CPU: M1 Max
1. VALL-E-XのリポジトリをCloneする
git clone
2. ライブラリのインストール
pip install -r requirements.txt
3. モデルのダウンロード&指定の場所に設置
vallex-checkpoint.ptを./checkpoint配下にDLして設置(checkpointsディレクトリがない場合は作成する)
medium.ptを./whisper配下にDLして設置(whisperディレクトリがない場合は作成する)
DLリンクはすべてREADME内に存在する
4. Web UIを起動
python ./launch-ui.py
これで問題なくWeb UIが起動するはず