下载 https://mirror.ghproxy.com/https://github.com/fishaudio/Bert-VITS2.git
安装

conda create -n vits python=3.9 -y
conda activate vits
pip install torch==1.13.1+cu117 torchvision==0.14.1+cu117 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu117

下载下面压缩包并解压到项目跟目录

https://beijing-panel.oss-cn-beijing.aliyuncs.com/emotional.zip
https://beijing-panel.oss-cn-beijing.aliyuncs.com/bert.zip

创建Data目录

Data
----girl(模型文件)
    ----models(模型目录)
    ----config.json(模型配置文件)
    ----audios(训练音频目录)
        ------raw(原始文件)
        ------wavs(加工文件)
    ----filelists(数据集)
        ----transcription.list(数据集文件)

1、python resample.py
2、python preprocess_text.py
3、python bert_gen.py
4、python emo_gen.py
5、train_ms.py

额外工具
https://github.com/SubtitleEdit/subtitleedit 字幕检查工具
https://videorobot.amddd.com/download 根据字幕切片视频工具,制作数据集

最后修改:2023 年 12 月 07 日 07 : 32 PM
如果觉得我的文章对你有用,请随意赞赏