14
14
15
15
[ ![ Discord] ( https://img.shields.io/badge/RVC%20Developers-Discord-7289DA?style=for-the-badge&logo=discord&logoColor=white )] ( https://discord.gg/HcsmBBGyVk )
16
16
17
- [ ** 更新日志** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/Changelog_CN.md ) | [ ** 常见问题解答** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98%E8%A7%A3%E7%AD%94 ) | [ ** AutoDL·5毛钱训练AI歌手** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/Autodl%E8%AE%AD%E7%BB%83RVC%C2%B7AI%E6%AD%8C%E6%89%8B%E6%95%99%E7%A8%8B ) | [ ** 对照实验记录** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/Autodl%E8%AE%AD%E7%BB%83RVC%C2%B7AI%E6%AD%8C%E6%89%8B%E6%95%99%E7%A8%8B](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/%E5%AF%B9%E7%85%A7%E5%AE%9E%E9%AA%8C%C2%B7%E5%AE%9E%E9%AA%8C%E8%AE%B0%E5%BD%95) ) | [ ** 在线演示** ] ( https://modelscope.cn/studios/FlowerCry/RVCv2demo )
18
-
19
- [ ** English** ] ( ./docs/en/README.en.md ) | [ ** 中文简体** ] ( ./README.md ) | [ ** 日本語** ] ( ./docs/jp/README.ja.md ) | [ ** 한국어** ] ( ./docs/kr/README.ko.md ) ([ ** 韓國語** ] ( ./docs/kr/README.ko.han.md ) ) | [ ** Français** ] ( ./docs/fr/README.fr.md ) | [ ** Türkçe** ] ( ./docs/tr/README.tr.md ) | [ ** Português** ] ( ./docs/pt/README.pt.md )
17
+ [ ** 更新日志** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/cn/Changelog_CN.md ) | [ ** 常见问题解答** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/%E5%B8%B8%E8%A7%81%E9%97%AE%E9%A2%98%E8%A7%A3%E7%AD%94 ) | [ ** AutoDL·5毛钱训练AI歌手** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/Autodl%E8%AE%AD%E7%BB%83RVC%C2%B7AI%E6%AD%8C%E6%89%8B%E6%95%99%E7%A8%8B ) | [ ** 对照实验记录** ] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/Autodl%E8%AE%AD%E7%BB%83RVC%C2%B7AI%E6%AD%8C%E6%89%8B%E6%95%99%E7%A8%8B](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/wiki/%E5%AF%B9%E7%85%A7%E5%AE%9E%E9%AA%8C%C2%B7%E5%AE%9E%E9%AA%8C%E8%AE%B0%E5%BD%95) ) | [ ** 在线演示** ] ( https://modelscope.cn/studios/FlowerCry/RVCv2demo )
20
18
21
19
</div >
22
20
21
+ ------
22
+
23
+ [ ** English** ] ( ./docs/en/README.en.md ) | [ ** 中文简体** ] ( ./README.md ) | [ ** 日本語** ] ( ./docs/jp/README.ja.md ) | [ ** 한국어** ] ( ./docs/kr/README.ko.md ) ([ ** 韓國語** ] ( ./docs/kr/README.ko.han.md ) ) | [ ** Français** ] ( ./docs/fr/README.fr.md ) | [ ** Türkçe** ] ( ./docs/tr/README.tr.md )
24
+
25
+ 点此查看我们的[ 演示视频] ( https://www.bilibili.com/video/BV1pm4y1z7Gm/ ) !
26
+
27
+ 训练推理界面:go-web.bat
28
+
29
+ ![ image] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/assets/129054828/092e5c12-0d49-4168-a590-0b0ef6a4f630 )
30
+
31
+ 实时变声界面:go-realtime-gui.bat
32
+
33
+ ![ image] ( https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/assets/129054828/143246a9-8b42-4dd1-a197-430ede4d15d7 )
34
+
23
35
> 底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
24
36
25
37
> 请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。
26
38
27
- <table >
28
- <tr >
29
- <td align="center">训练推理界面</td>
30
- <td align="center">实时变声界面</td>
31
- </tr>
32
- <tr >
33
- <td align="center"><img src="https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/assets/129054828/092e5c12-0d49-4168-a590-0b0ef6a4f630"></td>
34
- <td align="center"><img src="https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/assets/129054828/730b4114-8805-44a1-ab1a-04668f3c30a6"></td>
35
- </tr>
36
- <tr>
37
- <td align="center">go-web.bat</td>
38
- <td align="center">go-realtime-gui.bat</td>
39
- </tr>
40
- <tr >
41
- <td align="center">可以自由选择想要执行的操作。</td>
42
- <td align="center">我们已经实现端到端170ms延迟。如使用ASIO输入输出设备,已能实现端到端90ms延迟,但非常依赖硬件驱动支持。</td>
43
- </tr>
44
- </table >
45
-
46
39
## 简介
47
40
本仓库具有以下特点
48
41
+ 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
54
47
+ 使用最先进的[ 人声音高提取算法InterSpeech2023-RMVPE] ( #参考项目 ) 根绝哑音问题。效果最好(显著地)但比crepe_full更快、资源占用更小
55
48
+ A卡I卡加速支持
56
49
57
- 点此查看我们的[ 演示视频] ( https://www.bilibili.com/video/BV1pm4y1z7Gm/ ) !
58
-
59
50
## 环境配置
60
51
以下指令需在 Python 版本大于3.8的环境中执行。
61
52
62
- ### Windows/Linux/MacOS等平台通用方法
63
- 下列方法任选其一。
64
- #### 1. 通过 pip 安装依赖
65
- 1 . 安装Pytorch及其核心依赖,若已安装则跳过。参考自: https://pytorch.org/get-started/locally/
53
+ (Windows/Linux)
54
+ 首先通过 pip 安装主要依赖:
66
55
``` bash
56
+ # 安装Pytorch及其核心依赖,若已安装则跳过
57
+ # 参考自: https://pytorch.org/get-started/locally/
67
58
pip install torch torchvision torchaudio
68
- ```
69
- 2 . 如果是 win 系统 + Nvidia Ampere 架构(RTX30xx),根据 #21 的经验,需要指定 pytorch 对应的 cuda 版本
70
- ``` bash
71
- pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
72
- ```
73
- 3 . 根据自己的显卡安装对应依赖
74
- - N卡
75
- ``` bash
76
- pip install -r requirements.txt
77
- ```
78
- - A卡/I卡
79
- ``` bash
80
- pip install -r requirements-dml.txt
81
- ```
82
- - A卡ROCM(Linux)
83
- ``` bash
84
- pip install -r requirements-amd.txt
85
- ```
86
- - I卡IPEX(Linux)
87
- ``` bash
88
- pip install -r requirements-ipex.txt
59
+
60
+ # 如果是win系统+Nvidia Ampere架构(RTX30xx),根据 #21 的经验,需要指定pytorch对应的cuda版本
61
+ # pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
89
62
```
90
63
91
- #### 2. 通过 poetry 来安装依赖
92
- 安装 Poetry 依赖管理工具,若已安装则跳过。参考自: https://python-poetry.org/docs/#installation
64
+ 可以使用 poetry 来安装依赖:
93
65
``` bash
66
+ # 安装 Poetry 依赖管理工具, 若已安装则跳过
67
+ # 参考自: https://python-poetry.org/docs/#installation
94
68
curl -sSL https://install.python-poetry.org | python3 -
69
+
70
+ # 通过poetry安装依赖
71
+ poetry install
95
72
```
96
73
97
- 通过 Poetry 安装依赖时,python 建议使用 3.7-3.10 版本,其余版本在安装 llvmlite==0.39.0 时会出现冲突
74
+ 你也可以通过 pip 来安装依赖:
98
75
``` bash
99
- poetry init -n
100
- poetry env use " path to your python.exe"
101
- poetry run pip install -r requirments.txt
76
+ N卡:
77
+ pip install -r requirements.txt
78
+
79
+ A卡/I卡:
80
+ pip install -r requirements-dml.txt
81
+
82
+ A卡Rocm(Linux):
83
+ pip install -r requirements-amd.txt
84
+
85
+ I卡IPEX(Linux):
86
+ pip install -r requirements-ipex.txt
102
87
```
103
88
104
- ### MacOS
105
- 可以通过 ` run.sh ` 来安装依赖
89
+ ------
90
+ Mac 用户可以通过 ` run.sh ` 来安装依赖:
106
91
``` bash
107
92
sh ./run.sh
108
93
```
@@ -112,48 +97,48 @@ RVC需要其他一些预模型来推理和训练。
112
97
113
98
你可以从我们的[ Hugging Face space] ( https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/ ) 下载到这些模型。
114
99
115
- ### 1. 下载 assets
116
- 以下是一份清单,包括了所有RVC所需的预模型和其他文件的名称。你可以在` tools ` 文件夹找到下载它们的脚本。
100
+ 以下是一份清单,包括了所有RVC所需的预模型和其他文件的名称:
101
+ ``` bash
102
+ ./assets/hubert/hubert_base.pt
117
103
118
- - ./assets/hubert/hubert_base.pt
104
+ ./assets/pretrained
119
105
120
- - ./assets/pretrained
106
+ ./assets/uvr5_weights
121
107
122
- - ./assets/uvr5_weights
108
+ 想测试v2版本模型的话,需要额外下载
123
109
124
- 想使用v2版本模型的话,需要额外下载
110
+ ./assets/pretrained_v2
125
111
126
- - ./assets/pretrained_v2
112
+ 如果你正在使用Windows,则你可能需要这个文件,若ffmpeg和ffprobe已安装则跳过 ; ubuntu/debian 用户可以通过apt install ffmpeg来安装这2个库, Mac 用户则可以通过brew install ffmpeg来安装 (需要预先安装brew)
127
113
128
- ### 2. 安装 ffmpeg
129
- 若ffmpeg和ffprobe已安装则跳过。
114
+ ./ffmpeg
130
115
131
- #### Ubuntu/Debian 用户
132
- ``` bash
133
- sudo apt install ffmpeg
134
- ```
135
- #### MacOS 用户
136
- ``` bash
137
- brew install ffmpeg
138
- ```
139
- #### Windows 用户
140
- 下载后放置在根目录。
141
- - 下载[ ffmpeg.exe] ( https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe )
116
+ https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffmpeg.exe
117
+
118
+ ./ffprobe
142
119
143
- - 下载 [ ffprobe.exe ] ( https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe )
120
+ https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/ffprobe.exe
144
121
145
- ### 3. 下载 rmvpe 人声音高提取算法所需文件
122
+ 如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于RVC根目录
146
123
147
- 如果你想使用最新的RMVPE人声音高提取算法,则你需要下载音高提取模型参数并放置于RVC根目录。
124
+ https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt
148
125
149
- - 下载 [ rmvpe.pt ] ( https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.pt )
126
+ A卡I卡用户需要的dml环境要请下载
150
127
151
- #### 下载 rmvpe 的 dml 环境(可选, A卡/I卡用户)
128
+ https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.onnx
129
+
130
+ ```
131
+ 之后使用以下指令来启动WebUI:
132
+ ``` bash
133
+ python infer-web.py
134
+ ```
135
+ 如果你正在使用Windows 或 macOS,你可以直接下载并解压` RVC-beta.7z ` ,前者可以运行` go-web.bat ` 以启动WebUI,后者则运行命令` sh ./run.sh ` 以启动WebUI。
152
136
153
- - 下载 [ rmvpe.onnx ] ( https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/rmvpe.onnx )
137
+ 对于需要使用IPEX技术的I卡用户,请先在终端执行 ` source /opt/intel/oneapi/setvars.sh ` (仅Linux)。
154
138
155
- ### 4. AMD显卡Rocm(可选, 仅Linux)
139
+ 仓库内还有一份 ` 小白简易教程.doc ` 以供参考。
156
140
141
+ ## AMD显卡Rocm相关(仅Linux)
157
142
如果你想基于AMD的Rocm技术在Linux系统上运行RVC,请先在[ 这里] ( https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html ) 安装所需的驱动。
158
143
159
144
若你使用的是Arch Linux,可以使用pacman来安装所需驱动:
@@ -170,32 +155,11 @@ export HSA_OVERRIDE_GFX_VERSION=10.3.0
170
155
sudo usermod -aG render $USERNAME
171
156
sudo usermod -aG video $USERNAME
172
157
````
173
-
174
- ## 开始使用
175
- ### 直接启动
176
- 使用以下指令来启动 WebUI
158
+ 之后运行WebUI:
177
159
``` bash
178
160
python infer-web.py
179
161
```
180
162
181
- 若先前使用 Poetry 安装依赖,则可以通过以下方式启动WebUI
182
- ``` bash
183
- poetry run python infer-web.py
184
- ```
185
-
186
- ### 使用整合包
187
- 下载并解压` RVC-beta.7z `
188
- #### Windows 用户
189
- 双击` go-web.bat `
190
- #### MacOS 用户
191
- ``` bash
192
- sh ./run.sh
193
- ```
194
- ### 对于需要使用IPEX技术的I卡用户(仅Linux)
195
- ``` bash
196
- source /opt/intel/oneapi/setvars.sh
197
- ```
198
-
199
163
## 参考项目
200
164
+ [ ContentVec] ( https://github.com/auspicious3000/contentvec/ )
201
165
+ [ VITS] ( https://github.com/jaywalnut310/vits )
0 commit comments