(资料图片)
自从上期视频发了后,不少人找我来要软件,也有问怎么做ai的,所以单独出一期视频来讲讲关于ai翻唱,开始前先叠个甲
(本专栏仅为个人观点,为面向0基础新手的ai创作教学,可能会有讲的不对的地方,欢迎大佬来友好指正,)
目前b站上的确是有不少教做ai的视频,但是大家可能会因为接触少,认知不够,加上一些复杂的软件被劝退,直接倒在起点线上,所以这期视频主要是让没接触过的新手对ai能有一个初步了解,本视频也是提供思路,涉及到一些软件的操作需要去稍微学一学,当然也是非常简单的,那现在开始吧
就刚才讲的那些来说,ai新手比较难上手的点就是繁多的步骤,这里先来捋一下,收集数据集—训练ai模型—推理ai模型,还是很抽象的,举鹦鹉的例子,人需要给鹦鹉讲话,然后鹦鹉的大脑需要去学习,最后才能自己讲出来,这里人讲的话就是“数据集”,也就是你训练的角色的语音,学习人的部分就是训练,推理便是鹦鹉自己去讲话。怎么样,还是很清楚的,但是讲起来简单,一上手就容易废。
1.数据集部分,先来看一下“收集数据集”的部分,首先你需要将你要训练的角色的声音或歌声收集起来,简单的方法就是录屏,然后上传到文件转换器(/zh/),就能得到音频文件了,一般来说总时长2个小时左右就够了,但是我们都知道,鹦鹉可以模仿人的声音,也能模仿很多其他声音,之前我就看过一个模仿开灯声音的鹦鹉,扯远了,ai也是这样,如果你的音频文件不干净,他也会模仿进去,所以这时候就需要一个去除杂声的软件了,UVR,软件非常简单且人性化,参数直接抄作业就可以了,对新手来说够用了,提出来干声后,用切片软件切一下,鹦鹉也不能学出来2个多小时的话吧,把每个文件切到6mb一下,然后打包到一个文件夹里,第一项工作就做好了
2.训练部分训练这一步还是挺简单的,这里拿so-vits-svc举例,把数据集放进正确的位置,然后识别一下,下面的参数需要按照文档上调整,要不然你的炉子就爆炸了,不过要调的也不多,重要的就是这个,如果显存少,这个一定需要好好调整,不然就会爆,最后写入配置文件就可以开始训练了,有人可能会问训练多久算好,这个我只能说去自己感受,你觉得好了就是好了。
3.推理部分推理算是最简单的了,还是用so-vits-svc,训练左边就是推理,模型都是你刚刚训练好的,选一下配置文件,然后就可以加载模型了,下面这些参数主要是这两个,预测器最好是用rmvpe,变调主要是不同性别的音高转变,比如我之前帝皇唱海阔天空,女声唱男声,就需要高一点的调子,我一般都调到6,这个还是需要你的耳朵去分辨调到多少更好,然后导入音频干声,转换一下音频就完成了,整体下来还是比较简单的。
我的教学就到这里了,虽然没有一些软件深入的操作教学,但是我相信看完后一定有一个初步的认知了,这时候再去学一学操作的步骤,搓个模型出来岂不是易如反掌?如果有讲的不对的地方或者不清楚的地方,欢迎提出来,感谢各位的支持,