楼上正解,顺便说一下步骤:
先把弄干净的一堆10s内的音频放到dataset_raw下面自己新建一个文件夹里,或者默认的babara,然后点自动格式化音频名
然后点1.数据预处理,输入y,等待完毕
然后2.训练.bat 这个开始就无限制开始产出了,你视频那个默认是保存3份最新模型,在logs/44k里
等有G_XXX.pth后,你就可以点击3.推理,按提示先输入当前有的模型的步数,就是那个G_XXX的XXX,然后把要推理的干声歌曲放到raw文件夹下,输入歌曲名(里面内置一个test),然后等待完成,如果不报错,结果就存在results文件夹下。