四句之内难分真伪 AI孙燕姿之后 AI歌手站到台前？

新京报 2023-06-22 17:51:29

“以现在的技术标准，相信四句之内是不会一下子就分辨出虚拟歌手的。”

2023年，AIGC成为了炙手可热的词汇，当AI生成的文字、图片引人惊叹之时，孙燕姿的歌声以“AI形态”再度走入大众视野，也为AI在声音领域的应用增加了更多可能性。

贝壳财经记者注意到，AI歌手实际上早已存在，初音未来、洛天依等依靠音乐编辑器合成声音的虚拟歌姬“出道”多年，并发布有自己的歌曲，不过这些AI歌手的音声因其“电音感”很容易被人认出来。但随着AI技术的进步，AI歌手也正一步步向人类音声逼近，使用软件也可制作出“以假乱真”的歌声。

(相关资料图)

未来，AI歌手的出现会对音乐圈造成何种影响？AI唱歌在版权上有何争议？对此，贝壳财经记者采访了音乐创作软件制作方、音乐人、专家。

AI孙燕姿技术可以用来创造虚拟歌手吗？有何版权问题？

贝壳财经记者了解到，创造出AI孙燕姿的AI音色替换技术，其来源为so-vits-svc模型，一款由中国歌声合成爱好者Rcell开发的AI语音转换项目，其技术原理是使用孙燕姿的声音“替换”其他歌手的干声，才能达到以假乱真的效果。

而在初音未来、洛天依等虚拟歌姬背后的，则是雅马哈的Vocaloid 系列语音合成程序，这款程序也被广泛应用在各类二创视频里，视频创作者可以不用唱的，而是手动“调制”出想要的声音效果，其技术原理同AI孙燕姿并不一样，但二者的共同点是软件和程序都需要首先学习人声音源数据，之后才能合成出想要的声音。

公开资料显示，初音未来的音源数据资料起初采样于日本声优藤田咲，而洛天依的声源由山新、鹿乃担任。限于早期技术原因，初音未来和洛天依早期的歌曲均有浓重的合成音特色，不管是《甩葱歌》还是《普通disco》，都能听出来，并非人类歌手所唱。

不过，贝壳财经记者注意到，虚拟歌手的这一音域“特色”实际上已经可以通过AI技术修正。6月15日，曾推出“半藏森林克隆人”的小冰公司和网易云音乐联合推出音乐创作软件“网易云音乐·X Studio”，并成立了包括12名AI歌手的虚拟歌手厂牌“WOWAIDO！”。在这些虚拟歌手的评论区里，不乏有“不敢相信这是AI唱出来的”等评论。

虚拟歌手陈水若的歌曲评论区截图

6月16日，小冰公司方面对贝壳财经记者表示，目前技术已经发生了进步，“我们的一些虚拟歌手，比如小冰的声音保留了电音特色，这是因为虚拟歌姬自有的粉丝群体认可这种声音，但实际上我们完全能够消除此前的电子音感，因为技术已经能够做到让AI歌手的音色更加细腻自然。”

幻想动漫音乐创始人、艺术总监孙玉镜告诉记者，他此前曾使用过Vocaloid，但更多是为了好玩，而近些年一些AI歌手的演唱音调很好，在拟真程度上，以现在的技术标准，相信四句之内是不会一下子就分辨出虚拟歌手的。

需要注意的是，大部分AI歌手的声音并非单纯“照搬”某一自然人的声音，“每一个声音的背后往往都是由许多不同的声源合成的，这些声源的量非常庞大，甚至有一些声音可能是我们自己公司的员工，但共同点是这些声源都得到了本人的授权。”小冰公司方面告诉记者。

“AI孙燕姿和AI歌手的情况并不相同。”德国慕尼黑大学法学博士，中央财经大学知识产权研究中心研究员李陶对贝壳财经记者表示，“前者涉及了表演者（自然人）的权利，后者涉及了虚拟表演者（非自然人），非自然人不是民事主体，不享有民事主体的人格权和财产安全，对后者的保护，应通过其开发投资经营（运营者）进行。”

AI歌手对音乐圈有何影响？

孙玉镜表示，AI歌手可以帮助音乐人进行创作，“通过现在的AI技术，我们如果想要好好使用虚拟歌手软件，制作出一首成功的歌曲的几率很高。我们在日常的创作过程中会用到这类软件，主要使用方式是在制作demo（歌曲小样）时，用虚拟歌手代替制作人自己去唱，帮助制作人快速确定歌曲旋律，这对前期词曲阶段和编曲阶段都会有很大的帮助，可以达到成品80%左右的样子，后期可以再往上提升，或者找到一个更合适的歌手，替换成更好的声线。”

“AI歌手具有便利、稳定等优势。具体为，在便利性上，AI歌手可以随时随地工作，而人类工作时间相对固定；在稳定性上，AI歌手状态恒一，人类有突发状况，如情绪不佳、声带受损等。”音乐制作人李召洋在接受记者采访时表示。

据了解，李召洋爱好创作儿童音乐，但目前市场上该类音乐有限，其也苦于找不到合适的歌手（有一定演唱基础的稚嫩童音）来演唱自己的作品，因此接近童声的AI声线成为了他的帮手，他曾使用少女小冰的声音，发表作品《笠翁对韵》，该曲目获得了专业奖项（第5届唱工委音乐奖最佳儿童音乐专辑）提名。

不过，在孙玉镜看来，AI歌手在细节上还没有办法像人类歌手一样呈现出“千变万化”的东西，仍然存在局限性，“虽然现在技术已经改善了非常多，但AI对歌曲的演唱更多还是关注在表达上，对于给人带来的听觉感受等更细微的处理可能会弱一些。最终为歌曲买单的听众，追求的一定是某种感觉，人类歌手在录音棚里现场沟通可以随时呈现出各种不同的变化，来配合‘找感觉’，但如果虚拟歌手想快速调整出这种感觉，是没有办法像人类歌手那么快速实施的。”

另一方面，也有声音认为，AI技术与自然人声，AI歌手与真实歌手并非“势同水火”，AI可以成为人类声音“数字永生”的保障。

如《流浪地球2》中，李雪健由于喉管手术导致声带受损，难清晰咬字。为了让他独特的嗓音呈现出最佳效果，特效人员采用AI工具对其声音进行修复，使之最大限度地保留原声，观众们才能在电影院里重温李雪健的经典音色。此外，如果自然人歌手主动向AI授权了自己的声音，并谈好AI歌曲发布后的收益分成，这也未尝不是让AI翻唱“进入阳光下”的一种有益尝试。

小冰公司透露，已有真人歌手主动授权公司“克隆”自己的声音，来保留巅峰状态。歌手能决定AI声音的用途并取得相关收益。经过本人训练调优，AI声音将有机会获得更好的表现。当市场出现越来越多“正版”声音，良币驱逐劣币，或许能解决“孙燕姿们”的问题，也能给予音乐创作者更多选择，这或许是“AI孙燕姿们”合法化的第一步。

在李陶看来，AI孙燕姿类音色替换技术需要表演者的授权，因为表演者可能不愿意别人这么做，而AI歌手则不牵扯这种问题，“总体上看这是一种新的产品类型，应当中立的判断，无所谓价值上的肯定或否定。”

（文章来源：新京报）