四句之内难分真伪 AI孙燕姿之后 AI歌手站到台前?

新京报   2023-06-22 17:51:29

“以现在的技术标准,相信四句之内是不会一下子就分辨出虚拟歌手的。”

2023年,AIGC成为了炙手可热的词汇,当AI生成的文字、图片引人惊叹之时,孙燕姿的歌声以“AI形态”再度走入大众视野,也为AI在声音领域的应用增加了更多可能性。

贝壳财经记者注意到,AI歌手实际上早已存在,初音未来、洛天依等依靠音乐编辑器合成声音的虚拟歌姬“出道”多年,并发布有自己的歌曲,不过这些AI歌手的音声因其“电音感”很容易被人认出来。但随着AI技术的进步,AI歌手也正一步步向人类音声逼近,使用软件也可制作出“以假乱真”的歌声。


(相关资料图)

未来,AI歌手的出现会对音乐圈造成何种影响?AI唱歌在版权上有何争议?对此,贝壳财经记者采访了音乐创作软件制作方、音乐人、专家。

AI孙燕姿技术可以用来创造虚拟歌手吗?有何版权问题?

贝壳财经记者了解到,创造出AI孙燕姿的AI音色替换技术,其来源为so-vits-svc模型,一款由中国歌声合成爱好者Rcell开发的AI语音转换项目,其技术原理是使用孙燕姿的声音“替换”其他歌手的干声,才能达到以假乱真的效果。

而在初音未来、洛天依等虚拟歌姬背后的,则是雅马哈的Vocaloid 系列语音合成程序,这款程序也被广泛应用在各类二创视频里,视频创作者可以不用唱的,而是手动“调制”出想要的声音效果,其技术原理同AI孙燕姿并不一样,但二者的共同点是软件和程序都需要首先学习人声音源数据,之后才能合成出想要的声音。

公开资料显示,初音未来的音源数据资料起初采样于日本声优藤田咲,而洛天依的声源由山新、鹿乃担任。限于早期技术原因,初音未来和洛天依早期的歌曲均有浓重的合成音特色,不管是《甩葱歌》还是《普通disco》,都能听出来,并非人类歌手所唱。

不过,贝壳财经记者注意到,虚拟歌手的这一音域“特色”实际上已经可以通过AI技术修正。6月15日,曾推出“半藏森林克隆人”的小冰公司和网易云音乐联合推出音乐创作软件“网易云音乐·X Studio”,并成立了包括12名AI歌手的虚拟歌手厂牌“WOWAIDO!”。在这些虚拟歌手的评论区里,不乏有“不敢相信这是AI唱出来的”等评论。

虚拟歌手陈水若的歌曲评论区截图

6月16日,小冰公司方面对贝壳财经记者表示,目前技术已经发生了进步,“我们的一些虚拟歌手,比如小冰的声音保留了电音特色,这是因为虚拟歌姬自有的粉丝群体认可这种声音,但实际上我们完全能够消除此前的电子音感,因为技术已经能够做到让AI歌手的音色更加细腻自然。”

幻想动漫音乐创始人、艺术总监孙玉镜告诉记者,他此前曾使用过Vocaloid,但更多是为了好玩,而近些年一些AI歌手的演唱音调很好,在拟真程度上,以现在的技术标准,相信四句之内是不会一下子就分辨出虚拟歌手的。

需要注意的是,大部分AI歌手的声音并非单纯“照搬”某一自然人的声音,“每一个声音的背后往往都是由许多不同的声源合成的,这些声源的量非常庞大,甚至有一些声音可能是我们自己公司的员工,但共同点是这些声源都得到了本人的授权。”小冰公司方面告诉记者。

“AI孙燕姿和AI歌手的情况并不相同。”德国慕尼黑大学法学博士,中央财经大学知识产权研究中心研究员李陶对贝壳财经记者表示,“前者涉及了表演者(自然人)的权利,后者涉及了虚拟表演者(非自然人),非自然人不是民事主体,不享有民事主体的人格权和财产安全,对后者的保护,应通过其开发投资经营(运营者)进行。”

AI歌手对音乐圈有何影响?

孙玉镜表示,AI歌手可以帮助音乐人进行创作,“通过现在的AI技术,我们如果想要好好使用虚拟歌手软件,制作出一首成功的歌曲的几率很高。我们在日常的创作过程中会用到这类软件,主要使用方式是在制作demo(歌曲小样)时,用虚拟歌手代替制作人自己去唱,帮助制作人快速确定歌曲旋律,这对前期词曲阶段和编曲阶段都会有很大的帮助,可以达到成品80%左右的样子,后期可以再往上提升,或者找到一个更合适的歌手,替换成更好的声线。”

“AI歌手具有便利、稳定等优势。具体为,在便利性上,AI歌手可以随时随地工作,而人类工作时间相对固定;在稳定性上,AI歌手状态恒一,人类有突发状况,如情绪不佳、声带受损等。”音乐制作人李召洋在接受记者采访时表示。

据了解,李召洋爱好创作儿童音乐,但目前市场上该类音乐有限,其也苦于找不到合适的歌手(有一定演唱基础的稚嫩童音)来演唱自己的作品,因此接近童声的AI声线成为了他的帮手,他曾使用少女小冰的声音,发表作品《笠翁对韵》,该曲目获得了专业奖项(第5届唱工委音乐奖最佳儿童音乐专辑)提名。

不过,在孙玉镜看来,AI歌手在细节上还没有办法像人类歌手一样呈现出“千变万化”的东西,仍然存在局限性,“虽然现在技术已经改善了非常多,但AI对歌曲的演唱更多还是关注在表达上,对于给人带来的听觉感受等更细微的处理可能会弱一些。最终为歌曲买单的听众,追求的一定是某种感觉,人类歌手在录音棚里现场沟通可以随时呈现出各种不同的变化,来配合‘找感觉’,但如果虚拟歌手想快速调整出这种感觉,是没有办法像人类歌手那么快速实施的。”

另一方面,也有声音认为,AI技术与自然人声,AI歌手与真实歌手并非“势同水火”,AI可以成为人类声音“数字永生”的保障。

如《流浪地球2》中,李雪健由于喉管手术导致声带受损,难清晰咬字。为了让他独特的嗓音呈现出最佳效果,特效人员采用AI工具对其声音进行修复,使之最大限度地保留原声,观众们才能在电影院里重温李雪健的经典音色。此外,如果自然人歌手主动向AI授权了自己的声音,并谈好AI歌曲发布后的收益分成,这也未尝不是让AI翻唱“进入阳光下”的一种有益尝试。

小冰公司透露,已有真人歌手主动授权公司“克隆”自己的声音,来保留巅峰状态。歌手能决定AI声音的用途并取得相关收益。经过本人训练调优,AI声音将有机会获得更好的表现。当市场出现越来越多“正版”声音,良币驱逐劣币,或许能解决“孙燕姿们”的问题,也能给予音乐创作者更多选择,这或许是“AI孙燕姿们”合法化的第一步。

在李陶看来,AI孙燕姿类音色替换技术需要表演者的授权,因为表演者可能不愿意别人这么做,而AI歌手则不牵扯这种问题,“总体上看这是一种新的产品类型,应当中立的判断,无所谓价值上的肯定或否定。”

(文章来源:新京报)