刘德华雷军成受害者 揭秘AI合成名人乱象

版次:004    2025年02月18日

AI人工智能的发展为我们的生活带来了许多便利,然而也引发了一些乱象。以AI语音合成技术为例,只要提取一个人足够的声音样本,就能“克隆”出他的声音,制作出AI人声视频。近期,网络短视频平台上就出现了这样一类视频,视频中AI合成的声音与一些名人相似度极高,让网友真假难辨。视频内容包括恶搞调侃等,其中甚至还有不雅词汇,造成不良社会影响引发争议。

近日记者调查发现,实现AI深度合成音视频并不算难事,甚至在一些购物平台,AI深度合成技术已经成为众多网店牟利的工具,只需花费几十元,就可定制AI深度合成名人音视频。这样随意使用名人声音的行为是否合法?又该如何监管呢?

滥用公众人物声音 生成音频仅需20秒

记者在社交软件上检索AI配音发现,不少用户发布了相关视频的生成教程。其中,大部分视频的配音都源于某拟真语音大模型应用。在用户推荐的一个应用网站上,创作者上传任意人物的一段音频作为训练素材,随后AI通过学习可克隆出一个声音角色。网站中的其他用户只需输入文本,便可以使用该声音生成内容。按照该网站的使用指引,记者添加了一位知名企业家的声音角色,输入一段100字的文本,然后点击“开始生成”,约20秒,一条与该企业家声音相似度极高的AI音频就生成了。记者发现,截至目前,该声音角色已被使用79.9万次,生成字符数达4455.5万个。

利用这类工具或网站,网友可以自己采集一段名人的声音放到AI软件中,软件就能模拟名人的声音朗读文本内容。同时,短视频平台上还有大量的视频主播在教如何用AI合成名人的声音,一些网络主播甚至鼓励网友用名人的声音去进行带货等商业活动。

据了解,被“偷走”声音的公众人物非常多,比如雷军、张文宏。去年9月底,一段据称是某直播平台老板卢某某的酒后录音在网络上流传,整体呈现出卢某某对于消费者的傲慢态度,以及对相关人士的不尊重表达,为该平台招致了不小的争议。后警方调查发现,音频内容不实,系大模型伪造而成。此前还曾有网友曾利用AI制作的刘德华声音,为自己博取流量,刘德华电影公司还紧急发布声明提醒网民,不要落入伪造刘德华声音的AI语音合成技术骗局。

AI声音合成技术已较成熟 能以假乱真模仿任何人

这些AI深度合成的声音是如何制作出来的?记者调查发现,除了之前提到的应用网站,相应的深度合成软件在网络上下载也并不难,而且还有一些网络主播会开直播教网友如何使用。记者在手机应用商城搜索换声换脸,立刻出现众多App工具。不过记者发现换脸工具,设定了固定的场景,且从效果看逼真度不高。那么那些网店中逼真度高的AI深度合成的声音和换脸是如何做到的呢?

中国网络空间安全协会人工智能安全治理专业委员会专家薛智慧介绍,声音合成和换脸的软件目前在网络上有数十种,不过不论换声还是换脸软件,不同的场景需要调整相应的参数,步骤较多,属于半专业软件,有一定的技术门槛,所以不被网民熟知。当前AI声音合成技术背后,主要应用的是人工智能的深度学习算法,通过AI模型,对采集的声音样本进行处理,从而实现声音的“克隆”:“这个合成过程中主要涉及了两个子模型,第一个子模型主要对语言的基础进行处理,比如说它的内容、语速、语调以及情感等进行处理。第二个是音色模型,主要对第一个模型里生成的语言加上音色的信息,最终进行合成。”

AI声音合成技术到底可以逼真到什么程度?一位业内人士透露,通过模仿音频样本的语调、语速、情感、口音、发声方式等特征,AI技术已经能够高度还原音频样本的声音,达到人耳和其他鉴定方式难以区分的程度。“从早期的‘一眼假’到如今的‘真假难辨’,AI的发展进入了‘深度伪造’时代。”中国社会科学院大学法学院副教授、互联网法治研究中心主任刘晓春向记者表示,在未经过授权、未进行标注的情况下,用他人声音制作AI语音产品,尤其是“借用”公众人物的声音,很容易引起误解,这不仅会侵害个人信息安全,还可能扰乱网络空间生态秩序。

律师说法

自然人声音受法律保护 可追究发布者的刑事责任

当前,不少网友在合成他人的AI音频时,仅抱着娱乐心态,并没有意识到背后隐藏的法律风险。记者注意到,在一条“AI配音教程”视频的评论区,有学员提问:“这样不侵权吗?”博主回复称:“大家都在做,如果提示违规,删了就行了。”AI合成的公众人物声音真的可以随意拿来为自己所用吗?《中华人民共和国民法典》第1023条规定,对自然人声音的保护,参照适用肖像权保护的有关规定。对这条规定,具体应该如何理解呢?

中国政法大学副教授朱巍告诉记者:“我们现在看到的一些编辑的人脸,包括声音在内,实际上按照民法典的规定,都属于当事人权利人自己的人格权利,未经允许的话,任何人是不得侵害的。不仅不能直接使用,也不能使用当事人的人脸信息、声音信息进行深度合成,不能把它放到这个深度合成的物料库里或场景库里。同时,通过编辑的肖像和声音,用这种方式展现出的相关内容,属于伪造的信息,按照网络安全法的规定,这个属于违法信息。另外,使用AI合成名人的声音发表自己的作品,有可能会追究发布者的刑事责任。”

朱巍还表示,未经权利人同意随便使用别人的肖像和声音,并且对外发布的话,按照民法典的规定是一种侵权责任,要承担包括精神损害赔偿在内的相关责任。如果把相关的视频,包括声音编辑之后形成了相关的内容,如果这个内容违反了网络安全法的相关规定,当事人可能要承担包括刑事责任在内的法律责任。

热评

治理AI语音乱象

得亮出“关键三招”

AI语音合成技术制作的知名企业家吐槽视频,在网络上如病毒般迅速传播,致使不少人信以为真。这一现象带来的危害是多方面且极其严重的。若此类行为得不到及时制止,每个人都将在数字世界中陷入极度的不安全之中,因为谁也无法预料自己是否会成为下一个受害者。

AI语音合成技术的滥用对信息传播的真实性和可信度发起严峻挑战。在信息爆炸的时代,人们依赖准确的信息来做出明智的决策、形成客观的观点。然而,当虚假的声音充斥着网络空间,会逐渐削弱人们对整个信息环境的信任。长此以往,人们可能会对所有信息都持怀疑态度,如同惊弓之鸟,这将对社会的交流和发展造成巨大阻碍,使信息传递与交流陷入困境,阻碍社会进步的车轮。面对严峻的AI语音乱象,亟待从多方面进行规制整顿,以勒住这匹脱缰之马,引导其回归正轨,为人类社会的发展贡献积极力量。

技术层面,研发者需加强对技术的监管和改进,这是解决问题的关键基础。譬如,可以大力开发更为先进的识别技术,如利用生物特征识别技术,对声音的独特特征进行更为精准的分析和验证。通过这种方式,如同为声音装上了“指纹识别器”,能够在源头上有效减少虚假音频的传播,让虚假声音无处遁形。同时,对于AI软件的使用,必须建立严格的授权和审核机制,防止未经授权的声音被采集和滥用,确保技术在合法、合规的轨道上运行。只有从技术层面筑牢防线,才能为解决AI语音乱象提供强有力的支撑。

法律层面,需完善相关法律法规,明确对AI语音合成技术滥用行为的清晰界定和严厉的处罚标准。对于那些侵犯个人权益、恶意造谣生事等行为,要给予毫不留情的法律制裁,让违法者付出沉重的代价。同时,加强对网络空间的全方位监管,加大对违法违规内容的查处力度,净化网络环境,让网络空间恢复清新与纯净。让法律成为维护真实和公平的坚实后盾,为公民的合法权益和社会的公共利益保驾护航。

教育层面,需加强对公众的数字素养教育。提高公众对AI技术的全面认识和深入理解,让人们了解其原理和潜在风险。通过教育,教会公众如何在纷繁复杂的信息海洋中辨别虚假信息,培养他们的批判性思维能力,使他们拥有一双能够识破虚假信息的“火眼金睛”。只有当公众具备了足够的数字素养,才能在网络世界的喧嚣中保持清醒的头脑,不被虚假信息轻易迷惑,成为信息的理性消费者和负责任的传播者。共同维护信息的真实性和可信度,营造一个健康的信息生态环境。

AI语音合成技术发展势不可挡,但不能让其乱象肆意蔓延。要在享受技术带来便利的同时,坚守真实和道德的底线,构建真实、可信、和谐的数字世界,使AI为人类进步服务,从而在数字化的浪潮中稳健前行,让科技之光真正照亮人类前行的道路,为社会发展注入源源不断的正能量。据新华社、央视、湖北日报