AI模仿他人声音,侵权边界在哪?从谷歌案看懂声音法律保护逻辑
- LawMay
- 3 days ago
- 7 min read

声音是自然人独有的身份标识,不仅与个体的人格尊严紧密相连,也具备越来越高的商业价值。随着AI语音合成、声音克隆技术普及,未经许可模仿他人声音进行商业使用,已成为高频法律争议。
2026年1月,美国国家公共广播电台(NPR)资深主持人David Greene正式向加利福尼亚州圣克拉拉县高等法院提起对谷歌(Google)的诉讼,指控谷歌旗下的人工智能产品NotebookLM(其中包含声称播客的功能)未经其许可,模仿他具有辨识度的声音特征,包括节奏(cadence)、音调(tone)以及他使用的“呃”等语气习惯(mannerisms)用词,用于商业化产品功能,引发全球对AI声音侵权的关注。目前该案因管辖争议移送联邦法院,仍处于证据开示阶段。

(本案原告David Greene,图源来自Current)
AI语音越普及,法律问题就越集中。用他人音频训练AI是否需要授权?AI声音达到什么程度构成侵权?商业使用如何界定?本文结合国内外案例,把AI声音侵权的实务认定讲清楚。
一、核心争议:未经许可用声音训练AI,是否侵权?
AI语音模型需要依靠大量音频数据训练,提取音色、韵律、语调等特征,再合成新的语音。由此产生一个关键问题:未经权利人同意,将他人的公开音频用于AI模型训练,并商业化输出相似声音,是否侵害声音利益。从技术实现来看,AI语音模仿并不一定需要完整复制原录音,而是通过算法提取声音特征并重构,但这种“非复制性使用”依然可能构成法律意义上的“使用”。
在美国纽约南区联邦地区法院审理的Lehrman v. Lovo一案中,AI公司以“研究测试”为名获取配音演员录音,未经许可用于模型训练并商业化销售克隆语音。法院虽未支持版权(Copyright)侵权主张,但认可了人格标识商业利用具有的可诉性。
对比中国司法实践,我国《民法典》明确规定,对自然人声音的保护参照适用肖像权保护的有关规则。殷某某诉某智能科技公司案明确指出,声音人格利益具有独立性,由于“投喂”训练素材需要使用自然人原本的声音,若未经自然人许可就直接利用人工智能处理并使用其声音,构成对声音权益的侵犯。
二、认定关键:声音必须具备“可识别性”
无论在美国还是在中国,“可识别性”均为侵权成立的基础性要件,即一般听众一听就能把AI声音对应到特定某个人,不需要完全一模一样。
在Lehrman v. Lovo案的驳回动议(motion to dismiss)审查阶段,原告主张AI克隆声音与其本人原声几乎一致、具有高度可识别性。法院认为,就前期起诉充分性而言,这一主张已足以通过驳回动议审查,因此允许其依据纽约法提出的擅自使用他人声音的(misappropriation of a voice)主张继续推进。

Greene案中,原告也是通过主张NotebookLM的AI语音与Greene原声在音色、语调、语癖等方面高度相似,能够使亲友、听众混淆,具有“可识别性”,进行维权。


(上图为谷歌案原告Greene指控谷歌侵权的证据,
包括网友比对声音的帖文及独立软件公司的声音取证分析)
中国司法实践中,除了依靠声纹辨认、声纹确认的客观标准进行判定,还结合使用方式,将新的声音的音色、语音语调、发音风格等与自然人声音作对比,并根据自然人的社会知名度,采取一般社会公众、一定范围内公众的主观标准进行综合判断。
著名演员温峥嵘AI侵权案是近期极具代表性的AI声音与肖像双重侵权热点事件。不法分子未经许可,利用AI深度合成技术伪造温峥嵘的面部形象与声音特征,用于网络直播带货、营利性宣传,相关内容足以使普通公众产生混淆,具有高度可识别性,已严重侵害其声音权益与肖像权。目前该案已刑事立案,不仅体现了AI伪造人格标识的民事侵权属性,更表明情节严重时将触及刑事犯罪,为AI声音侵权的实践认定与法律责任承担提供了重要现实参考。

(图源来自法治在线)
三、商业使用:只要为营利目的,即可能落入规制范围
加州民法典(California Civil Code)第3344 (a)条明确将声音纳入公开权保护范围,只要未经同意,将他人声音用于产品、广告、销售或招揽客户等商业目的,均构成侵权。
(CA Civ Code § 3344(a): Any person who knowingly uses another’s name, voice, signature, photograph, or likeness, in any manner, on or in products, merchandise, or goods, or for purposes of advertising or selling, or soliciting purchases of, products, merchandise, goods, or services, without that person’s prior consent.)
Greene案中,涉案AI语音是NotebookLM产品功能的组成部分,谷歌通过该工具提升用户体验与产品竞争力,已具备明显商业属性。
在纽约州公民权利法(New York Civil Rights Law)的第50条中规定,禁止未经书面同意,为广告/商业目的使用他人姓名、肖像、图片、声音。
(N.Y. Civ§50:A person, firm or corporation that uses for advertising purposes, or for the purposes of trade, the name, portrait, picture, likeness, or voice of any living person without having first obtained the written consent of such person, or if a minor of such minor's parent or guardian, is guilty of a misdemeanor.)
Lehrman v. Lovo案中,被告将AI克隆语音打包上架,以订阅模式对外销售,属于典型商业利用,法院据此认定符合公开权侵权的构成前提。
美国侧重州公开权的财产权保护,中国则基于人格权体系保护声音权益,对于商业使用的认定更宽泛。但总的来说,无论是美国还是中国,认定AI声音侵权只需抓住三条核心:
未经权利人许可
AI声音具有可识别性
用于商业或营利目的
四、为什么AI声音案件打的往往不是版权,而是“声音身份权”?
.png)



Comments