中国消费者报报道(记者桑雪骐)AI技术的发展,让人们在进行音画素材创作时有了更加丰富的音色选择。但是,当人们在各类音源中挑选自己心仪的音色时,却想不到其中可能存在侵权“声音”。4月23日,北京互联网法院一审开庭宣判全国首例AI生成声音人格权侵权案,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音。AI生成声音可识别性的认定应综合考虑行为人使用情况,并以相关领域普通听众能否识别作为判断标准。
全国首例AI生成声音人格权侵权案一审现场。资料图片
当下,互联网、人工智能快速发展,声音的记载、利用与传播的方式正经历着前所未有的变革,声音与人格的关联变得愈发紧密,声音的利用价值愈发凸显。《民法典》第一千零二十三条规定,对自然人声音的保护参照适用肖像权的保护,明确将声音权益作为特殊的人格利益予以保护。但随着AI语音合成技术的广泛应用,声音被收集、合成、制作、模仿甚至篡改的现象越来越普遍,对声音权益的保护提出了前所未有的挑战。
据了解,原告殷某是一名配音师,发现他人利用其配音制作的作品在多个知名APP广泛流传。这些作品中的声音来自于被告一北京某智能科技公司运营的平台中的文本转语音产品,用户通过输入文本、调整参数,可实现文本转化成语音的功能。
原告表示,曾接受被告二北京某文化传媒公司的委托录制录音制品,被告二为录音制品的著作权人。后被告二将原告为其录制的录音制品的音频提供给被告三某软件公司,允许被告三以商业或非商业的用途使用、复制、修改数据用于其产品及服务。被告三仅以原告录制的录音制品作为素材进行AI化处理,生成了涉案文本转语音产品并在被告四上海某网络科技公司运营的云服务平台对外出售。被告一北京某智能科技公司与被告五北京某科技发展公司签订在线服务买卖合同,由被告五向被告三下单采购,其中包括了涉案文本转语音产品。被告一北京某智能科技公司采取应用程序接口形式,在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。
原告主张,被告的行为已经严重侵犯了其声音权益,被告一北京某智能科技公司、被告三某软件公司应立即停止侵权、赔礼道歉,5被告应当赔偿原告经济损失、精神损失。
法院审理认为,自然人声音以声纹、音色、频率为区分,具有独特性、唯一性、稳定性特点,能够给他人形成或引起一般人产生与该自然人有关的思想或感情活动,可以对外展示个人的行为和身份。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上,通过该声音特征能识别出特定自然人。利用人工智能合成的声音,如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格,关联到该自然人,可以认定为具有可识别性。
本案中,因被告三某软件公司系仅使用原告个人声音开发涉案文本转语音产品,而且经当庭勘验,该AI声音与原告的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与原告有关的思想或感情活动,能够将该声音联系到原告本人,进而识别出原告的主体身份。因此,原告声音权益及于涉案AI声音。
法院判定被告一北京某智能科技公司、被告三某软件公司向原告赔礼道歉,被告二北京某文化传媒公司、被告三某软件公司向原告赔偿损失共计25万元。
“《民法典》将人格权独立成编,明确参照适用肖像权的形式保护自然人的声音,体现了对人格权益全面尊重和保护的立法精神。”北京互联网法院副院长赵瑞罡对《中国消费者报》记者表示,随着互联网和人工智能不断发展,AI技术在各领域广泛应用,由AI技术引发的侵害人格权纠纷日渐增多,北京互联网法院审理了如“利用AI陪伴软件侵害人格权案”等典型案件。值得注意的是,声音作为一种人格权益,具有人身专属性,任何自然人的声音均应受到法律的保护,对录音制品的授权并不意味着对声音AI化的授权,未经权利人许可,擅自使用或许可他人使用录音制品中的声音构成侵权。