AI技术的发展,让人们在进行音画素材创作时有了更加丰富的音色选择。但是,当人们在各类音源中挑选自己心仪的音色时,却想不到其中可能存在侵权“声音”。
4月23日,北京互联网法院一审开庭宣判全国首例AI生成声音人格权侵权案。法院判决,作为配音师的原告,其声音权益及于涉案AI声音,被告方使用原告声音、开发涉案AI文本转语音产品未获得合法授权,构成侵权,赔偿原告各项损失25万元,并书面赔礼道歉。
该判决明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音。AI生成声音可识别性的认定应综合考虑行为人使用情况,并以相关领域普通听众能否识别作为判断标准。
该案中,原告殷某是一名配音师,发现他人利用其配音制作的作品在多个知名APP广泛流传。这些作品中的声音来自于北京某智能科技公司运营的平台中的文本转语音产品,用户通过输入文本、调整参数,可实现文本转化成语音的功能。
据了解,殷某曾接受北京某文化传媒公司的委托录制录音制品。该公司将殷某为其录制的音频提供给一家软件公司,允许其以商业或非商业的用途使用、复制、修改数据用于其产品及服务。该软件公司将殷某的音频作为素材进行AI化处理,生成了涉案文本转语音产品并在上海某网络科技公司运营的云服务平台对外出售。北京某智能科技公司正是通过第三方北京某科技发展公司采购,获得了涉案文本转语音产品,并在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。
殷某认为,上述几家公司的行为已经严重侵犯了其声音权益,应当赔偿自己经济损失和精神损失。
法院审理认为,自然人声音以声纹、音色、频率为区分,具有独特性、唯一性、稳定性特点,能够给他人形成或引起一般人产生与该自然人有关的思想或感情活动,可以对外展示个人的行为和身份。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上,通过该声音特征能识别出特定自然人。利用人工智能合成的声音,如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格,关联到该自然人,可以认定为具有可识别性。
本案中,因被告某软件公司系仅使用原告个人声音开发涉案文本转语音产品,而且经当庭勘验,该AI声音与原告的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与原告有关的思想或感情活动,能够将该声音联系到原告本人,进而识别出原告的主体身份。因此,原告声音权益及于涉案AI声音。
法院认为,被告北京某文化传媒公司、某软件公司未经原告许可AI化使用了原告声音,构成对原告声音权益的侵犯,其侵权行为造成了原告声音权益受损的后果,应承担相应的法律责任。被告北京某智能科技公司、上海某网络科技公司、北京某科技发展公司主观上不存在过错,不承担损害赔偿责任。因此,综合考量被告侵权情节、同类市场产品价值、产品播放量等因素,对损害赔偿予以酌定。
最终,法院判决被告北京某智能科技公司、某软件公司向原告赔礼道歉,被告北京某文化传媒公司、某软件公司向原告赔偿损失共计25万元。
法官释案
未经许可擅用他人声音构成侵权
北京互联网法院副院长赵瑞罡表示,《民法典》将人格权独立成编,明确参照适用肖像权的形式保护自然人的声音,体现了对人格权益全面尊重和保护的立法精神。随着互联网和人工智能不断发展,AI技术在各领域广泛应用,由AI技术引发的侵害人格权纠纷日渐增多。值得注意的是,声音作为一种人格权益,具有人身专属性,任何自然人的声音均应受到法律的保护,对录音制品的授权并不意味着对声音AI化的授权,未经权利人许可,擅自使用或许可他人使用录音制品中的声音构成侵权。 (桑雪骐)