7月18日,“2024年AIGC数据应用大会”在中国北京成功举办。博特智能作为《生成式人工智能数据应用合规指南》的起草单位之一,被授予“团体标准起草人证书”。
博特智能参与起草的《生成式人工智能数据应用合规指南》团体标准聚焦AIGC数据全生命周期的合规使用,为企业利用AIGC技术提供服务过程中涉及数据应用的各个环节,提供了可借鉴参考的具体合规手段、合规体系和管理方法。内容方面,《标准》给出了生成式人工智能服务在数据采集、数据标注、训练数据预处理、模型训练与测试、内容生成服务等各个数据应用环节中应遵循的数据应用合规原则、合规要求与具体合规细节。
《生成式人工智能数据应用合规指南》由国家工业信息安全发展研究中心(工业和信息化部电子第一研究所)牵头研制,中国电子商会归口管理,是“国内首部”聚焦生成式人工智能数据全生命周期合规使用的标准。
AIGC服务通常会涉及到数据获取、数据预处理、模型训练以及输出内容等各方面,这些都可能会涉及到专利、著作权和商业秘密等多种知识产权客体,属于侵权纠纷高发区。比如,算法模型训练的输入数据可能涉及到版权保护的作品、个人隐私数据或商业秘密;AIGC产品生成的文本和图片可能与某些知名文学作品或绘画相似。
针对知识产权合规保护,不同的角色存在不同的视角。技术开发方会重视数据来源、数据许可、数据合规等问题,而技术使用方则会更加强调版权风险、隐私风险等问题。博特智能从行业健康发展角度提出以下几点建议:
·在使用数据之前进行彻底的版权调查,确认数据不侵犯他人的版权,其中包括核实数据是否受版权保护、是否存在使用限制或特定许可要求等,要求AI企业公开其训练数据的来源和使用情况,增加AI模型服务的透明度;
·建立健全的数据管理、保护机制,制定相关的数据管理流程,明确记录数据的归属权和使用规则;
·在产品发布前,AIGC服务提供者应细化有关的知识产权保护策略,至少从风险防范和诉讼的角度去规划自身的知识产权合规体系;
·依托建立后的知识产权评估体系,对采集+训练+生成+服务的产业闭环进行知识产权合规性评价;
AIGC数据全生命周期的合规使用不仅涉及技术层面的数据管理与保护,还涉及法律层面的知识产权保护和伦理层面的社会责任,应对生成式人工智能带来的安全挑战,需要全体AIGC数据服务提供者共同遵循。