11月14日,中国音像与数字出版协会发布通知,《出版业生成式人工智能技术应用指南》团体标准已完成征求意见稿的起草工作,并就此项团体标准面向全行业广泛征求意见。标准征求意见截止时间为2023年12月3日,请在截止日期之前将意见反馈至协会。
联系人:冯思然
电话:13401184487(同微信)
邮箱:cadpa1994@163.com
《出版业生成式人工智能技术应用指南》团体标准征求意见表 请点击下载。
一、工作简况
1.工作背景
近年来,生成式人工智能技术取得突破性进展,出版业应用生成式人工智能技术已是大势所趋,一种新的内容创作和服务模式将重塑行业发展,全行业将面临着更多挑战与机遇。为推动人工智能技术与出版业的深度融合,规范行业生成式人工智能技术的应用,加强知识产权保护,促进科技向善,由北京印刷学院牵头,联合化学工业出版社、机械工业出版社、人民邮电出版社等行业内具有较大影响力的专业内容出版机构,共同制定该标准。
2.主要工作流程
该项标准于2023年5月立项为中国音像与数字出版协会团体标准,起草组于2023年起研究和整理国内有关生成式人工智能技术方面的政策,并组织出版机构、技术企业开展相关的课题调研工作,梳理有关行业需求。2023年7月起,起草组开始编写标准大纲和工作组稿,在此期间,多次征求相关出版机构、技术企业的意见,形成了标准工作组稿文本。2023年11月10日,协会组织召开了该标准的工作组稿评审会,与会专家认为标准的结构合理,内容基本完整,建议补充有关安全保障措施,突出生成式人工智能技术安全服务的特性。起草组经认真研究修订后,于11月14日形成了可对外征求意见的版本。
二、标准编制原则和确定主要内容的论据及解决的主要问题
1.编制原则
本标准从提供人工智能生成内容技术服务的企业和应用人工智能生成内容技术的出版机构角度出发,在以《生成式人工智能服务管理暂行办法》为支撑的条件下,编制出版业应用生成式人工智能技术的基本原则,主要包括导向性、合规性、隐私和安全性、透明性等十项基本内容。
2.编制参考
在本文件编制过程中,主要参考《生成式人工智能服务管理暂行办法》《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《网络信息内容生态治理规定》等文件内容。
3.标准的主要内容
本文件根据GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的编制要求进行编制,规定了出版业应用生成式人工智能技术的基本原则、主要应用场景、管理机制、知识产权和安全保障等内容。
1 范围
本文件规定了出版业应用生成式人工智能技术的基本原则、主要应用场景和相应的保障措施。
本文件适用于出版机构应用生成式人工智能技术提供的服务。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 35273—2020 信息安全技术 个人信息安全规范
CY/T 96—2013 电子书内容术语
3 术语和定义
CY/T 96界定的以及下列术语和定义适用于本文件。
3.1
生成式人工智能技术 generative artificial intelligence technology
基于算法、模型和大规模语料自动生成文本、图片、声音、视频、代码等内容的自然语言处理技术。
3.2
出版机构 publishing institution
从事出版活动的专业机构。
[来源:CY/T 96—2013,定义4.1.4]
3.3
服务提供者 service provider
以交互界面、可编程接口等形式面向我国境内公众提供生成式人工智能服务的组织或个人。
4 基本原则
4.1 导向性
确保利用人工智能技术生成的内容导向正确,符合国家相关法律法规和伦理准则,尊重社会价值观和道德标准,以促进生成式人工智能技术应用向上向善。
4.2 合规性
用于生成式人工智能技术训练的数据来源合法,尊重知识产权。同时相关服务提供者不滥用市场优势地位,遵守反垄断法规,维护公平竞争环境,促进创新和多样性。
4.3 隐私性
出版机构和服务提供者按照GB/T 35273等国家有关规定要求,在数据收集、存储、使用和共享过程中做好个人隐私的保护。
4.4 安全性
出版机构和服务提供者在数据收集、存储、使用、加工、传输、提供、公开的过程中应提供相关措施确保数据安全和自主可控。同时服务提供者应提供安全、稳定、持续的服务,以保障出版机构和其他用户的正常使用。
4.5 透明性
在应用生成式人工智能技术的过程中,包括出版机构、服务提供者在内的所有参与者都应了解并明确披露人工智能内容生成的使用情况,包括底层数据集、数据来源和数据处理方法等。
4.6 公平性
在训练数据选择、算法设计、模型生成和优化、使用过程中仔细评估和审查潜在的数据和内容偏差来源,同时减少人工智能生成内容在文化或者语言上的不公平现象。
4.7 准确性
对利用人工智能技术进行预训练、优化训练的数据来源应准确、描述应客观和数据应多样,避免虚假信息和误导性的内容传播。
4.8 先进性
出版机构选择具有先进的人工智能生成内容技术和算法模型的服务提供者,即该服务提供者所具有的算法核心指标(例如参数规模)和权威评测得分在行业内达到领先水平。
4.9 适用性
服务提供者提供的人工智能生成内容技术和相应工具应满足出版机构对内容资源管理和应用的需求。
5.0 价值性
出版机构对外提供人工智能生成的内容具有一定的思想性、艺术性、知识性、逻辑性和科学性。
5 主要应用场景
5.1 信息采集
根据市场需求或选题策划,利用生成式人工智能技术在信息搜索、信息整合等方面的能力选取合适的内容用于出版。
5.2 辅助创作
利用生成式人工智能技术工具帮助编辑和作者生成创意写作的草稿内容。
5.3 辅助审核
利用生成式人工智能技术工具,对出版内容是否符合国家有关出版管理的要求进行初步审查,特别是对意识形态、法律法规、敏感内容、版权等方面进行排查,并提供相应的审读报告和标识,供人工审核确认。
5.4 智能编加和校对
利用生成式人工智能技术工具,进行初步的语言学编辑、加工,以及字词错误校对、用语规范性校对、体例格式校对等。排版、版式设计等形式的加工工作也可借助生成式人工智能工具完成。
5.5 宣传推广
利用人工智能技术生成的内容开展新媒体运营、出版内容的推广或者出版机构的品牌营销活动,提升出版机构的品牌影响力以及出版内容的触达率、阅读率和影响力。
5.6 辅助决策
利用生成式人工智能技术具有的数据分析能力,可识别行业发展趋势和模式,指导制定出版计划和战略,以辅助出版决策。
5.7 知识服务
利用生成式人工智能技术,以信息采集、组织分析为基础,根据用户需求和信息环境,提供能够有效支撑知识应用和创新的出版内容服务,且能够注明必要的引用来源和参考文献。
5.8其他场景
出版机构可利用生成式人工智能技术进行出版物封面、插画等内容的辅助设计,出版物内容的辅助翻译、语义分析,数据搜集、整理与分析等工作。
6 管理机制
6.1 出版机构
出版机构在应用生成式人工智能技术和相关工具的过程中应遵循《出版管理条例》《网络出版服务管理规定》和本机构的出版业务流程管理规范等,加强内容筛选、审核和人员培训工作,做好相关内容安全和质量安全管理。
6.2 服务提供者
服务提供者需建立相应的算法机制机理审核、科技伦理审查、用户注册、信息发布审核、数据安全和个人信息保护、安全事件应急处置等方面的管理制度,配备与其服务规模相适应的专业人员和技术支撑。
7 知识产权
出版机构和服务提供者需对人工智能生成内容的使用情况进行充分、正确的披露和声明,未经权利人和相关利益方的具体和明确许可,其不得以任何方式或者授权他人以任何形式将有关作品内容用于生成式人工智能技术的训练。
8 安全保障
8.1 语料安全
出版机构和服务提供者应建立相关的语料来源黑名单,加强对各来源语料的安全评估和标注人员的培训考核,确保用于生成式人工智能技术预训练的语料安全。
8.2 模型安全
服务提供者使用的生成式人工智能技术基础模型,应经国家主管部门备案;对提供的服务使用人群以及使用第三方基础模型情况进行公开;加强对使用者输入信息的安全分析和生成内容准确性方面的评估,以保证服务提供者的模型安全。
8.3 数据安全
在应用生成式人工智能技术时,应按国家有关规定对数据的处理、传输、访问使用有效的加密和控制手段,保障数据安全、保护个人隐私。
8.4 网络安全
按照国家有关规定,配置相应的防火墙、网络监控工具、身份验证措施、接口安全、入侵检测等网络安全措施。
8.5 系统安全
在提供生成式人工智能技术服务时,服务提供者需遵循国家有关规定具有安全的系统架构设计、操作系统和硬件安全保障和应用程序等,以保证系统安全平稳运行。
发表评论前,请先[点此登录]