10月13日消息,全国信息安全标准化技术委员会在其官网发布《生成式人工智能服务安全基本要求》(征求意见稿),现正面向社会公开征求意见。意见/建议收集截止时间为2023年10月25日24:00。据悉,这是国内首个专门面向生成式AI安全领域的规范意见稿,也是对7月网信办等七部门推出的《生成式人工智能服务管理暂行办法》的支撑。

征求意见稿首次提出生成式AI服务提供者需遵循的安全基本要求,涉及语料安全、模型安全、安全措施、安全评估等方面。

1、在语料安全要求方面,征求意见稿从来源安全、内容安全、标注安全三方面提出了要求。提供者要建立语料来源黑名单,单一来源语料内容中含违法不良信息超过5%的就要“拉黑”。

2、在模型安全要求方面,征求意见稿从基础模型使用、生成内容安全、服务透明度、内容生成准确性、内容生成可靠性五大方面做出了严格要求。不应使用未经主管部门备案的基础模型,应在网站首页等显著位置向社会公开第三方基础模型使用情况等信息。

3、在安全措施要求方面,征求意见稿从模型适用人群、场合、用途,个人信息处理,手机使用者输入信息用于训练,图片、视频等内容标识,接受公众或使用者投诉举报,向使用者提供生成内容,模型更新、升级,这七大方面提出了要求。

4、在安全评估要求方面,征求意见稿从评估方法、语料安全评估、生成内容安全评估、内容拒答评估四方面给出了十分具体的参考。比如:在语料安全评估方面,提供者对语料安全情况进行评估时,要采用人工抽检,从全部训练语料中随机抽样不少于4000条语料,合格率不应低于96%。

5、此外,征求意见稿还提出了一些其他要求,涉及关键词库、分类模型、生成内容测试题库、拒答测试题库等方面。