最近,广东省公布了最新一批的大模型备案(登记)名单,很多准备要做大模型备案的企业都在纷纷咨询:
“大模型备案的周期是多久?”
“做大模型备案有什么要求?”
“做大模型备案一共需要准备多少材料?”
在2025年8月8日,广东省发布了最新一批的已备案(登记)名单,广东省地区新增14款已备案的大模型,新增6款已登记大模型。截止八月广东省累计已完成80款大模型备案,23款大模型登记。
一、大模型备案整体周期
大模型备案是由属地网信办初审,中央网信办复审。不同地区的备案要求不同,备案材料也大同小异,审核的进度也不同,备案周期也不相同。从准备材料到获取备案号,全国大多数地区备案周期在 5-8 个月左右,北京地区则长至 8-10 个月左右。
二、大模型备案的前提要求
- 主体资质
企业需在中国境内注册,具备独立法人资格。外资企业需符合数据跨境流动相关规定。
2. 数据合规
训练数据需确保来源合法,不得包含侵权、违法或未授权数据。
3.内容安全审核机制
需建立人工 + AI 审核机制,防止生成违法、虚假或有害信息。同时提供用户举报和申诉渠道,确保可追溯、可处置。另外,需提交安全评估报告,说明模型可能存在的风险及应对措施。
4.模型完成度要求
产品已达上线前最后阶段,已经完成内测,有可对外的产品或者demo
三、大模型备案的材料
不同地区对于备案材料的具体要求也是大同小异的,我将列出大致相同的材料,具体细则还需要因地制宜,不清楚要求的小伙伴可以在评论区说出你的备案地区,我帮你看一下当地要求。
- 生成式人工智能服务上线备案表
需填写模型名称、版本号、应用领域等基本信息,明确面向的用户群体、具体服务内容等服务范围,说明训练算力资源、训练语料来源等研制信息,以及保障数据安全等方面的措施。
- 安全评估报告
是备案核心材料,需依据相关国家标准编写,通常超过 100 页。内容包括语料安全评估、应急响应预案等,要详细说明训练数据来源、分析语料中违法不良信息占比等。
- 模型服务协议
需明确用户隐私条款,包括用户数据的收集、使用等规定,提供用户投诉举报渠道和处理流程,界定开发者责任限制和免责范围等。
- 语料标注规则
需详细阐述训练语料标注的目标、方法、流程、质量控制标准等内容。
- 拦截关键词库
需建立覆盖至少 17 类安全风险的拦截关键词库,总规模建议不少于 1 万词,且应根据实际情况动态更新。北京地区的拦截关键词数量要求20w-50w
- 评估测试题集
是一套用于测试大模型安全性和合规性的问题集合,应覆盖各类风险场景,测试结果通常作为安全评估报告的支撑材料。北京地区的测试题数量要求是5w
- 其他辅助材料
包括模型训练数据来源及知识产权合规性说明、安全负责人和技术负责人任命文件及联系方式、网络安全等级保护备案证明(如适用)、测试账号及使用说明等。
四、大模型备案流程
(1)向属地网信办报备,获取上线备案表
根据大模型的规模、服务范围和影响,确定是否可以备案。准备初步的备案申请材料,包括企业资质、大模型简要介绍、安全评估初步构想等。
(2)全面准备材料与自查自测
根据网信办提供的备案表要求和评估要点,系统性地准备各项备案材料。企业需组织内部力量进行严格的自评估和自测试,重点关注:应答 / 拒答的准确率、生成内容的合规率、关键词拦截的有效性、训练语料来源的合法性、各项安全保障措施是否健全到位等
(3)编写材料,准备测试账号
确保所有提交的材料之间信息一致,逻辑清晰,避免出现矛盾之处。仔细检查材料中的文字表述、格式规范、数据准确性等细节问题,确保材料的质量和专业性。准备专门用于审核测试的账号,并提供详细的使用说明,以便审核人员能够顺利进行模型功能和安全性测试。
(4)提交材料至属地网信办初审
将完整的备案材料提交给属地网信办,网信办将对材料进行形式审查,组织专家对模型进行初步的技术评估,包括模型的功能实现、安全机制、数据处理等方面。
(5)等待审核结果并整改
审时间通常需要数周甚至数月,具体取决于当地网信办的工作效率和备案申请的数量。如果审核未通过,网信办会说明未通过的原因和需要整改的内容。企业需根据反馈意见,认真整改问题,
(6)中央网信办终审
中央网信办对上报的备案材料进行全面审查,包括对模型的技术安全性、数据合规性、内容管理能力等进行深入评估。可能会组织更高级别的专家团队进行评审,或者征求其他相关部委的意见。终审过程相对严格和复杂,需耐心等待结果。
(7)公示与获取备案号
若终审通过,中央网信办将在官方平台上对备案信息进行公示,公示期一般为若干个工作日。
公示无异议后,企业将获得正式的备案编号,标志着大模型备案成功完成。企业可在相关业务中合法使用该模型提供服务。
以上就是本篇文章的全部内容,希望对备案的小伙伴有所帮助,有其他备案问题的欢迎在评论区交流~