近日,文心大模型与百度大模型内容安全平台——红线大模型双双荣获中国信息通信研究院泰尔认证中心颁发的“大规模预训练模型(文本生成功能)安全认证证书”,且二者的认证级别皆“增强级”的最高级别。

1.png
大规模预训练模型(文本生成功能)安全认证证书

本次认证基于《电信和互联网大规模预训练模型安全评测指标和方法》(TLC 073-2024),此标准由中国信息通信研究院牵头制定,旨在为大规模预训练模型提供安全评测的风险项、指标和方法,系统地评估大模型在59种内容安全风险中的表现。认证分为“基础级”和“增强级”两个层级,适用于大规模预训练模型研发、使用和运营机构,全面客观地衡量大规模预训练模型因自身技术局限或遭滥用和恶意使用而带来的国家安全、公共安全、伦理安全和行业安全风险,可在研发完毕测试、上线前使用以及进行算法备案前使用。其中,百度大模型内容安全平台——红线大模型在网络安全、内容安全、隐私数据安全、模型安全、模型幻觉抑制等诸多评测项目中均表现优异,荣获此次测评中“增强级”的最高级别认证。

大模型作为新质生产力,在千行百业中展现出强大创新潜力。然而,其技术特性带来的安全风险也正引发全球关注。在大模型推理场景中,用户输入内容与模型生成内容中存在的涉政、涉黄、不良价值观、违法犯罪等风险已被人们所熟知。更为严峻的是,OWASP大模型TOP10脆弱性风险揭示了代码攻击、提示词注入、多轮越狱等高级攻击手段的威胁。这些攻击方式利用大模型的语言理解能力,通过精心设计的输入来绕过安全机制,实现恶意目的。此外,针对接口的AIGC盗爬、以消耗算力为目的的资源侵占攻击等,也对模型的稳定运营构成了直接且持续的威胁。这标志着,通用大模型的安全防线必须从内容过滤,延伸至对模型认知过程的深度防护。

基于大模型安全护栏建设的理念,百度大模型内容安全平台正式更名为百度大模型安全护栏。其核心在于通过构建专属的安全红线大模型,大幅降低模型拒答率,并支持风险问题的正向引导和纠偏,为行业提供了一套系统性的大模型安全解决方案。针对大模型推理服务场景存在的模型滥用、算力消耗、隐私泄露、内容违规等风险,百度大模型安全护栏提供接入成本低、一站式的大模型输入、输出安全护栏服务:

2.png
百度大模型安全护栏

内容安全检测:构建多模态内容安全检测大模型与风险代答模型,精准理解用户意图,并针对风险提问进行错误纠偏与正向引导,在守住内容安全“生命线”基础上,同时又彻底告别“一刀切”式拒答的僵硬模式。

3.png
百度大模型安全护栏——功能框架

高级攻击检测:围绕OWASP TOP 10中攻击模式,构建恶意意图与恶意形式检测的大语言模型,支持识别目标劫持、反向抑制、肯定前缀、角色扮演、提示词泄露、混淆编码等多种高级攻击类型。

4.png
百度大模型安全护栏——高级攻击检测
​​

敏感信息检测:建设丰富的敏感信息检测能力,包含姓名、身份证号码、手机号码、护照号码、驾驶证号码、住址、邮件地址等数十种个人敏感信息,并提供脱敏能力,避免敏感信息输出导致的舆情风险。

网址安全检测:基于百度丰富的网址黑库数据积累,构建数据爬取与规则检测引擎,提供假冒网站、虚假中奖、虚假金融证券、诈骗网站、色情网站、博彩网站等违规网站检测能力,避免用户通过对话将违规网站投毒到模型中,也避免模型输出对于违规网站信息进行解读的内容。

5.png
百度大模型安全护栏——网址安全检测

算力消耗检测:建设完备的规则引擎,针对诱导模型生成长token的提问请求进行监控及拦截,同时支持检测异常IP、异常聚集行为等违规接口调用请求,保障模型资源不被恶意消耗而影响正常用户使用。

百度安全始终积极探索大模型内容安全领域的各种挑战,致力于建设更加安全与健康的大模型发展生态,保障大模型在广泛应用中的安全性和可信度,助力大模型在为企业创造价值的同时,保障个人隐私和信息安全。并提供更加智能、人性化的服务,与产业各方共同努力,携手千行百业建立起覆盖全生命周期的安全防护体系,为开源大模型实现普惠发展、为社会带来更大价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89910.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89910.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/89910.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

香港服务器查询缓存禁用-性能优化关键技术解析

在香港服务器运维过程中,查询缓存禁用是提升数据库性能的关键操作。本文将深入解析禁用查询缓存的原理、操作步骤、适用场景及注意事项,帮助管理员优化MySQL服务器配置,解决高并发环境下的性能瓶颈问题。香港服务器查询缓存禁用-性能优化关键…

深度学习图像分类数据集—七种动物识别分类

该数据集为图像分类数据集,适用于ResNet、VGG等卷积神经网络,SENet、CBAM等注意力机制相关算法,Vision Transformer等Transformer相关算法。 数据集信息介绍:七种动物识别分类:[Chinese_Merganser, panda, Sika_Deer, …

ubuntu22桌面版中文输入法 fcitx5

不要去 ubuntu software 下载 fcitx5 快捷键用不了 直接 sudo apt install fcitx5 \ fcitx5-chinese-addons \ fcitx5-frontend-gtk4 fcitx5-frontend-gtk3 fcitx5-frontend-gtk2 \ fcitx5-frontend-qt5不要在fcitx5里面设置快捷键,有些应用可能无法生效 在设置里全…

推客系统小程序终极指南:从0到1构建自动裂变增长引擎,实现业绩10倍增长!

📌 前言:为什么传统营销越来越难做?在流量红利消失的今天,企业普遍面临三大增长困境:获客成本飙升:电商、教育等行业单客成本突破500元,ROI持续走低用户粘性差:90%的活动用户只参与一…

【数据结构】排序算法:归并与堆

归并排序:分治策略的经典实现 算法原理 归并排序采用分治法策略,包含三个关键步骤: 分解:递归地将数组分成两半 解决:对子数组进行排序 合并:将两个有序子数组合并为一个有序数组 C语言实现 #includ…

机器学习-CatBoost

参考书籍:《机器学习-公式推导和代码实现》 官方文档提供的原生接口代码参考书籍的P187~P188 简介 全称是Categorical Boosting,由俄罗斯搜索引擎巨头Yandex于2017年提出。突出的优势是在于可以高效地处理数据中的类别特征 ML中对类别特征…

MPLS 多协议标签交换

前言: 多协议标签交换MPLS(Multiprotocol Label Switching)是一种IP(Internet Protocol)骨干网技术。MPLS在无连接的IP网络上引入面向连接的标签交换概念,将第三层路由技术和第二层交换技术相结合&#xf…

CTF Web PHP弱类型比较与布尔值判断

题目源码与注释 <?php show_source("index.php"); // 显示自身源码&#xff0c;方便分析 include("flag.php"); // 包含flag变量 $a $_GET[a]; // 获取GET参数a&#xff0c;抑制报错// 关键判断 if($a 0 and $a){echo $flag; …

AntV G6动态连线

完整代码如下 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>AntV G6 动态连线</titl…

puppeteerSharp html转pdf

部属到linux 上报错&#xff1a; Failed to launch browser! /wwwroots/xxx/Chrome/Linux-138.0.7204.92/chrome-linux64/chrome: error while loading shared libraries: libatk-1.0.so.0: cannot open shared object file: No such file or directory 问题服务包缺少依赖&…

springBoot接口层时间参数JSON序列化问题,兼容处理

背景&#xff1a;解决前端传入时间参数格式不固定场景&#xff0c;避免接收参数报错时间格式不能序列化。一、概述在 Java 后端开发中&#xff0c;处理 JSON 数据时&#xff0c;经常需要对日期时间字段进行反序列化。Java 中常用的日期时间类型是 java.time.LocalDateTime&…

List、Set、Map三者之间的关系

1、数据结构与核心特性接口数据结构顺序性唯一性键值对null 元素List动态数组/链表有序&#xff08;插入顺序&#xff09;允许重复否允许多个 nullSet哈希表 / 红黑树无序&#xff08;HashSet&#xff09;有序&#xff08;LinkedHashSet/TreeSet&#xff09;不允许重复否仅 Has…

进程控制----进程终止

一、进程终止的核心场景正常终止&#xff08;代码完整运行完毕&#xff09;成功&#xff1a;进程执行到main函数结束或调用exit()&#xff0c;返回退出码 0&#xff08;约定为执行成功&#xff09;。失败&#xff1a;代码执行完毕但结果异常&#xff0c;返回非零退出码&#xf…

Milvus docker-compose 部署

文章目录 前言Milvus docker-compose 部署1. 下载2. 修改配置3. 启动4. 测试 前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊^ _ ^。   而且听说点赞的人每天的运气都不会太差&#xff0c;实在白嫖的…

EveryThing搜索具体路径下文件中的内容

1.打开EveryThing 2.点击搜索&#xff0c;选择高级搜索 3.选择需要搜索的文件的路径以及文件中需要包含的内容 4.之后就可以搜索到对应的目标文件

【算法】宽度优先遍历BFS

二叉树的宽搜 429、N叉树的层序遍历 题解 BFS核心思想 二叉树的宽搜一般都是借助队列来实现的&#xff0c;实现的原理为首先将根节点进行放入队列中&#xff0c;然后将根节点进行弹出的时候&#xff0c;将这个节点的孩子节点进行放入队列中&#xff0c;然后继续弹出队头的元…

【STM32】通用定时器基本原理

STM32 通用定时器基本原理&#xff08;基于 STM32F1&#xff09;参考资料&#xff1a;STM32F1xx官方资料&#xff1a;《STM32中文参考手册V10》-第14章通用定时器STM32 定时器分类 STM32F103 系列共有三类定时器&#xff1a;&#x1f50e; 通用定时器&#xff08;TIM2~TIM5&…

【Go语言-Day 14】深入解析 map:创建、增删改查与“键是否存在”的奥秘

Langchain系列文章目录 01-玩转LangChain&#xff1a;从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块&#xff1a;四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain&#xff1a;从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…

Vue脚手架搭建项目+基础知识

1. 使用脚手架创建项目1.1 准备工作winR&#xff0c;在弹出的数据框中输入cmd&#xff0c;数据命令查看node以及npm版本 下载vue cli1.2 创建项目1.2.1 创建一个英文目录文件夹&#xff0c;cmd打开命令命令提示符1.2.2 vue ui命令打开控制台1.2.3 创建项目创建成功1.3 项目结构…

微信小程序下单页—地址列表页—新增地址页 页面交互

新增地址流程&#xff1a; 下单页 → 地址列表页 (1次跳转)地址列表页 → 新增地址页 (1次跳转)保存地址 → 返回地址列表页 (1次返回&#xff0c;自动刷新列表) 选择地址流程&#xff1a; 地址列表页 → 选中地址 → 返回下单页 (1次返回) 更换地址&#xff1a; 下单页 → 地址…