注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】

清华《GPT多模态大模型与AI Agent智能体》书籍配套视频课程【陈敬雷】

文章目录

  • GPT多模态大模型与AI Agent智能体系列八十七
    • OpenAI开源大模型 GPT-OSS 开放权重语言模型解析:技术特性、部署应用及产业影响
      • OpenAI GPT-OSS:开放大模型的"破局之作"
    • 一、技术架构:兼顾性能与效率的"双引擎"设计
    • 二、训练数据与安全:专业与安全的双重保障
    • 三、两个版本:从台式机到手机的"全设备覆盖"
    • 四、本地部署与应用:一键上手,无缝集成工具
    • 五、产业链躁动:这些A股公司已"提前布局"
    • 总结:AI普惠化的"关键一步"
      • 更多技术内容
  • 总结

GPT多模态大模型与AI Agent智能体系列八十七

OpenAI开源大模型 GPT-OSS 开放权重语言模型解析:技术特性、部署应用及产业影响

OpenAI GPT-OSS:开放大模型的"破局之作"

2025年8月5日,OpenAI扔下了一颗"重磅炸弹"——发布旗下自GPT-2以来首款开放权重语言模型GPT-OSS,包含gpt-oss-120b和gpt-oss-20b两个版本。这一举措不仅打破了OpenAI长期以来的"闭源传统",更被业内视为AI技术向"普惠化"迈进的关键一步:普通用户只需消费级设备,就能体验到比肩商业大模型的性能。

一、技术架构:兼顾性能与效率的"双引擎"设计

GPT-OSS的核心竞争力,首先源于其精心设计的技术架构:

  • MoE+Transformer双架构:采用专家混合系统(MoE)的Transformer架构,让模型能像"团队协作"一样,每个token仅激活部分参数(120b版本激活5.1亿参数,20b版本激活3.6亿参数),在保证性能的同时大幅降低硬件需求。

  • 超长上下文与高效注意力:支持128k上下文长度(约25万字),远超多数消费级模型;同时沿用GPT-3的"交替密集+局部带状稀疏注意力"模式,并加入8分组多查询注意力,既保证理解长文本的能力,又提升推理速度和内存效率。

  • 超强分词器:配套开源的o200k_harmony分词器,作为o4-mini、gpt-4o分词器的超集,能更精准处理多语言、专业术语(尤其STEM领域),减少语义损失。

二、训练数据与安全:专业与安全的双重保障

GPT-OSS在"能力"与"安全"之间做了精细平衡:

  • 训练数据侧重专业领域:以STEM学科(科学、技术、工程、数学)、编程和通用知识为核心训练方向,尤其在竞赛数学、健康领域表现突出——20b版本在相关测试中已超越o3-mini。

  • 全链路安全措施:预训练阶段严格过滤化学、生物、放射性和核(CBRN)相关有害数据;通过生物学、网络安全数据专项微调评估风险;联合三个独立专家组对恶意微调进行"攻防测试",降低被滥用风险。

三、两个版本:从台式机到手机的"全设备覆盖"

GPT-OSS的两个版本针对性满足不同场景需求,真正实现"让大模型走进寻常百姓家":

版本参数量单token激活参数最低内存需求性能表现适用设备
gpt-oss-120b1170亿5.1亿80GB接近o4-mini,竞赛编码、工具调用优于o3-mini,部分任务超越o4-mini多数台式机、高性能笔记本
gpt-oss-20b210亿3.6亿16GB达到/超过o3-mini,竞赛数学、健康领域表现突出高端消费级GPU、苹果芯片Mac

从实测来看,gpt-oss-20b在MacPro M4(48G内存)上的输出速度达41.21 token/s,远超同类消费级模型,日常聊天、文档处理、简单编程辅助等场景完全"无压力"。

四、本地部署与应用:一键上手,无缝集成工具

GPT-OSS的"开放"不仅体现在权重,更体现在易用性上:

  • LM Studio一键部署:通过LM Studio桌面应用(官网可直接下载),普通用户无需复杂配置,点击"下载模型"后即可本地运行——下载gpt-oss-20b后,生成杭州三日游攻略、简单代码片段等任务响应迅速,延迟可忽略。

  • MCP服务集成实测:搭配蚂蚁集团AntV开源的mcp-server-chart,可实现数据可视化工具调用。尽管模型4096 tokens的上下文限制导致25个工具同时开启时会"超纲",但选择性开启后,生成游戏销量饼图、杭州景点地图等任务准确率极高,结构化输出能力突出。

五、产业链躁动:这些A股公司已"提前布局"

GPT-OSS的开放属性,为产业链上下游带来新机遇,相关概念股已进入市场视野:

  • 南兴股份:与微软、OpenAI合作开发小鹜AIGC智能助手,支持智能聊天、身份预设等功能,正探索GPT-OSS在企业服务中的落地。

  • 鼎捷数智:子公司鼎新电脑发布结合Azure OpenAI的Paas平台"METIS",其IndepthAI智能体可基于大模型构建AI原生应用,新一代PLM系统已融合AIGC技术,GPT-OSS或进一步降低其开发成本。

  • 汉王科技:依托天地大模型形成多个AAgent(智能体),落地于手写电纸本(智能话稿整理)、血压计(化验报告解读)等终端,GPT-OSS的开源特性或加速其终端智能化升级。

  • 万兴科技:接入Azure OpenAI,旗下万兴超媒Agent可完成音视频全流程创作;GPT-OSS的本地部署能力,有望解决其产品"云端依赖"问题。

  • 拓尔思:深耕政务、金融等垂直领域,trsGPT系列模型需大量专业数据训练,GPT-OSS的开源权重或为其提供"站在巨人肩膀上"的研发基础。

总结:AI普惠化的"关键一步"

GPT-OSS的发布,标志着高端大模型从"闭源垄断"走向"开放协作":16GB内存即可运行的20b版本,让普通用户、中小企业也能低成本享受大模型能力;而120b版本在消费级设备上的可用性,更打开了"个人AI助手"的想象空间。

尽管4096 tokens的上下文长度在复杂工具调用场景中仍显不足,但瑕不掩瑜——随着开源社区的迭代优化,GPT-OSS或将推动AI从"少数人的工具"变成"每个人的助手",而其背后的产业链机会,也值得长期关注。

更多技术内容

更多技术内容可参见
清华《GPT多模态大模型与AI Agent智能体》书籍配套视频【陈敬雷】。
更多的技术交流和探讨也欢迎加我个人微信chenjinglei66。

总结

此文章有对应的配套新书教材和视频:

【配套新书教材】
《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】
新书特色:《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)是一本2025年清华大学出版社出版的图书,作者是陈敬雷,本书深入探讨了GPT多模态大模型与AI Agent智能体的技术原理及其在企业中的应用落地。
全书共8章,从大模型技术原理切入,逐步深入大模型训练及微调,还介绍了众多国内外主流大模型。LangChain技术、RAG检索增强生成、多模态大模型等均有深入讲解。对AI Agent智能体,从定义、原理到主流框架也都进行了深入讲解。在企业应用落地方面,本书提供了丰富的案例分析,如基于大模型的对话式推荐系统、多模态搜索、NL2SQL数据即席查询、智能客服对话机器人、多模态数字人,以及多模态具身智能等。这些案例不仅展示了大模型技术的实际应用,也为读者提供了宝贵的实践经验。
本书适合对大模型、多模态技术及AI Agent感兴趣的读者阅读,也特别适合作为高等院校本科生和研究生的教材或参考书。书中内容丰富、系统,既有理论知识的深入讲解,也有大量的实践案例和代码示例,能够帮助学生在掌握理论知识的同时,培养实际操作能力和解决问题的能力。通过阅读本书,读者将能够更好地理解大模型技术的前沿发展,并将其应用于实际工作中,推动人工智能技术的进步和创新。

【配套视频】

清华《GPT多模态大模型与AI Agent智能体》书籍配套视频【陈敬雷】
视频特色: 前沿技术深度解析,把握行业脉搏

实战驱动,掌握大模型开发全流程

智能涌现与 AGI 前瞻,抢占技术高地

上一篇:《GPT多模态大模型与AI Agent智能体》系列一》大模型技术原理 - 大模型技术的起源、思想
下一篇:DeepSeek大模型技术系列五》DeepSeek大模型基础设施全解析:支撑万亿参数模型的幕后英雄

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/92459.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/92459.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/92459.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS--后端也有自己的CSS要学

CSS,即Cascading Style Sheets,它描述了网页的表现与展示效果 为了演示CSS,我写了一个简单的index.html 为了使用控制变量法,一开始我先不写style.css文件的内容 右键在默认浏览器里查看页面,看看效果 1-选择器 根据标签名进行匹配,所以也叫元素选择器 页面效果: 根据…

Docker swarm 常用的命令集合

#docker swarm## 初始化单节点Swarm docker swarm init# 部署测试服务 docker service create --name web --publish 8080:80 --replicas 3 nginx:alpine# Manager节点初始化(指定IP) docker swarm init --advertise-addr 192.168.1.100# 获取加入令牌 M…

231. 2 的幂

Problem: 231. 2 的幂 文章目录思路解题过程复杂度Code思路 2的幂 n 的二进制只有一个1,而 n - 1的二进制则是把 n 的二进制1变0, 0变1。 例:2^24100,34-1011. 解题过程 n & n - 1 0 复杂度 时间复杂度: O(1)O(1)O(1)空间复杂度: O(1)O(1)O(1) Co…

浅尝AI辅助C转Verilog方法

一、常规算法模块的开发流程日常芯片开发工作中,挺多看工作是把C语言转verilog。例如ISP的代码,都很先由算法进行C model的开发,验证完性能后,输出算法原理文档和c代码;数字设计接手,把C语言转换为verilog代…

Redis分布式锁详解:原理、实现与实战案例

目录 1. 什么是分布式锁? 分布式锁的核心要求 2. 基于Redis的分布式锁实现方案 (1)基础方案:SETNX EXPIRE (2)优化方案:SET NX PX(原子性加锁) (3&…

【能碳建设1】用AI+开源打造物联网+能碳管理+交易SaaS系统的最短路径实施指南

摘要 本指南为技术小白设计,目标是在最短时间内利用AI工具与开源系统,独立完成一套物联网平台 + 能碳管理平台 + 碳交易系统的SaaS最小可用版本(MVP),并可后续扩展。流程分为目标定义、技术选型、环境搭建、核心功能开发、SaaS化、多租户、上线运维等环节,按天推进,每步…

CVPR中深度学习新范式:通用性、鲁棒性与多模态的创新突破

来gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~分享一个深度学习领域正在迅速升温的前沿方向:通用性与鲁棒性的深度神经网络架构创新。随着大模型在视觉、文本乃至多模态任务中的广泛应用,体现出深…

Vue3 学习教程,从入门到精通,Vue 3 + Tailwind CSS 全面知识点与案例详解(31)

Vue 3 Tailwind CSS 全面知识点与案例详解一、Vue 3 核心语法知识点 1. Vue 3 基础 创建 Vue 3 项目 使用 Vite 创建项目:npm create vuelatest # 选择需要的特性(如 TypeScript、Vue Router)响应式数据 使用 ref 和 reactive:im…

Android中RecyclerView基本使用

一、RecyclerView 核心概念1. 基本组件关系2. 核心组件作用Adapter:数据与视图的桥梁LayoutManager:控制布局方式(线性/网格/瀑布流)ViewHolder:缓存视图组件ItemDecoration:添加分割线等装饰ItemAnimator&…

A100用transformers推理gpt-oss

A100本地用transformers推理gpt-oss GPT-oss试用 gpt-oss有两个原生配置是目前(2025-8-8)Ampere系列显卡不支持的,分别是默认的MXFP4量化,以及Flash-attn V3。tranformers推理是比较慢的,可以用于研究模型本身&#x…

虚拟手机号工具使用

背景:注册部分国外应用时需要国外手机号验证,例如在注册cursor时需要国外手机号 解决:使用虚拟手机号网页进行验证 https://temp-number.com/ 选择自己需要的国家 选择一个手机号 复制手机号到自己的app注册页面 并发送消息,然后…

【线程池】压测确定线程池合适的参数

【线程池】压测确定线程池合适的参数【一】案例说明【二】明确线程池核心参数及优化目标【1】线程池核心参数(需压测验证的关键参数)【2】优化目标【三】压测前准备【1】环境搭建【2】线程池初始配置(基于经验值)【3】压测工具与监…

GPT OSS 双模型上线,百度百舸全面支持快速部署

GPT OSS 是 OpenAI 推出的重量级开放模型,专为强推理能力、智能体任务及多样化开发场景设计,标志着大模型在开放性与实用性上的重要突破。该系列包含两款高性能模型:参数规模为 117B 的 GPT‑OSS‑120B 和 21B 的 GPT‑OSS‑20B。二者皆采用 …

C++高频知识点(十七)

文章目录81. 你对智能指针的了解82. 一元、二元仿函数的区别和使用背景一元仿函数二元仿函数83. 描述Linux下文件删除的原理84. 什么是菱形继承?有什么问题,怎么解决?解决菱形继承问题85. IO多路复用是什么?selectpollepollselect…

如何优雅的使用进行参数校验

在spring里面有一个注解 Validated可以在方法的入参里面这样写//方法 getActivityFlag(RequestBody Validated QueryActivityDto queryActivityDto) //参数详情NotBlank(message "userId不能为空")private String userId;NotNull(message "storeId不能为空&q…

Java学习第一百一十部分——CI/CD

目录 一、前言简介 二、基本信息 三、优势价值 四、核心流程 五、技术栈(工具矩阵) 六、最佳实践 七、与DevOps关系 八、挑战对策 九、使用建议 十、总结归纳 一、前言简介 CI/CD 的本质是:通过自动化流水线,实现代码从提…

关于 Cocoapods 使用

一、Podfile & .podspec 文件 1、Podfile 1.1. 什么是 pod 简单来说,一个 pod 就是 xcode 里面的一个 dependency: Anyway,pod 就是第三方库的意思。一个 pod 就是指一个第三方库。 1.2. Podfile 有什么用 Podfile 可以理解为就是…

编程速递:2025 年巴西 Embarcadero 会议,期待您的到来

每个英雄都有一段充满奋斗的旅程,这段旅程引领他走向荣耀,而开发者英雄的旅程是2025年巴西Embarcadero大会的重点,以庆祝Delphi成立30周年。网站现已上线巴西Embarcadero在世界上最受期待的Delphi发展英雄会议召开前90天,推出了Em…

DevOps简单教程应用

文章目录概念一、环境准备二、gitlab配置三、.gitlab-ci.yml文件配置概念 Devops是一个概念,就是边开发边测试,能够大大提升开发效率,本文使用pycharmgitlab实现一个简单的DevOps流程 一、环境准备 需要一个测试环境,模拟部署&…

华为流程管理体系构建与落地 之—— 业务流程规划【附全文阅读】

这部分内容聚焦华为业务流程管理,详细阐述了流程规划、设计、运营、评估与优化的具体方法和内容,为企业构建和完善流程管理体系提供了全面的指导。流程规划分类方法:介绍 POS、OES、OMS 等分类法,如 POS 法按规划、运营、支持划分…