今日凌晨,OpenAI宣布开源两款全新大模型——GPT-oss-120B(1168亿参数)与GPT-oss-20B(209亿参数),成为全球首个支持商业化应用的开放权重推理模型。该模型专为AI智能体(Agent)设计,集成函数调用、网络搜索、Python代码执行等功能,旨在降低开发者构建安全、高性能AI应用的门槛。

技术突破:混合专家架构与超长上下文处理

GPT-oss采用创新的混合专家(MoE)架构,通过动态分配计算资源提升效率:

  • GPT-oss-120B:36层结构,每token前向传递激活51亿参数,配备128个专家模块;
  • GPT-oss-20B:24层结构,每token激活36亿参数,专家模块缩减至32个。

模型注意力机制融合GPT-3的带状窗口与全密集模式,带宽128 token,结合旋转位置嵌入(RoPE)和YaRN技术,将上下文长度扩展至131072 token,显著提升长文本处理能力。此外,根均方归一化(RMSNorm)与门控SwiGLU激活函数进一步优化了非线性表达能力。

性能媲美闭源旗舰,硬件需求差异显著

OpenAI公布的数据显示,GPT-oss在多项基准测试中表现亮眼:

  • 数学推理:GPT-oss-120B在AIME(美国数学邀请赛)测试中以96.6%准确率接近o4-mini的98.7%;
  • 编程能力:Codeforces竞赛问题测试中,120B模型Elo评分达2622,略低于o4-mini的2719;
  • 多语言支持:法语、德语、西班牙语任务准确率分别达84.6%、83.0%、85.9%。

硬件需求方面,120B版本需80GB GPU显存,而20B版本仅需16GB GPU即可运行。OpenAI宣称20B模型可适配高端手机,但这一说法引发争议——部分开发者指出,16GB显存要求远超当前主流移动设备配置。

开源战略升级:数十亿美元研发免费开放

OpenAI联合创始人兼CEO萨姆·阿尔特曼(Sam Altman)在长文中强调,GPT-oss是“首款最先进、可商用的开放权重推理模型”,其意义在于让全球开发者“直接控制和修改AI,保障隐私与灵活性”。他同时表示,模型已通过内部安全基准测试,尤其在生物安全领域加强了风险管控。

行业分析认为,此次开源标志着OpenAI战略转向:在面临市场竞争压力下,通过释放小型化、高性能模型巩固技术领导力。尽管阿尔特曼将此举包装为“赋能人类”,但外界普遍认为,这是对Meta、马斯克xAI等开源竞品的直接回应。

业界反响:开源运动迎来转折点

GP:T-oss的发布引发热议

  • 支持者认为,将媲美o4-mini的模型开源等同于“将前沿技术民主化”,可能加速AI应用创新;
  • 质疑者则指出,20B模型的手机适配性存疑,且OpenAI仍未公开Grok系列开源计划,或存在“选择性开放”嫌疑;
  • 竞品对比:有开发者调侃称,“马斯克承诺的Grok-3开源仍未兑现,OpenAI已用GPT-oss改写行业规则”。

OpenAI重申其使命:“确保AGI造福全人类”。阿尔特曼表示,GPT-oss的发布旨在建立“以民主价值观为基础的开放AI技术栈”,通过免费授权推动全球协作。随着模型代码与权重陆续公开,一场围绕“开源vs闭源”的AI竞赛正进入新阶段。

注:本文基于OpenAI官方发布信息及公开测试数据整理,手机运行可行性需等待实测验证。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/92371.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/92371.shtml
英文地址,请注明出处:http://en.pswp.cn/web/92371.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【STM32】GPIO的输入输出

GPIO是通用的输入输出接口,可配置8种输入模式,输出模式下可控制端口输出高低电平,用于点亮LED、控制蜂鸣器、模拟通信协议等;输入模式下可以读取端口的高低电平或者电压,用于读取按键、外接模块的电平信号、ADC的电压采…

5分钟了解OpenCV

在数字化时代,图像和视频已经成为信息传递的核心载体。从手机拍照的美颜功能到自动驾驶的路况识别,从医学影像分析到安防监控系统,视觉技术正深刻改变着我们的生活。而在这背后,OpenCV 作为一款强大的开源计算机视觉库&#xff0c…

Oracle 关闭 impdp任务

Oracle 关闭 impdp任务 执行 impdp system/123456 attachSYS_EXPORT_TABLE_01 执行 stop_jobimmediate

数据结构——链表2

1.2 实现单链表 在上一篇文章中&#xff0c;单链表的实现只有一少部分&#xff0c;这一篇接着来了解单链表剩下的接口实现。 SList.h#pragma once #include<stdio.h> #include<stdlib.h> #include<assert.h>//定义单链表就是定义节点&#xff0c;因为单链表…

Windows和Linux应急响应以及IP封堵

目录 1、Windows入侵排查思路 1.1 检查系统账号安全 1.2 检查异常端口、进程 1.3 检查启动项、计划任务、服务 1.4 检查系统相关信息 1.5 自动化查杀 1.6 日志分析 系统日志分析 Web 访问日志 2、Linux 入侵排查思路 2.1 账号安全 2.1.1、基本使用 2.1.2、入侵排查…

MIT成果登上Nature!液态神经网络YYDS

2025深度学习发论文&模型涨点之——液态神经网络液态神经网络&#xff08;Liquid Neural Networks&#xff0c;LNN&#xff09;是一种受生物神经系统启发的连续时间递归神经网络&#xff08;RNN&#xff09;&#xff0c;其核心创新在于将静态神经网络转化为由微分方程驱动的…

AI 对话高效输入指令攻略(四):AI+Apache ECharts:生成各种专业图表

- **AI与数据可视化的革命性结合**:介绍AI如何降低数据可视化门槛,提升效率。 - **Apache ECharts:专业可视化的利器**:使用表格对比展示ECharts的特点、优势和适用场景。 - **四步实现AI驱动图表生成**:通过分步指南讲解从环境准备到图表优化的全流程,包含多个代码示例及…

vue2 基础学习 day04 (结构/样式/逻辑、组件通信、进阶语法)下

一、非父子通信-event bus 事件总线1.作用非父子组件之间&#xff0c;进行简易消息传递。(复杂场景→ Vuex)2.步骤创建一个都能访问的事件总线 &#xff08;空Vue实例&#xff09;import Vue from vue const Bus new Vue() export default BusA组件&#xff08;接受方&#xf…

ubuntu 20.04 C和C++的标准头文件都放在哪个目录?

在 Ubuntu 20.04 中&#xff0c;C 和 C 标准头文件的存放目录主要由编译器&#xff08;如 GCC&#xff09;的安装路径决定&#xff0c;通常分为以下两类&#xff1a;​1. C 标准头文件​C 语言的标准头文件&#xff08;如 <stdio.h>、<stdlib.h> 等&#xff09;默认…

change和watch

是的&#xff0c;你理解得很对&#xff01; change 与 v-model 的结合&#xff1a;change 事件通常用于监听 表单元素的变化&#xff0c;但它并不一定意味着值发生了变化。它主要是当 用户与输入框交互时&#xff08;如点击选项、选择文本框内容、提交表单等&#xff09;触发的…

分布式微服务--GateWay(1)

一、什么是微服务网关&#xff08;API Gateway&#xff09; 定义&#xff1a;微服务网关是整个系统请求的统一入口&#xff0c;负责请求转发、过滤处理、安全校验等。 作用&#xff1a; 请求路由 日志记录 权限控制 参数校验 解决跨域问题 黑白名单控制 限流、熔断、降级…

大文件断点续传(vue+springboot+mysql)

断点续传vue前端代码后端代码controller 层service层持久层主表&#xff0c;初始化单次上传文件表&#xff0c;单次上传所有的文件记录文件分块表科普信息参考其他博主 流程图 vue前端代码 这里是只做了demo示例&#xff0c;主线测试没什么问题&#xff0c;前端同学可参考修…

Nodejs》》MySql

Node.js 操作MySQL数据库 文档 # 项目要先安装mysql包npm i mysqlxx // 安装指定版本npm i mysql // 默认安装最新版本 # 连接 mysq// 使用连接池连接const mysql require(mysql)# 建立连接const db mysql.createPool({host:, // 数据库的IP地址user:ro…

金仓数据库常见问题(持续更新)

目录 1.查看大小是否敏感写参数&#xff0c;提示&#xff1a;未认可的配置参数 "case_sensitive" 2.sys_backup.sh init时提示can not connect the primary node 3.设置逻辑备份运行脚本时提示错误are not allowed to use this program (crontab) 4.修改表字段类…

Docker Buildx最佳实践:多架构镜像构建指南

文章目录为什么需要 Docker Buildx安装与启用 Docker Buildx创建多架构构建器实例构建多架构镜像优化构建性能调试多架构构建实战案例&#xff1a;构建 Go 应用多架构镜像总结Docker Buildx 是 Docker 官方推出的扩展工具&#xff0c;用于支持多平台镜像构建&#xff0c;简化跨…

你用的是什么键盘?

在电竞行业飞速发展的当下&#xff0c;游戏键盘作为玩家操作的核心载体&#xff0c;其性能表现直接影响着游戏体验与竞技结果。而赛卓电子推出的磁轴键盘专用芯片 SC4823&#xff0c;凭借一系列突破性的技术特性&#xff0c;正成为游戏键盘领域的性能革新者。​对于游戏玩家而言…

Activiti 中各种 startProcessInstance 接口之间的区别

前言在用 RuntimeService 接口启动流程实例时&#xff0c;总是分不清楚不同 startProcessInstanceXXX 接口之间的区别&#xff0c;这篇文章基于 Activiti 7.0.0.GA 版本&#xff0c;对这一类接口进行一个梳理和归类。详解接口列表RuntimeService 接口中以 startProcessInstance…

新手BUG:函数中 static 变量的赋值语句只会执行一次

在 C 函数中使用 static 变量时&#xff0c;很多新手会陷入一个认知误区&#xff1a;认为变量的初始化语句会在每次函数调用时执行。比如在bool funcA() { // Q&#xff1a;多次调用funcA&#xff0c;funcB会被执行几次&#xff1f;// A&#xff1a;1次static bool value func…

Python 基础详解:数据类型(Data Types)—— 程序的“数据基石”

一、引言&#xff1a;为什么数据类型如此重要&#xff1f;在 Python 编程中&#xff0c;数据类型决定了&#xff1a;数据的存储方式可以对数据执行的操作数据的取值范围不同类型之间的运算规则理解数据类型是编写正确、高效程序的基础。Python 是动态类型语言&#xff0c;虽然你…

WindowsLinux系统 安装 CUDA 和 cuDNN

Windows安装前的准备工作 检查硬件兼容性&#xff1a;确认电脑显卡为 NVIDIA GPU。通过快捷键 Win R 唤出“运行”&#xff0c;输入“control /name Microsoft.DeviceManager”唤出“设备管理器”&#xff0c;点击“显示适配器”查看是否有 NVIDIA 字样。 验证 CUDA 支持性&a…