DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

要说 AI 模型的江湖,这一年简直就是 「大模型修罗场」
前脚 R2 传出难产的风声,后脚 DeepSeek 就甩出了一张大招牌:DeepSeek-V3.1

这波操作不仅没有掉队,反倒像是提前踩进了 Agent 时代的大门
作为一只长年蹲在模型圈的猫头虎,看完更新细节后,忍不住和大家聊聊:
👉 这次升级到底意味着什么?
DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

文章目录

  • DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
    • 🌟 V3.1 三大核心升级
    • 🛠️ Agent 能力:更强的工具人
      • 💻 编程智能体
      • 🔍 搜索智能体
    • ⏳ 思考效率:同样的智商,更少的字
    • 📂 模型开源 & 部署须知
    • 💰 价格调整:9月6日见
    • 🦉 猫头虎的思考
    • 🎯 总结


🌟 V3.1 三大核心升级

1️⃣ 混合推理架构
一个模型同时支持 思考模式非思考模式,随时切换,更灵活。

2️⃣ 思考效率提升
相比 R1-0528,V3.1-Think 输出 token 数减少 20%-50%,在更短时间内给出答案。
👉 省字、省钱、省时间。

3️⃣ Agent 能力进化
后训练优化后,V3.1 在 工具调用任务执行 上有了显著提升,Agent 味越来越浓。

📌 官方 App & 网页端已同步升级;
📌 API 支持 deepseek-chat(非思考模式) 和 deepseek-reasoner(思考模式);
📌 新增 Anthropic API 格式支持,可无缝接入 Claude Code 框架。

DeepSeek R2难产:近期 DeepSeek-V3.1 发布,迈向 Agent 时代的第一步


🛠️ Agent 能力:更强的工具人

💻 编程智能体

图片

V3.1 在 代码修复(SWE)终端任务(Terminal-Bench) 中明显优于前代,所需轮数更少。
👉 写代码、跑命令行的场景里,Agent 变得更实用。

🔍 搜索智能体

图片

复杂搜索(browsecomp)多学科难题(HLE) 测试中,V3.1 大幅领先 R1-0528。
👉 检索+多步推理能力显著增强,更像个“知识猎手”。


⏳ 思考效率:同样的智商,更少的字

图片

测试显示:

  • 表现基本持平 R1-0528(AIME 2025: 87.5/88.4,GPQA: 81/80.1,liveCodeBench: 73.3/74.8);
  • token 消耗下降 20%-50%
  • 非思考模式下,输出也更简洁,不啰嗦。

👉 简而言之:更聪明的省话精


📂 模型开源 & 部署须知

DeepSeek 继续保持开放态度:

🔹 Base 模型(新增 840B tokens 训练)

  • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
  • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

🔹 后训练模型

  • Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
  • 魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

⚠️ 注意事项:

  • V3.1 使用 UE8M0 FP8 Scale 精度,与 V3 不完全兼容;
  • 分词器 & chat template 变动较大,部署需看新版文档。

💰 价格调整:9月6日见

图片

2025 年 9 月 6 日凌晨起

  • 按新版价格表计费;
  • 取消夜间优惠

👉 在此之前,仍按老价格执行。
同时,DeepSeek 也扩容了 API 服务,调用更顺畅。


🦉 猫头虎的思考

  1. R2 难产,V3.1 扛旗
    这波算是战略补位,稳住用户心智。

  2. Agent 化是大趋势
    编程、搜索、工具调用都变强,说明 DeepSeek 已经在铺设 下一代 AI 工作流

  3. 价格与开源的平衡术
    一边涨价,一边开源,本质是 降成本、扩生态 的两手抓。


🎯 总结

DeepSeek-V3.1 不是一鸣惊人的“天花板式”大模型,但它足够 实用且前瞻

效率更高,省钱省时
Agent 能力更强,场景更广
开源透明,生态友好

在 AI Agent 的赛道上,DeepSeek 已经稳稳迈出第一步。


🦉 猫头虎观点:
别纠结 R2 了,V3.1 已经在布一盘更大的棋。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/96366.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/96366.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/96366.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

element-plus:el-tree ref初始化异常记录

文章目录描述问题解决记录一个tsx 下el-tree的小问题描述 <Dialog v-model"showEdit" :title"t(button.edit)" width"900" :maxHeight"650"><el-form :model"nowdata" class"dialog"><el-form-ite…

Linux软件安装(JDK,Mysql,Nginx)

安装方式介绍一、安装JDKtar -zxvf jdk-17.0.10_linux-x64_bin.tar.gz -C /usr/localexport JAVA_HOME/usr/local/jdk-17.0.10export PATH$JAVA_HOME/bin:$PATHsource /etc/profile1、操作步骤二、mysql黑马视频已经安装好了我们只需开放指定端口就可以在navicat中连接了&#…

公有地址和私有地址

在计算机网络中&#xff0c;私有地址和公有地址是IP地址的两大重要分类&#xff0c;二者在网络通信中承担着不同角色。下面从定义、联系、区别和应用四个维度进行详细说明&#xff1a; 一、定义 1. 公有地址&#xff08;Public IP Address&#xff09; 公有地址是全球唯一且可在…

分治思想在系统分流削峰中的实践与Golang前沿实现

分治思想在系统分流削峰中的实践与Golang前沿实现 1. 分治思想概述 分治(Divide and Conquer)是计算机科学中一种重要的算法设计思想&#xff0c;其核心在于"分而治之"——将复杂问题分解为若干个规模较小的相同或相似子问题&#xff0c;递归地解决这些子问题&#x…

移动端视口终极解决方案:使用 Visual Viewport封装一个优雅的 React Hook

前言 在移动端开发中&#xff0c;视口高度一直是一个令人头疼的问题。尤其是在 iOS Safari 浏览器中&#xff0c;还有三星手机的导航遮挡&#xff0c;当虚拟键盘弹出时&#xff0c;视口高度的变化会导致固定定位元素错位、全屏布局异常等问题。本文将深入分析这个问题的本质&a…

react中key的作用

在 React 中&#xff0c;key 是一个特殊的属性&#xff08;prop&#xff09;&#xff0c;它的主要作用是帮助 React 识别哪些元素发生了变化、被添加或被移除&#xff0c;从而高效地更新和重新渲染列表中的元素。以下是 key 的具体作用和注意事项&#xff1a;1. 高效更新虚拟 D…

Lua学习记录 - 自定义模块管理器

为人所知的是lua自带的require函数加载脚本只会加载一次(就像unity里面的资源管理和AB包管理)&#xff0c;而主播调试习惯是用Odin插件的Button在unity编辑器模式里调试而非进入播放模式后调试&#xff0c;今天主播在做热更新相关的时候企图多次调用脚本打印以调试功能&#xf…

MongoDB 分片集群复制数据库副本

文章目录一、登录MongoDB查询数据库及集合分片情况二、登录MongoDB先创建副本数据库并设置数据库及集合分片功能三、登录MongoDB查询emop_slinkmain数据库main_repetition集合和四、使用mongodump压缩备份emop_slinkmain数据库中的main_repetition集合和shard_repetition 集合五…

SQLite 加密与不加密性能对比与优化实践

在项目中&#xff0c;为了保证数据安全&#xff0c;我们可能会对 SQLite 数据库进行加密&#xff08;例如使用 SQLiteMC/SQLCipher&#xff09;。然而&#xff0c;加密数据库在带来安全性的同时&#xff0c;也会带来显著的性能损耗。本文结合实测与源码分析&#xff0c;介绍 SQ…

Azure官网为何没直接体现专业服务

微软Azure官网没有直接、醒目地展示其专业服务&#xff08;如迁移、定制化解决方案咨询等&#xff09;&#xff0c;确实容易让人疑惑。这背后其实是微软Azure特定的市场策略和商业模式。下面我为你解释原因&#xff0c;并告诉你怎么找到这些服务。&#x1f9e9; 核心原因&#…

人体生理参数信号采集项目——心电信号

1.硬件——焊接调试趣事&#xff1a;由于测量手法问题&#xff0c;以及对示波器不太熟悉&#xff0c;差点以为没信号&#xff0c;都打算重焊一块板子了&#xff0c;但&#xff0c;实际上&#xff0c;信号输出是相对完美的&#xff1b;遇到的疑难杂症&#xff1a;1&#xff09;5…

Go1.25的源码分析-src/runtime/runtime1.go(GMP)g

1. 主要组成部分 Go语言的GMP调度器基于四个核心数据结构&#xff1a;g、m、p和schedt。 1.1 主要常量解读 1.1.1G 状态常量 const (_Gidle iota //刚分配尚未初始化的 G_Grunnable//已在运行队列上&#xff0c;未执行用户代码&#xff1b;栈未被该 G 拥有_Grunning//正在…

使用jwt+redis实现单点登录

首先理一下登录流程 前端登录—>账号密码验证—>成功返回token—>后续请求携带token---->用户异地登录---->本地用户token不能用&#xff0c;不能再访问需要携带token的网页 jwt工具类 package com.nageoffer.shortlink.admin.util;import cn.hutool.core.util.…

Trae配置rules与MCP

这个文章不错&#xff0c;不过如果只是看&#xff0c;还感受不到作者的震撼&#xff0c;所以我自己实操了一下&#xff0c;深受震动&#xff0c;也希望看到这篇文章的人也自己实操一下。 与Cursor结对编程的四个月&#xff0c;我大彻大悟了&#xff01; 学到了什么 无论是熟悉…

对抗攻击与防御:如何保护视觉模型安全?

对抗攻击与防御:如何保护视觉模型安全? 前言 一、对抗攻击的基本原理 二、对抗攻击的主要类型 2.1 白盒攻击 2.2 黑盒攻击 三、对抗攻击的常见形式 3.1 定向攻击 3.2 非定向攻击 四、对抗防御的核心思路 五、常见的对抗防御方法 5.1 对抗训练 5.2 输入预处理 5.3 防御蒸馏 六…

区块链开发:Solidity 智能合约安全审计要点

本文聚焦区块链开发中 Solidity 智能合约的安全审计要点。首先概述智能合约安全审计的重要性&#xff0c;接着详细介绍常见的安全漏洞&#xff0c;如重入攻击、整数溢出与下溢等&#xff0c;以及对应的审计方法。还阐述了审计的具体流程&#xff0c;包括自动化工具检测、手动代…

C++ 新手第一个练手小游戏:井字棋

1. 引言 介于身边有特别多没有学习过编程&#xff0c;或者有一定C语言、python或是Java基础的但是没有接触过C的新手朋友&#xff0c;我想可以通过一个很简单的小项目作为挑战&#xff0c;帮助大家入门C。 今天&#xff0c;我们将挑战一个对新手来说稍微复杂一点&#xff0c;…

透射TEM 新手入门:快速掌握核心技能

目录 简介​ 一、TEM 基本知识 1. 核心原理&#xff08;理解图像本质&#xff09;​ 2. 关键结构与成像模式&#xff08;对应图像类型&#xff09;​ 二、TEM 数据处理 1. 预处理&#xff08;通用步骤&#xff09;​ 2. 衍射花样&#xff08;SAED&#xff09;处理&#x…

day075-MySQL数据库服务安装部署与基础服务管理命令

文章目录0. 老男孩思想-老男孩名言警句1. 数据库服务安装部署1.1 下载安装包1.2 系统环境准备1.2.1 关闭防火墙1.2.2 关闭selinux1.2.3 安装依赖软件1.2.4 卸载冲突软件1.3 安装程序1.3.1 上传软件包1.3.2 配置环境变量1.3.3 创建数据库存储数据目录1.3.4 创建数据库程序管理用…

Qt二维码生成器项目开发教程 - 从零开始构建专业级QR码生成工具

Qt二维码生成器项目开发教程 - 从零开始构建专业级QR码生成工具 项目概述 本项目是一个基于Qt框架开发的专业级二维码生成器&#xff0c;集成了开源的qrencode库&#xff0c;提供完整的QR码生成、预览、保存和分享功能。项目采用C语言开发&#xff0c;使用Qt的信号槽机制实现…