diannao/2025/8/22 19:12:20/文章来源:https://blog.csdn.net/qq_44866828/article/details/150590832

DeepSeek R2难产：近期 DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

要说 AI 模型的江湖，这一年简直就是 「大模型修罗场」。
前脚 R2 传出难产的风声，后脚 DeepSeek 就甩出了一张大招牌：DeepSeek-V3.1。

这波操作不仅没有掉队，反倒像是提前踩进了 Agent 时代的大门。
作为一只长年蹲在模型圈的猫头虎，看完更新细节后，忍不住和大家聊聊：
👉 这次升级到底意味着什么？
DeepSeek R2难产：近期 DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

文章目录

DeepSeek R2难产：近期 DeepSeek-V3.1 发布，迈向 Agent 时代的第一步
- 🌟 V3.1 三大核心升级
- 🛠️ Agent 能力：更强的工具人
- - 💻 编程智能体
  - 🔍 搜索智能体
- ⏳ 思考效率：同样的智商，更少的字
- 📂 模型开源 & 部署须知
- 💰 价格调整：9月6日见
- 🦉 猫头虎的思考
- 🎯 总结

🌟 V3.1 三大核心升级

1️⃣ 混合推理架构
一个模型同时支持 思考模式 与 非思考模式，随时切换，更灵活。

2️⃣ 思考效率提升
相比 R1-0528，V3.1-Think 输出 token 数减少 20%-50%，在更短时间内给出答案。
👉 省字、省钱、省时间。

3️⃣ Agent 能力进化
后训练优化后，V3.1 在 工具调用 和 任务执行 上有了显著提升，Agent 味越来越浓。

📌 官方 App & 网页端已同步升级；
📌 API 支持 deepseek-chat（非思考模式）和 deepseek-reasoner（思考模式）；
📌 新增 Anthropic API 格式支持，可无缝接入 Claude Code 框架。

DeepSeek R2难产：近期 DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

🛠️ Agent 能力：更强的工具人

💻 编程智能体

V3.1 在 代码修复（SWE） 与 终端任务（Terminal-Bench） 中明显优于前代，所需轮数更少。
👉 写代码、跑命令行的场景里，Agent 变得更实用。

🔍 搜索智能体

在 复杂搜索（browsecomp） 与 多学科难题（HLE） 测试中，V3.1 大幅领先 R1-0528。
👉 检索+多步推理能力显著增强，更像个“知识猎手”。

⏳ 思考效率：同样的智商，更少的字

测试显示：

表现基本持平 R1-0528（AIME 2025: 87.5/88.4，GPQA: 81/80.1，liveCodeBench: 73.3/74.8）；
token 消耗下降 20%-50%；
非思考模式下，输出也更简洁，不啰嗦。

👉 简而言之：更聪明的省话精。

📂 模型开源 & 部署须知

DeepSeek 继续保持开放态度：

🔹 Base 模型（新增 840B tokens 训练）

Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

🔹 后训练模型

Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

⚠️ 注意事项：

V3.1 使用 UE8M0 FP8 Scale 精度，与 V3 不完全兼容；
分词器 & chat template 变动较大，部署需看新版文档。

💰 价格调整：9月6日见

自 2025 年 9 月 6 日凌晨起：

按新版价格表计费；
取消夜间优惠。

👉 在此之前，仍按老价格执行。
同时，DeepSeek 也扩容了 API 服务，调用更顺畅。

🦉 猫头虎的思考

R2 难产，V3.1 扛旗
这波算是战略补位，稳住用户心智。
Agent 化是大趋势
编程、搜索、工具调用都变强，说明 DeepSeek 已经在铺设 下一代 AI 工作流。
价格与开源的平衡术
一边涨价，一边开源，本质是 降成本、扩生态 的两手抓。

🎯 总结

DeepSeek-V3.1 不是一鸣惊人的“天花板式”大模型，但它足够 实用且前瞻：

✨ 效率更高，省钱省时
✨ Agent 能力更强，场景更广
✨ 开源透明，生态友好

在 AI Agent 的赛道上，DeepSeek 已经稳稳迈出第一步。

🦉 猫头虎观点：
别纠结 R2 了，V3.1 已经在布一盘更大的棋。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/diannao/96366.shtml
繁体地址，请注明出处：http://hk.pswp.cn/diannao/96366.shtml
英文地址，请注明出处：http://en.pswp.cn/diannao/96366.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

element-plus：el-tree ref初始化异常记录

element-plus：el-tree ref初始化异常记录

文章目录描述问题解决记录一个tsx 下el-tree的小问题描述 <Dialog v-model"showEdit" :title"t(button.edit)" width"900" :maxHeight"650"><el-form :model"nowdata" class"dialog"><el-form-ite…

阅读更多...

Linux软件安装（JDK,Mysql,Nginx）

Linux软件安装（JDK,Mysql,Nginx）

安装方式介绍一、安装JDKtar -zxvf jdk-17.0.10_linux-x64_bin.tar.gz -C /usr/localexport JAVA_HOME/usr/local/jdk-17.0.10export PATH$JAVA_HOME/bin:$PATHsource /etc/profile1、操作步骤二、mysql黑马视频已经安装好了我们只需开放指定端口就可以在navicat中连接了&#…

阅读更多...

公有地址和私有地址

公有地址和私有地址

在计算机网络中，私有地址和公有地址是IP地址的两大重要分类，二者在网络通信中承担着不同角色。下面从定义、联系、区别和应用四个维度进行详细说明： 一、定义 1. 公有地址（Public IP Address） 公有地址是全球唯一且可在…

阅读更多...

分治思想在系统分流削峰中的实践与Golang前沿实现

分治思想在系统分流削峰中的实践与Golang前沿实现

分治思想在系统分流削峰中的实践与Golang前沿实现 1. 分治思想概述分治(Divide and Conquer)是计算机科学中一种重要的算法设计思想，其核心在于"分而治之"——将复杂问题分解为若干个规模较小的相同或相似子问题，递归地解决这些子问题&#x…

阅读更多...

移动端视口终极解决方案：使用 Visual Viewport封装一个优雅的 React Hook

移动端视口终极解决方案：使用 Visual Viewport封装一个优雅的 React Hook

前言在移动端开发中，视口高度一直是一个令人头疼的问题。尤其是在 iOS Safari 浏览器中，还有三星手机的导航遮挡，当虚拟键盘弹出时，视口高度的变化会导致固定定位元素错位、全屏布局异常等问题。本文将深入分析这个问题的本质&a…

阅读更多...

react中key的作用

react中key的作用

在 React 中，key 是一个特殊的属性（prop），它的主要作用是帮助 React 识别哪些元素发生了变化、被添加或被移除，从而高效地更新和重新渲染列表中的元素。以下是 key 的具体作用和注意事项：1. 高效更新虚拟 D…

阅读更多...

Lua学习记录 - 自定义模块管理器

Lua学习记录 - 自定义模块管理器

为人所知的是lua自带的require函数加载脚本只会加载一次(就像unity里面的资源管理和AB包管理)，而主播调试习惯是用Odin插件的Button在unity编辑器模式里调试而非进入播放模式后调试，今天主播在做热更新相关的时候企图多次调用脚本打印以调试功能&#xf…

阅读更多...

MongoDB 分片集群复制数据库副本

MongoDB 分片集群复制数据库副本

文章目录一、登录MongoDB查询数据库及集合分片情况二、登录MongoDB先创建副本数据库并设置数据库及集合分片功能三、登录MongoDB查询emop_slinkmain数据库main_repetition集合和四、使用mongodump压缩备份emop_slinkmain数据库中的main_repetition集合和shard_repetition 集合五…

阅读更多...

SQLite 加密与不加密性能对比与优化实践

SQLite 加密与不加密性能对比与优化实践

在项目中，为了保证数据安全，我们可能会对 SQLite 数据库进行加密（例如使用 SQLiteMC/SQLCipher）。然而，加密数据库在带来安全性的同时，也会带来显著的性能损耗。本文结合实测与源码分析，介绍 SQ…

阅读更多...

Azure官网为何没直接体现专业服务

Azure官网为何没直接体现专业服务

微软Azure官网没有直接、醒目地展示其专业服务（如迁移、定制化解决方案咨询等），确实容易让人疑惑。这背后其实是微软Azure特定的市场策略和商业模式。下面我为你解释原因，并告诉你怎么找到这些服务。🧩 核心原因&#…

阅读更多...

人体生理参数信号采集项目——心电信号

人体生理参数信号采集项目——心电信号

1.硬件——焊接调试趣事：由于测量手法问题，以及对示波器不太熟悉，差点以为没信号，都打算重焊一块板子了，但，实际上，信号输出是相对完美的；遇到的疑难杂症：1）5…

阅读更多...

Go1.25的源码分析-src/runtime/runtime1.go（GMP）g

Go1.25的源码分析-src/runtime/runtime1.go（GMP）g

1. 主要组成部分 Go语言的GMP调度器基于四个核心数据结构：g、m、p和schedt。 1.1 主要常量解读 1.1.1G 状态常量 const (_Gidle iota //刚分配尚未初始化的 G_Grunnable//已在运行队列上，未执行用户代码；栈未被该 G 拥有_Grunning//正在…

阅读更多...

使用jwt+redis实现单点登录

使用jwt+redis实现单点登录

首先理一下登录流程前端登录—>账号密码验证—>成功返回token—>后续请求携带token---->用户异地登录---->本地用户token不能用，不能再访问需要携带token的网页 jwt工具类 package com.nageoffer.shortlink.admin.util;import cn.hutool.core.util.…

阅读更多...

Trae配置rules与MCP

Trae配置rules与MCP

这个文章不错，不过如果只是看，还感受不到作者的震撼，所以我自己实操了一下，深受震动，也希望看到这篇文章的人也自己实操一下。与Cursor结对编程的四个月，我大彻大悟了！ 学到了什么无论是熟悉…

阅读更多...

对抗攻击与防御：如何保护视觉模型安全？

对抗攻击与防御：如何保护视觉模型安全？

对抗攻击与防御：如何保护视觉模型安全？前言一、对抗攻击的基本原理二、对抗攻击的主要类型 2.1 白盒攻击 2.2 黑盒攻击三、对抗攻击的常见形式 3.1 定向攻击 3.2 非定向攻击四、对抗防御的核心思路五、常见的对抗防御方法 5.1 对抗训练 5.2 输入预处理 5.3 防御蒸馏六…

阅读更多...

区块链开发：Solidity 智能合约安全审计要点

区块链开发：Solidity 智能合约安全审计要点

本文聚焦区块链开发中 Solidity 智能合约的安全审计要点。首先概述智能合约安全审计的重要性，接着详细介绍常见的安全漏洞，如重入攻击、整数溢出与下溢等，以及对应的审计方法。还阐述了审计的具体流程，包括自动化工具检测、手动代…

阅读更多...

C++ 新手第一个练手小游戏：井字棋

C++ 新手第一个练手小游戏：井字棋

1. 引言介于身边有特别多没有学习过编程，或者有一定C语言、python或是Java基础的但是没有接触过C的新手朋友，我想可以通过一个很简单的小项目作为挑战，帮助大家入门C。今天，我们将挑战一个对新手来说稍微复杂一点，…

阅读更多...

透射TEM 新手入门：快速掌握核心技能

透射TEM 新手入门：快速掌握核心技能

目录简介一、TEM 基本知识 1. 核心原理（理解图像本质） 2. 关键结构与成像模式（对应图像类型） 二、TEM 数据处理 1. 预处理（通用步骤） 2. 衍射花样（SAED）处理&#x…

阅读更多...

day075-MySQL数据库服务安装部署与基础服务管理命令

day075-MySQL数据库服务安装部署与基础服务管理命令

文章目录0. 老男孩思想-老男孩名言警句1. 数据库服务安装部署1.1 下载安装包1.2 系统环境准备1.2.1 关闭防火墙1.2.2 关闭selinux1.2.3 安装依赖软件1.2.4 卸载冲突软件1.3 安装程序1.3.1 上传软件包1.3.2 配置环境变量1.3.3 创建数据库存储数据目录1.3.4 创建数据库程序管理用…

阅读更多...

Qt二维码生成器项目开发教程 - 从零开始构建专业级QR码生成工具

Qt二维码生成器项目开发教程 - 从零开始构建专业级QR码生成工具

Qt二维码生成器项目开发教程 - 从零开始构建专业级QR码生成工具项目概述本项目是一个基于Qt框架开发的专业级二维码生成器，集成了开源的qrencode库，提供完整的QR码生成、预览、保存和分享功能。项目采用C语言开发，使用Qt的信号槽机制实现…

阅读更多...

最新文章