《DEEPSEEK原生应用与智能体开发实践 王晓华 书籍 图书》【摘要 书评 试读】- 京东图书

在之前讲解的示例中(指这个示例:通过Prompt提示构建思维链-CSDN博客),无论是进行日常对话还是调用特定工具,我们所依赖的底层技术均是DeepSeek普通对话模型。这一模型以其高效和稳定的性能,为我们的交流提供了坚实的基础。然而,技术的探索永无止境,DeepSeek团队在此基础上更进一步,推出了一种创新的输出方案—— DeepSeek-Reasoner推理模型,为我们与大模型的对话体验增添了新的维度。

DeepSeek-Reasoner,作为DeepSeek家族中的新成员,是一款专为复杂推理任务设计的模型。它不仅仅满足于给出一个直接的答案,而是在生成最终回答之前,会精心构建一段详尽的思维链内容。这段思维链,就像是模型在解题过程中的“草稿纸”,记录了它从问题出发,逐步分析、推理,直至得出结论的全过程。通过这种方式,DeepSeek-Reasoner显著提升了最终答案的准确性和可信度,让用户不仅知其然,更知其所以然。

为了增强透明度和互动性,DeepSeek API特别向用户开放了DeepSeek-Reasoner的思维链内容。这意味着,用户不仅可以获得最终的回答,还能深入查看模型是如何一步步得出这个结论的。这一特性对于教育、研究以及需要高度解释性的应用场景来说,无疑是一大福音。用户可以根据需要,选择查看、展示甚至进一步蒸馏这些思维链内容,以更好地理解和利用模型的推理过程。具有思维链的多轮对话如图4-3所示。

图4-3  具有思维链的多轮对话

在具体的应用场景中,当我们使用DeepSeek-Reasoner进行每一轮对话时,模型都会输出两部分内容:一部分是思维链内容(reasoning_content),它详细记录了模型的推理步骤;另一部分是最终回答(content),即模型基于思维链得出的结论。值得注意的是,为了保持对话的连贯性和简洁性,在下一轮对话中,之前轮次输出的思维链内容并不会被直接拼接到上下文中。这样的设计既保证了每轮对话的独立性,又避免了信息冗余,使得对话更加高效和流畅。

下面我们演示一下如何使用DeepSeek推理模型访问思维链和最终回答,以及如何在多轮对话中进行上下文拼接的方法,代码如下所示:

from openai import OpenAI
client = OpenAI(api_key="sk-dfd742ec38dc4ede96977974085485b0", base_url="https://api.deepseek.com")# Round 1
messages = [{"role": "user", "content": "9.11 与 9.8, 哪个数字比较大?"}]
response = client.chat.completions.create(model="deepseek-reasoner",messages=messages
)reasoning_content = response.choices[0].message.reasoning_content
content = response.choices[0].message.content
print("Answer 1:",content)# Round 2
messages.append({'role': 'assistant', 'content': content})
messages.append({'role': 'user', 'content': "一斤的铁和一斤的棉花哪个重?"})
response = client.chat.completions.create(model="deepseek-reasoner",messages=messages
)
content = response.choices[0].message.content
print("Answer 2:",content)

这个示例首先比较一个经典的数学题,之后又使用一个脑筋急转弯问题考察推理模型的思考能力,结果如下:

Answer 1: 在数值比较中,9.8 比 9.11 大。具体分析如下:1. **整数部分相同**:两数的整数部分均为 9,因此需比较小数部分。
2. **小数部分比较**:- 9.8的小数部分为 **0.8**(等价于 0.80)。- 9.11的小数部分为 **0.11**。- 由于 **0.80 > 0.11**,因此 **9.8 > 9.11**。**结论**:9.8 更大。  
(若比较版本号,则 9.11 可能代表更高版本,但按数值计算时 9.8 更大。)Answer 2: **答案:两者重量相同,都是一斤。**
1. **单位明确**:  在标准单位下,1斤(市斤)= 500克。无论是铁还是棉花,若均为“一斤”,则其质量均为500克,重量相等。2. **常见误解解析**:  铁密度大、体积小,棉花密度小、体积大,容易让人误以为“棉花更轻”。但**重量与体积无关**,仅取决于质量。因此,**一斤铁 = 一斤棉花**。3. **扩展思考(若考虑复杂因素)**:  - **空气浮力**:体积大的棉花受空气浮力影响略多,实际称重可能极轻微减少,但日常可忽略。  - **单位差异**:若使用非标准“斤”(如台斤600克),需确认单位,但通常按市斤计算。**结论**:严格按照质量单位比较,两者一样重。

从上面结果可以看到,相对于原有的输出,在问题的解答上推理模型使用了更多的推理过程与解答,并且对结果进行更细密的分析,从而获得对逻辑和推理步骤进行说明的结果。有兴趣的读者可以自行尝试更多的内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/88445.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/88445.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/88445.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

常说的电源芯片到底指什么?

电源芯片是电子系统中用于管理、转换和分配电能的集成电路,根据功能和应用场景的不同,主要分为以下几类: 一、线性稳压器(LDO, Low Dropout Regulator) LDO内部的基本电路情况如下: LDO内部主要分为四大部…

【大模型学习】项目练习:套壳DeepSeek

这里是阿川的博客,祝您变得更强 ✨ 个人主页:在线OJ的阿川 💖文章专栏:AI入门到进阶 🌏代码仓库: 写在开头 现在您看到的是我的结论或想法,但在这背后凝结了大量的思考、经验和讨论 &#x1f4…

笔记03:布线-过孔的调用与添加

布线-过孔的调用与添加 (1)在进行PCB设计时,都必须使用到过孔,对走线进行换层处理。在走线进行打过孔之前,必须先要添加过孔,这样在PCB布线时才可以使用过孔。 (2)需要使用pad des…

在vscode中,Python程序的内置对象、关键字、自定义函数名/类名、字符串进行着色,说明分别是什么颜色?

在 VS Code 中,Python 代码的着色完全取决于你当前使用的主题。不同主题(如 Dark, Monokai, Solarized Dark, Light, Quiet Light 等)对不同类型的代码元素会使用不同的颜色。 一、Default Dark(默认的深色主题) impo…

Visual Studio 中使用 AddressSanitizer 指南

Visual Studio 中使用 AddressSanitizer 指南 基于 Microsoft Visual Studio 2022,支持 MSVC 和 Clang 编译器链,本文详细说明如何在 VS 中配置和使用 AddressSanitizer,用于检测内存误用,如消息释放后访问、超界读写等类型错误。…

Flink Sink函数深度解析:从原理到实践的全流程探索

在Flink的数据流处理体系中,Sink函数作为数据处理的最终出口,肩负着将处理后的数据写入外部存储引擎的关键使命。它如同数据旅程的终点站,决定着数据的最终归宿与应用价值。深入理解Sink函数的工作原理、核心概念及实现方式,对构建…

Codex+ 自建中转 API 部署教程(Windows 版)

📌 一、前置环境准备 安装 Node.js 和 Codex CLI: npm install -g openai/codex准备 OpenAI API Key 确保你已有的中转接口兼容 OpenAI 格式, 📌 二、设置 PowerShell 环境变量 # 设置你的 API Key(使用哪家的看你的…

Centos 7离线部署Nginx 高效省时

给脚本执行权限:chmod x install_nginx.sh以root用户运行:sudo ./install_nginx.sh 脚本如下: #!/bin/bash # Nginx一键化部署脚本(修复版本开机自启) # 需要以root权限运行set -e # 任何命令失败时立即退出脚本# 定…

P7915 [CSP-S 2021] 回文

题目描述 给定正整数 n n n 和整数序列 a 1 , a 2 , … , a 2 n a_1, a_2, \ldots, a_{2 n} a1​,a2​,…,a2n​,在这 2 n 2 n 2n 个数中, 1 , 2 , … , n 1, 2, \ldots, n 1,2,…,n 分别各出现恰好 2 2 2 次。现在进行 2 n 2 n 2n 次操作&#xf…

小智AI -- ESP32-S3 DIY面包板WIFI-LCD彩屏

DIY 所需硬件 开发板:ESP32-S3-DevKitC-1(选择 WROOM N16R8 模组) Goouuu ESP32-S3-N16R8开发板数字麦克风:INMP441 INMP441全向麦克风模块功放:MAX98357A MAX98357 I2S 音频放大器模块腔体喇叭:8Ω 2~3W 或…

家用网络进行DNS优选

家用网络进行DNS优选的好处主要体现在以下几个方面: 提升网络访问速度: DNS优选通过选择响应时间更快的DNS服务器,减少域名解析的延迟,从而加快网页加载和应用访问速度。尤其在访问国内外网站时,选择合适的DNS服务器可…

刷题 | 牛客 - js中等题-下 (更ing)45/54知识点解答

JS45 数组去重 描述 为 Array 对象添加一个去除重复项的方法 示例1 输入: [false, true, undefined, null, NaN, 0, 1, {}, {}, a, a, NaN] 复制输出: [false, true, undefined, null, NaN, 0, 1, {}, {}, a] Array.prototype.uniq function () …

vue3使用krpano1.22

官方文档链接 https://krpano.com/docu/js/#top 例子 https://krpano.com/releases/1.22/viewer/examples/javascript-interface/js-api-examples.html https://krpano.com/viewsource.html?releases/1.22/viewer/examples/javascript-interface/js-api-examples.html 注…

2025年AI面试推荐榜单,数字化招聘转型优选

一、AI面试为何成为2025招聘标配? 2025年企业对AI面试的需求从“效率工具”升级为“战略级招聘伙伴”。数据显示,超7成企业计划年内全面引入AI面试,其中技术岗、全球化招聘及蓝领用工场景需求增速显著。以下以综合技术实力、行业口碑及落地能…

人机协作新篇章:艾利特按摩机器人如何重塑健康生活

引言:按摩机器人的需求爆发 在快节奏的现代生活中,亚健康人群比例持续攀升。据《全球健康产业白皮书》显示: 85%的都市人群存在肌肉劳损问题专业理疗师供需缺口达1:3200精准按摩服务成本年均增长18% 这一背景下,按摩…

从代码学习深度学习 - 情感分析:使用循环神经网络 PyTorch版

文章目录 前言1. 加载与预处理数据集数据读取与词元化构建词汇表截断、填充与数据迭代器2. 构建循环神经网络模型双向RNN模型(BiRNN)详解权重初始化3. 加载预训练词向量构建词向量加载器将预训练向量注入模型4. 训练与评估模型定义训练函数可视化训练过程5. 模型预测编写预测…

化于无形的 lambda 语法

针对数据集合的每个成员进行计算是很常见的任务,用循环语句当然能实现,但比较麻烦,算个简单的求和都要写很多句代码。 编程语言经常把这些运算封装成函数,比如 Python 的 sum 函数,求订单价格总和是这样写的&#xff…

day42

1. 回调函数:把一个函数当成“任务清单”交给另一个函数,等后者干完活,就按清单执行这个函数。比如点外卖后留电话,骑手送到了就打电话(执行回调)通知你。 2. lambda函数:临时写的超短函数&…

百度日志中台前端重构实践

日志中台是百度内部针对打点数据的全生命周期管理平台,作为公司日志数据的唯一入口,承担以下核心职能:1.功能覆盖:提供从数据采集、传输、存储到查询分析的一站式服务,支持产品运营分析、研发性能监控、运维管理等多元…

資訊安全 (Information Security)3大 “CIA“要素

資訊安全之3大要素,業界慣用"CIA"稱之,包括機密性 (Confidentiality)、完整性(Integrity)與可用性(Availability);更應增加諸如鑑別性、可歸責性、不可否認性與可靠性。 1.機密性 (Confidentiality) 機密性是指採用適當的安全機制…