参考:https://zhuanlan.zhihu.com/p/704523060

🎯 一句话记住

  • CoT:像“考试时在草稿纸上写完所有步骤,再抄答案”。
  • ReAct:像“玩密室逃脱,每开一个箱子就去找下一个线索”。

用小学生能听懂的话 + 两个小故事,把 CoT(思维链)ReAct(行动-思考交替) 的区别讲清楚。


🧠 先记住两个关键词

  • CoT:像“在心里自言自语”,把推理过程一口气说完。
  • ReAct:像“边做边说”,先动手做一步,再思考下一步,再动手……

🌰 故事 1:CoT——小明做数学题

题目:小明有 5 颗糖,妈妈又给他 3 颗,他吃掉 2 颗,还剩几颗?

小明心里的小剧场(CoT)
“我先数原来的 5 颗,加上 3 颗就是 5 + 3 = 8 颗。再吃掉 2 颗,8 - 2 = 6 颗。所以还剩 6 颗!”
一口气把推理全说完,再给出答案。
这就是 CoT:先完整思考,再回答


🌰 故事 2:ReAct——小红拼乐高

任务:拼一辆乐高小车,但说明书丢了。

小红边做边说(ReAct)

  1. 行动:先拿起轮子装上去。
    思考:咦,车身还没装,轮子会晃!
  2. 行动:拆掉轮子,先拼底座。
    思考:底座好了,轮子应该装这里。
  3. 行动:把轮子对准卡扣按进去。
    思考:现在装方向盘,车就能开了!
    每一步先做再想,再做再想……
    这就是 ReAct:行动和思考交替进行

📝 小学生总结表

CoT(思维链)ReAct(行动-思考交替)
像什么?一口气把解题步骤全说完边做实验边记录
顺序思考 → 思考 → … → 答案行动 → 思考 → 行动 → 思考…
优点逻辑清楚,一步不漏灵活应变,随时纠错
例子口算题:先算乘法,再加法拼乐高:装错了拆了重装

下面用最少的代码,把 CoT(思维链)ReAct(行动-思考交替) 各写一个可运行的小例子,全部用小学生也能看懂的“加减法”场景。


① CoT(思维链)

一口气把推理过程打印完,再给答案。

def solve_by_cot(a, b, c):# 1. 先把整个思考过程说完print(f"1. 原来有 {a} 颗糖")print(f"2. 妈妈又给 {b} 颗,一共 {a + b} 颗")print(f"3. 吃掉 {c} 颗,还剩 {a + b - c} 颗")# 2. 最后给出答案return a + b - cprint("CoT 答案:", solve_by_cot(5, 3, 2))

运行结果

1. 原来有 5 颗糖
2. 妈妈又给 3 颗,一共 8 颗
3. 吃掉 2 颗,还剩 6 颗
CoT 答案: 6

② ReAct(行动-思考交替)

每做一步就停下来“想一想”,再继续下一步。

def solve_by_react(a, b, c):total = aprint(f"行动:数出 {a} 颗糖")total += bprint(f"思考:妈妈又给 {b} 颗,现在应该有 {total} 颗")total -= cprint(f"行动:吃掉 {c} 颗")print(f"思考:所以最后还剩 {total} 颗")return totalprint("ReAct 答案:", solve_by_react(5, 3, 2))

运行结果

行动:数出 5 颗糖
思考:妈妈又给 3 颗,现在应该有 8 颗
行动:吃掉 2 颗
思考:所以最后还剩 6 颗
ReAct 答案: 6

🎯 一句话总结代码差异

  • CoT:先 print 完所有思考,最后 return 结果。
  • ReAct:每做一次运算就 print,边算边说。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/92906.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/92906.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/92906.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT指令大全:输入需求=输出完整方案

ChatGPT指令大全提供数百个精炼过的指令语句 (提示词),让你充分发挥 ChatGPT 的强大功能 一、核心功能模块分类 1. 求职与面试 简历优化 专业反馈:按面试官视角分析简历并提出改进建议量化数据:为经历添加具体数字(如提升效率30…

Java零基础入门学习知识点2-JDK安装配置+Maven

文章目录版本提示参考视频Maven环境准备一、安装Java开发工具包(JDK)二、JDK环境配置三、下载Maven安装包*四、Maven环境配置(可省略)*五、验证安装(上一步没做,这步无法验证,可省)六…

基于单片机智能衣柜/智能衣橱设计

传送门 👉👉👉👉其他作品题目速选一览表 👉👉👉👉其他作品题目功能速览 概述 本设计实现了一种基于单片机的多功能智能衣柜,融合环境检测、安全防护与用户交互功能…

自动语音识别(ASR)技术详解

语音识别(Automatic Speech Recognition, ASR)是人工智能和自然语言处理领域的重要技术,旨在将人类的语音信号转换为对应的文本。近年来,深度学习的突破推动语音识别系统从实验室走入日常生活,为智能助手、实时翻译、医…

【MySQL】MySQL 事务和锁详解

一、MySQL 事务 1.1 事务介绍 在 MySQL 中,事务(Transaction) 是一组不可分割的 SQL 操作序列,这些操作要么全部成功执行,要么全部失败回滚,以此保证数据库操作的完整性和一致性。 事务将数据库从一种一致…

虚拟直线阈值告警人员计数算法暑期应用

智慧人员计数助力暑期:技术赋能安全管理的创新实践一、背景:暑期人流激增下的安全管理挑战暑期是旅游、商业、交通等场景的客流高峰期,人员密集区域易引发踩踏事故、管理混乱等安全隐患。传统人工计数方式效率低、误差大,难以满足…

SQL164 2021年11月每天新用户的次日留存率

SQL164 2021年11月每天新用户的次日留存率 思路 ​找出新用户​:确定每个用户首次活跃的日期(即新用户) 例如101用户在11月1日首次出现 ​处理跨天活跃​:考虑用户可能跨天活跃的情况(in_time和out_time不在同一天&a…

基于单片机的数字电压表设计

2 系统原理及基本框图 如图2.1所示,模拟电压经过档位切换到不同的分压电路衰减后,经隔离干扰送到A/D转换器进行A/D转换,然后送到单片机中进行数据处理。处理后的数据送到LCD中显示,同时通过串行通讯与上位机通信。图2.1系统基本方…

[NLP]UPF基本语法及其在 native low power verification中的典型流程

UPF基本语法及其在 native low power verification中的典型流程 摘要:本文首先简要介绍 UPF(Unified Power Format),然后解释其在 native low power verification(原生低功耗验证)中的典型流程。最后,我将使用50个具体例子来完整展示 UPF 的关键语法。这些例子基…

fish-speech 在50系列显卡使用 --compile加速兼容

#环境说明 GPU: NVIDIA GeForce RTX 5080 Laptop GPU (sm_120) win11家庭版 24H2 #问题汇总 baize.exceptions.HTTPException: (500, "RuntimeError: ptxas failed with error code 4294967295: \\n\\n") 问题汇总 1 baize.exceptions.HTTPException: (500, "…

UI自动化测试实战

Python接口自动化测试零基础入门到精通(2025最新版)一、设计背景 随着IT行业的发展,产品愈渐复杂,web端业务及流程更加繁琐,目前UI测试仅是针对单一页面,操作量大。为了满足多页面功能及流程的需求及节省工…

面试实战,问题六,被问数据库索引,怎么回答

Java开发面试:数据库索引的原理及常见问题解答 在Java开发面试中,数据库索引是核心知识点,涉及数据库优化和性能调优。索引通过高效的数据结构加速数据检索,降低磁盘IO成本,并支持排序操作。下面我将逐步解释索引的原理…

ARM-I2C硬实现

硬件I2C-GD32F4系列的实现初始化操作在初始化函数里执行以下代码uint32_t i2cx_scl_port_rcu RCU_GPIOB; uint32_t i2cx_scl_port GPIOB; uint32_t i2cx_scl_pin GPIO_PIN_6; uint32_t i2cx_scl_af GPIO_AF_4;uint32_t i2cx_sda_port_rcu RCU_GPIOB; uint32_t i2cx_sda_po…

WinUI3开发_过渡动画

简介 过渡动画是当发生事件时控件UI状态发生改变时以一种动画形式来演变到另外一种状态,而非瞬间改变,使用一种更加平滑的方式来进行切换,例如下图是文字切换的交叉栅栏效果:还有页面切换动画:在或者是图标动画&#x…

Linux下提权root权限

现在AI工具这么丰富,稍微搜一下就有一个差不多的总结输出。但是,可能还不够详细,或者给得太多~~~今天时间关系,今天只总结了在Linux如何提权到root,并没有写如何进行防护。后面有时间,我再总结一下。命令实…

焊接机器人节能先锋

汽车制造业中,机器人技术的应用已成为推动工业自动化和生产效率提升的重要力量。机器人在焊接、组装、涂装等关键制造环节中扮演着不可或缺的角色。随着工业生产规模的不断扩大,能源消耗和成本控制成为了企业必须面对的重大挑战。尤其是工业焊接用气的大…

MinIO:云原生对象存储的终极指南

MinIO 是什么? MinIO 是一款高性能、云原生的对象存储服务,具有以下优势: 轻量级部署:采用 Go 语言编写,资源占用低,支持快速部署 兼容性强:完全兼容 Amazon S3 API,轻松对接现有应用 高可用架构:支持分布式部署,确保数据持久性和服务可用性 高性能表现:专为云环境…

Spring AOP `MethodInvocation` 工作原理

⚙️ 一、通知到 MethodInterceptor 的转换机制 Spring AOP 通过适配器模式将开发者定义的注解型通知(如 Before)统一转换为 MethodInterceptor 接口实现,确保所有通知类型能接入同一调用链。以下是转换细节: 1. 适配器实现原理 核…

PPO原论文阅读

一、Introduction1.目前存在的问题:(deep)Q-learning:在一些简单问题上表现不佳,可理解性差基础的policy gradient算法:(如REINFORCE)鲁棒性差,需要大量数据TRPO:复杂,在包含噪音&am…

零基础也能创作专属歌曲:文心一言+蘑兔AI协同教程

在AI技术飞速发展的今天,音乐创作已不再是专业音乐人的专属领域。通过文心一言与蘑兔AI的协同使用,即使没有音乐基础,也能轻松完成从歌词创作到作曲编曲的全流程。本文将详细拆解操作步骤,助你快速上手,实现音乐创作梦…