什么是ReAct?

在大语言模型(LLM)领域中,ReAct 指的是一种结合了推理(Reasoning)行动(Acting) 的提示方法,全称是 “ReAct: Synergizing Reasoning and Acting in Language Models”,最早由 Google Research 在 2022 年提出。

简单理解

ReAct 提示(prompting)让语言模型不仅进行推理(思考下一步),还能主动调用工具或采取行动,并根据反馈结果继续推理和行动。

举个例子:
假设模型要回答一个关于当前天气的问题,而它本身并不知道当前天气。

传统方式(纯推理)

问:今天北京的天气如何?
答:对不起,我没有联网,无法查看当前天气。

ReAct方式(推理 reason+ 行动act)

  1. 模型先思考:要回答这个问题,我需要查找当前北京的天气。
  2. 行动:调用一个天气 API 或浏览器搜索。
  3. 接收结果:北京今天晴 32°C。
  4. 再次思考:得到了天气数据,现在可以回答了。
  5. 输出最终答案:北京今天晴,气温 32°C。

ReAct 的核心结构:

ReAct 提示通常包含多个交替的步骤,比如:

  • Thought: 我需要知道X才能解答。
  • Action: 查找X(比如调用工具或执行代码)
  • Observation: 得到X的结果。
  • Thought: 基于结果,我可以得出结论。
  • Answer: Y。

ReAct 的优点:

  • 更强的逻辑推理能力
  • 可以调用外部工具(如计算器、搜索引擎)
  • 可以进行多步思考和调整
  • 效果优于单纯的Chain-of-Thought(CoT)推理

应用场景

  • 多步骤问答
  • 工具增强型问答(Tool-augmented QA)
  • 任务规划
  • Web搜索、代码执行等

ReAct与CoT区别

什么是CoT?

Chain-of-Thought (CoT) 推理是指一种让大语言模型(LLM)在回答问题时,能够通过分步推理的方式展开思考,而不是直接给出最终答案。CoT 方法帮助模型通过逐步推理得出答案,从而避免“跳过”关键的推理过程,提升其推理和解答能力。

CoT 推理的核心概念:

CoT 推理的关键是将问题分解为多个中间步骤,让模型清楚地表达思考过程。这种方法模拟了人类在解决复杂问题时常常采用的思考方式:通过逐步分析、推导每一个小问题,最终得出结论。

举个例子:

假设我们有一个数学问题:

问题:如果有3个苹果,给了你2个苹果,现在你一共有多少个苹果?

没有CoT的回答

答:5个苹果。

使用CoT的回答

  1. 我有3个苹果。

  2. 给了我2个苹果。

  3. 所以我总共有3 + 2 = 5个苹果。

可以看到,CoT 会让模型逐步地列出每一步的推理过程,而不仅仅是直接给出答案。

CoT 在不同领域的应用:

  1. 数学推理:例如数学运算题,CoT 可以帮助模型一步步进行数值推导。
  2. 自然语言理解:处理含有多步骤的语言理解任务,如推理题、翻译、总结等。
  3. 决策过程:例如在游戏、机器人控制、医学诊断等场景中,CoT 可以帮助模型分步骤做出决策。

CoT 与 ReAct 的对比:

  • CoT 专注于推理的过程,即通过思考和推导一步步得到答案

  • ReAct 则结合了推理和行动,也就是说,它不仅进行推理,还会根据需要调用外部工具或执行某些行动(如API调用、搜索等)。

例子对比:

  1. CoT 例子
  • 问:一个果园里有 5 个树,每棵树上有 10 个苹果,一共有多少个苹果?

  • CoT 推理:

    1. 每棵树上有 10 个苹果。2. 共有 5 棵树。3. 所以总共有 5 * 10 = 50 个苹果。
    
  1. ReAct 例子(在需要查找信息的情况下):
  • 问:今天纽约的天气如何?

  • ReAct 推理:

     1. 我需要知道今天纽约的天气。2. 行动:调用天气查询 API 或搜索天气信息。3. 观察:得到今天纽约的天气是晴天,气温 30°C。4. 输出:今天纽约的天气是晴天,气温 30°C。
    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/914326.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/914326.shtml
英文地址,请注明出处:http://en.pswp.cn/news/914326.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【云服务器安全相关】服务器防火墙常见系统日志信息说明

目录✅ 一、防火墙日志是做什么的?🛠️ 二、常见防火墙日志信息及说明🧪 三、典型日志示例解析1. 被阻断的访问(DROP)2. 被允许的访问(ACCEPT)3. 被拒绝的端口访问4. 可疑端口扫描行为&#x1f…

011_视觉能力与图像处理

视觉能力与图像处理 目录 视觉能力概述支持的图像格式图像上传方式使用限制最佳实践应用场景API使用示例视觉能力概述 多模态交互 Claude 3 系列模型具备强大的视觉理解能力,可以分析和理解图像内容,实现真正的多模态AI交互。这种能力使Claude能够: 图像内容分析:理解图…

ansible自动化部署考试系统前后端分离项目

1. ✅ansible编写剧本步骤1️⃣创建roles目录结构2️⃣在group_vars/all/main.yml中定义变量列表3️⃣在tasks目录下编写tasks任务4️⃣在files目录下准备部署文件5️⃣在templates目录下创建j2模板文件6️⃣在handlers目录下编写handlers7️⃣在roles目录下编写主playbook8️⃣…

【AI论文】GLM-4.1V-Thinking:迈向具备可扩展强化学习的通用多模态推理

摘要:我们推出GLM-4.1V-Thinking,这是一款旨在推动通用多模态推理发展的视觉语言模型(VLM)。在本报告中,我们分享了在以推理为核心的训练框架开发过程中的关键发现。我们首先通过大规模预训练开发了一个具备显著潜力的…

Linux进程通信——匿名管道

目录 1、进程间通信基础概念 2、管道的工作原理 2.1 什么是管道文件 3、匿名管道的创建与使用 3.1、pipe 系统调用 3.2 父进程调用 fork() 创建子进程 3.3. 父子进程的文件描述符共享 3.4. 关闭不必要的文件描述符 3.5 父子进程通过管道进行通信 父子进程通信的具体例…

sql:sql在office中的应用有哪些?

在Office软件套件中,主要是Access和Excel会用到SQL(结构化查询语言),以下是它们在这两款软件中的具体应用: 在Access中的应用 创建和管理数据库对象: 创建表:使用CREATE TABLE语句可以创建新的数…

零基础完全理解视觉语言模型(VLM):从理论到代码实践

本文是《从LLM到VLM:视觉语言模型的核心技术与Python实现》的姊妹篇,主要面向零基础的读者,希望用更通俗易懂的语言带领大家入门VLM。本教程的完整代码可以在GitHub上找到,如果你有任何问题或建议,欢迎交流讨论。 写在…

数据结构 Map和Set

文章目录📕1. 二叉搜索树✏️1.1 查找操作✏️1.2 插入操作✏️1.3 删除操作📕2. Map的使用✏️2.1 Map的常用方法✏️2.2 TreeMap和HashMap的区别✏️2.3 HashMap的底层实现📕3. Set的使用✏️3.1 Set的常用方法✏️3.2 TreeSet和HashSet的区…

树莓派5-系统 Debian 12 开启VNC远程访问踩坑记录

简单记录一下踩坑,安装vnc远程访问服务并设置开机自启1.查看系统版本,我这里的系统版本是 12cat /etc/os-release2.安装VNC服务sudo apt install realvnc-vnc-server realvnc-vnc-viewer -y3.创建服务单元文件:sudo nano /etc/systemd/system…

TASK2 夏令营:用AI做带货视频评论分析

TASK2 夏令营:用AI做带货视频评论分析**电商评论洞察赛题:从Baseline到LLM进阶优化学习笔记**一、 赛题核心解读1.1. 任务链条与目标1.2. 关键挑战与评分机制二、 Baseline方案回顾与瓶颈分析2.1. Baseline技术栈2.2. 核心瓶颈三、 进阶优化策略&#xf…

Docker:安装命令笔记

目录 零、安装:略 一、镜像 1.0、获取镜像: 1.1、查看镜像: 1.2、删除镜像: 二、容器 2.0、创建并启动容器 2.1、tomcat和jdk9的“创建并启动容器”的命令 2.2、容器操作 2.3、容器日志操作 零、安装:略 略 …

Python七彩花朵

系列文章 序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Pytho…

【保姆级图文详解】MCP架构(客户端-服务端)、三种方式使用MCP服务、Spring AI MCP客户端和服务端开发、MCP部署方案、MCP安全性

文章目录前言一、MCP(model context protocol)1.1、概念描述1.2、MCP作用与意义1.3、MCP架构二、使用MCP(model context protocol)2.1、云平台使用MCP2.2、软件客户端使用MCP2.3、Spring AI程序中使用MCP三、Spring AI MCP(model context protocol)开发过程3.1、MCP服务端开发3…

Linux的 iproute2 配置:以太网(Ethernet)、绑定(Bond)、虚拟局域网(VLAN)、网桥(Bridge)笔记250713

Linux的 iproute2 配置:以太网(Ethernet)、绑定(Bond)、虚拟局域网(VLAN)、网桥(Bridge)笔记250713 在 Linux 中使用 iproute2 工具集配置网络是现代且推荐的方法,它取代了旧的 ifconfig、route、brctl、vconfig 等命令。iproute2 提供了统一的接口 ip …

当信任上链解码区块链溯源系统开发逻辑与产业变革

当信任上链:解码区块链溯源系统的开发逻辑与产业变革在上海某高端超市的进口水果区,消费者王女士拿起一盒车厘子,用手机扫描包装上的二维码,屏幕立刻弹出一串动态信息:智利瓦尔帕莱索港口的装船时间、海关清关的具体日…

可视化DIY小程序工具!开源拖拽式源码系统,自由搭建,完整的源代码包分享

温馨提示:文末有资源获取方式传统的小程序开发对技术要求较高,这使得许多非技术人员望而却步。可视化DIY小程序工具应运而生,它通过拖拽式操作和开源代码系统,极大地降低了开发门槛,让更多人能够快速构建个性化小程序。…

【MLLM】多模态理解GLM-4.1V-Thinking模型

note GLM-4.1V-Thinking模型引入 课程采样强化学习(RLCS, Reinforcement Learning with Curriculum Sampling) 策略,在多个复杂推理任务中实现能力突破,整体性能达到 10B 级别视觉语言模型的领先水平。GLM-4.1V-9B-Thinking 通过…

【C++详解】STL-priority_queue使用与模拟实现,仿函数详解

文章目录一、priority_queue使用仿函数控制优先级sort算法里的仿函数二、手撕优先级队列优先级队列的容器适配器入堆出堆top/size/empty迭代器区间构造初始化(解耦)三、仿函数仿函数控制冒泡排序仿函数控制priority_queue比较逻辑仿函数使用场景仿函数的其他使用场景源码一、pr…

在mac m1基于ollama运行deepseek r1

1 下载和安装 在ollama的官网下载mac m1版本的ollama https://ollama.com/ 最终获得如下所示的下载地址 https://github.com/ollama/ollama/releases/latest/download/Ollama.dmg 然后点击安装,然后测试 ollama list 2 运行deepseek r1 deepseek-r1:8b 比较适…

TCP与UDP协议详解:网络世界的可靠信使与高速快递

> 互联网的骨架由传输层协议支撑,而TCP与UDP如同血管中的红细胞与血小板,各司其职却又缺一不可 ### 一、初识传输层双雄:网络通信的基石 想象你要给朋友寄送重要文件: - **TCP** 如同顺丰快递:**签收确认+物流追踪**,确保文件完整送达 - **UDP** 如同普通信件:**直接…