聊聊AI上下文工程


上下文工程(Context Engineering)技术简介

核心定义

“上下文工程是一门精细的艺术与科学——其本质是在每个Agent执行步骤中,将恰到好处的信息精准填充至上下文窗口。”
—— Andrej Karpathy(前特斯拉AI总监)

技术类比

计算机系统LLM Agent系统
CPU大语言模型(LLM)
RAM上下文窗口(Context Window)
操作系统调度上下文工程策略

为什么需要上下文工程?

Agent在长任务执行中面临三大核心挑战:
⚠️ 上下文污染(幻觉信息混入)
⚠️ 上下文过载(超10万token后性能骤降)
⚠️ 工具混淆(>30个工具时准确率下降70%)

案例:Anthropic实验显示,多Agent系统通过上下文隔离使研究任务准确率提升90.2%


四大核心策略框架

🔧 1. 写入策略(Write)

场景:保存中间结果避免污染主上下文
技术实现

  • 动态草稿本:LangGraph的State对象持久化会话状态
# LangGraph状态对象示例
state = {"scratchpad": "当前计划步骤:1.检索用户历史 2.验证策略合规性"}
  • 长期记忆:Reflexion架构的自我反思记忆机制

ChatGPT实践:自动生成跨会话的用户偏好记忆

🎯 2. 选择策略(Select)

突破点:动态装载关键信息
关键技术

  • 工具动态装载:RAG筛选相关工具描述
# RAG工具选择(工具数>30时准确率↑3倍)
relevant_tools = vector_db.search("支付API", top_k=3)
  • 记忆精准召回:Embedding+知识图谱双索引

Claude Code实践:CLAUDE.md文件固化高频指令

🗜️ 3. 压缩策略(Compress)

临界值:上下文达窗口95%时自动触发
最佳实践

技术压缩率适用场景
递归摘要(Recursive)70%长对话历史
Provence修剪器85%问答场景
结构化提取90%合同/代码等文档处理
🛡️ 4. 隔离策略(Isolate)

架构革新

  • 多Agent沙箱:HuggingFace的CodeAgent架构

HuggingFace的CodeAgent架构

  • 状态隔离:LangGraph字段级上下文控制

优势:隔离高风险操作,阻止92%的提示注入攻击


LangGraph工程实践

🛠️ 全链路支持方案
策略实现方式性能增益
写入控制Checkpoint持久化机制减少40%重复推理
动态选择BigTool语义工具检索库工具选择速度↑77%
智能压缩消息列表自动摘要APIToken消耗↓65%
沙箱隔离E2B/Pyodide安全执行环境错误率↓58%
📊 效能监控方案
# LangSmith监控示例(关键指标)
metrics = {"context_utilization": "92%", "tool_call_success": "98%","hallucination_rate": "0.7%"
}

行业应用启示

  1. 金融合规场景
    Anthropic航空客服系统:

    • 结合think工具+政策提示模板
    • 合规检查准确率↑54%
  2. 代码Agent设计
    Windsurf最佳实践:

    1. AST语义代码分块  
    2. 知识图谱索引  
    3. 动态重排上下文
    
  3. 医疗诊断Agent
    关键创新:

    • DICOM影像隔离沙箱处理
    • 诊断依据动态装载机制

核心结论

上下文≠内存垃圾场:精准度 > 信息量
动态优于静态:实时装载击败全量加载
隔离创造价值:多Agent架构提升上限

“未来3年,上下文工程能力将成为Agent开发者的核心竞争力” - LangChain CTO

立即行动

  1. 用LangSmith分析上下文瓶颈
  2. 在关键节点实施Write-Select-Compress-Isolate四步策略
  3. 优先测试工具动态装载与沙箱隔离

文档版本:v2.1 | 基于LangChain技术白皮书(2025)
注:保留英文术语便于跨团队协作,关键概念附技术实现参考


参考

https://blog.langchain.com/context-engineering-for-agents/

更多技术干货欢迎关注微信公众号“风雨同舟的AI笔记”~

【转载须知】:转载请注明原文出处及作者信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/88520.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/88520.shtml
英文地址,请注明出处:http://en.pswp.cn/web/88520.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

searxng 对接openweb-UI实现大模型通过国内搜索引擎在线搜索

先看一下 qwen3-4b模型的效果 SearXNG简介:SearXNG 是一个免费的互联网元搜索引擎,它汇总了来自各种搜索服务和数据库的结果。用户既不会被跟踪,也不会被分析。 官方项目:https://github.com/searxng/searxng-docker 项目文档&a…

巨人网络持续加强AI工业化管线,Lovart国内版有望协同互补

在游戏行业全面迈入 AI 工业化时代的关键窗口期,巨人网络正以系统性布局和前瞻性战略加速AI内容生产闭环,其构建的AI工业化生产管线及多模态大模型能力矩阵,正释放出显著的生产效率和创意表达力。公司内部数据显示,自研AI代码生成…

TypeScript---class类型

一.简介 TypeScript 完全支持 ES2015 中引入的 class 关键字。 与其他 JavaScript 语言功能一样,TypeScript 添加了类型注释和其他语法,以允许你表达类和其他类型之间的关系。 1.字段 (1).在申明时同时给出类型 class Person {name: string;age: nu…

vue3中实现echarts打印功能

目录一、创建项目二、项目引入echarts1、下载依赖2、项目引用3、编写建议echarts图表三、打印功能1、增加打印按钮2、打印方法3、效果一、创建项目 老规矩,先从创建项目开始 npm create vitelatest print-demo(项目名称)第一步出现的框架选择vue,然后回车 第二步…

今日行情明日机会——20250711

上证指数放量收上影线,但依然强势,维持在5天均线上,后续调整后,上行的概率依然大;个股上涨偏多。深证指数缓慢上涨,已经突破下跌趋势线,目前依旧沿着5日线上行,后市依然值得期待。20…

「日拱一码」024 机器学习——防止过拟合

目录 数据层面 数据增强 数据正则化 ​数据采样 模型结构层面 简化模型 添加正则化层 早停法(Early Stopping) 训练过程层面 使用交叉验证 使用集成学习 调整学习率 防止过拟合是机器学习中一个非常重要的问题,它可以帮助模型在新…

持有对象-泛型和类型安全的容器

我们需要管理一批对象序列,但是又对实际运行的时候的对象类型和对象序列长度不确定的时候,用简单的对象引用无法满足,java有ArrayList,Map,Set等这些容器类提供,这些都实现了Collections接口,所以都属于Collections类。…

《财税企业经营管理秘籍(一):行业适配的获客方式》

在财税服务这片竞争激烈的红海中,客户资源如同氧气——没有它,企业寸步难行。然而残酷的现实是,许多财税企业正深陷“获客泥潭”:投入巨大精力与成本,换来的却是转化渺茫、增长停滞的困境。高质量线索,已成…

使用tensorflow的多项式回归的例子(一)

多项式回归例1%matplotlib inlineimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as plttrX np.linspace(-1, 1, 101)num_coeffs 6trY_coeffs [1, 2, 3, 4, 5, 6]trY 0for i in range(num_coeffs):trY trY_coeffs[i] * np.power(trX, i)trY np.rand…

STM32F103C8T6基于HAL库驱动NB-IoT模块BC26通信详 解

一、引言: NB-IoT技术与应用场景NB-IoT( Narrow Band Internet of Things )作为低功耗广域网( LPWAN )的核心技术,以其广覆 盖、低功耗、大连接、低成本的特性,广泛应用于智能表计、环境监测、…

iOS 性能测试工具全流程:主流工具实战对比与适用场景

在iOS开发中,性能优化往往被安排到开发后期,甚至上线前才临时补救。但性能瓶颈通常是架构设计、资源加载、动画机制等多方面共同作用的结果,仅凭肉眼感知和log输出,难以精准定位。 一套合适的性能测试工具组合,不仅能帮…

目标检测:视觉系统中的CNN-Transformer融合网络

一、背景 无人机(UAVs)在城市自动巡逻中发挥着重要作用,但它们在图像识别方面面临挑战,尤其是小目标检测和目标遮挡问题。此外,无人机的高速飞行要求检测系统具备实时处理能力。 为解决这些问题,我们提出了…

揭示宇宙的隐藏对称性:群论-AI云计算拓展核心内容

通过利用云计算,借助群论对宇宙对称性的探索,从离散群和李群等基础概念,逐步深入到量子力学和更高自旋系统中的高级应用。 对称性远不止是美学上的吸引力;它是编织在宇宙结构中的一个基本原则。从雪花的复杂图案到控制粒子的基本定…

前端项目vue3项目集成eslint@9.x跟prettier

tips: 这些涉及编辑器的修改不一定能及时生效,如果没有生效,可以试试重启编辑器窗口 编辑器集成 我的编辑器是vscode,需要安装这两个编辑器插件eslint prettier我这个配置主要是通过eslint提供的配置cli命令生成,在里面加入了对pr…

登录超时问题的排查方法与预防经验分享

​​一、排查方法​​​​检查网络连接​​确保网络稳定,尝试重启路由器或切换网络(如从WiFi切换到移动数据)。使用命令(如 ping 或 traceroute)测试网络连通性,排查是否存在丢包或高延迟。​​验证服务端状…

uniapp,Anroid10+版本如何保存图片并删除

Android 10系统开始 进一步增强了平台功能,为外部存储设备上的应用和用户数据提供了更好的保护。作为这项工作的一部分,平台引入了进一步的改进,以简化向分区存储的转换。 为了让用户更好地控制自己的文件,保护用户隐私数据&#…

Jenkins Pipeline 语法

Pipeline 简介 Jenkins2.x 的核心是使用 pipeline 来构建项目,也就是流水线,将 Jenkins1.0 版本中基于表单的配置信息比如 JDK/SVN 以及参数的配置都转变成了代码,即 pipeline as Code。 传统的表单方式有以下缺点: 需要大量的 web 表单交互,有时候需要进行很多次的切换…

搭建渗透测试环境

一、基于docker搭建靶场 #此步骤需要科学上网 #从软件源中下载 docker.io 和 docker -compose 软件包及其依赖项。 sudo apt-get install docker.io docker-compose #查看docker版本 docker -v #查看docker信息 docker info #重启docker服务 sudo systemctl daemon-reload sudo…

(一)OpenCV——噪声去除(降噪)

高斯滤波器(针对高斯噪声) 高斯噪声是指它的概率密度函数服从高斯分布(即正态分布)的一类噪声。常见的高斯噪声包括起伏噪声、宇宙噪声、热噪声和散粒噪声等等。 高斯滤波(Gaussian filter) 包含许多种,包括低通、带…

百度开源文心 4.5 系列开源大模型 GitCode 本地化部署,硅基流动:文心 vs. DeepSeek vs. Qwen 3.0 深度测评

百度开源文心 4.5 系列开源大模型 GitCode 本地化部署,硅基流动:文心 vs. DeepSeek vs. Qwen 3.0 深度测评 文章目录百度开源文心 4.5 系列开源大模型 GitCode 本地化部署,硅基流动:文心 vs. DeepSeek vs. Qwen 3.0 深度测评背景百…