二八法则-task设计最重要

80%精力设计tasks,20%精力定义agents

  • 花最多的实践定义任务说明

  • 清晰定义输入输出

  • 增加示例和预期结果来约束输出

  • 剩下的精力完善agent的role、goal、backstory

1、Agent设计三要素

role-goal-backstory框架

Role - 职能定义
  • 足够具体【作家× ,科技文档专家√】
  • 参考现实世界
  • 添加专业领域知识和技能点【一位擅长于数字信号处理的高级算法工程师】
Goal - 目标和动机定义
  • 清晰且输出聚焦
  • 具体的质量标准,包括预期是什么
  • 对什么是好的进行直观定义
Backstory - 经验和观点补充
  • 解释agent的技能树有哪些,如何获得的
  • 描述agent如何实现他们的工作
  • 创造一个具体的人物形象,确保元素、角色、目标一致性

2、专家vs通才

一定要定义成聚焦于特定领域的专家

3、专家和多功能的平衡

  • 专注于role定义,应用可以广泛一点
  • 避免过于狭隘的定义
  • 考虑多agent的协作环境

4、设置合适的专家等级

  • 新手:头脑风暴、简单执行类工作、草稿
  • 普通:多数标准任务
  • 专家:有深度、复杂的任务
  • 世界级专家:特别复杂有挑战的任务

task设计

聚焦于要干什么以及怎么干:

1、任务描述
  • 详细的执行说明
  • 背景和上下文信息
  • 范围和限制条件
  • 详细的执行步骤
2、预期输出
  • 格式说明
  • 结构和规格说明
  • 质量标准
  • 高质量输出的具体示例
3、设计要领
  • 单一目标单一输出(有多少个目标就设置多少个task)
  • 详细的输入输出设定
  • 描述目的并提供上下文信息
  • 用类似json、xml等格式约束输出

进阶设计要领

  • 不同agent的技能要互补
  • agent之间的工作交互接口要清晰
  • 运用合适的工具

迭代式agent设计

  • 从原型设计开始,一开始就构建可以运行的agent系统,逐渐优化完善
  • 使用特定的任务反复测试,评估性能
  • 仔细分析输出:了解优劣势
  • 逐步完善定义:根据结果来调整角色、目标、背景;优化任务定义
  • 协作测试:评估系统在其他协作场景下的表现

结论

  • 二八法则,主要是聚焦于task的定义【清晰的输入输出描述,单一目标,提供上下文】
  • agent设计上要多个专家协作,每一种能力设定一个agent,而不是搞一个多功能的全才
  • 根据最佳实践经验,进行迭代式优化,不要指望一次性成功【构建原型逐渐迭代,分析输出进行优化,多agent协作的时候尤其注意接口清晰,技能互补的心法】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/92794.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/92794.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/92794.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【李宏毅-2024】第六讲 大语言模型的训练过程1——预训练(Pre-training)

目录概述1. 预训练(Pre-training)2. 微调(Fine-tuning,又称 SFT,Supervised Fine-Tuning)3. 对齐(Alignment,又称 RLHF 或 DPO 等)4 三阶段对比6 第一阶段——自我学习&a…

基于LLVM的memcpy静态分析工具:设计思路与原理解析(C/C++代码实现)

在程序开发中,内存复制操作(如memcpy)往往是性能瓶颈的关键来源——尤其是大型内存块的复制,可能导致缓存失效、带宽占用过高等问题。为了精准定位这些潜在的性能热点,开发者需要一种能自动识别程序中memcpy调用&#…

使用 Conda 安装 xinference[all](详细版)

1. 安装 Miniconda(若未安装) Miniconda 是 Anaconda 的轻量版,仅包含 Conda 和 Python,适合服务器环境。 下载并安装 Miniconda 下载地址:Index of /miniconda ,可以自行选择适合的版本 # 下载最新版 …

服务器登上去,显示 failed to send WATCHDOG 重启有效吗?

文章目录 概要整体架构流程技术名词解释技术细节小结 概要 当你登录服务器时,看到类似以下提示: failed to send WATCHDOG: Resource temporarily unavailable这通常和系统的 systemd 服务有关,尤其是那些启用了 watchdog(看门…

重学React(五):脱围机制一

背景: 之前将React的基础知识以及状态管理相关的知识都过了一遍,查漏补缺的同时对React也有了一些新鲜的认知,接下来这个模块的名字很有意思:脱围机制,内容也比之前的部分难理解一些。但整体看下来,理解之后…

去除Edge微软浏览器与Chrome谷歌浏览器顶部出现“此版本的Windows不再支持升级Windows 10”的烦人提示

前言 在 Windows 7 中,安装 Microsoft Edge 109 版本后,启动浏览器时会弹出提示: 此版本的 Windows 不再支持 Microsoft Edge。升级到 Windows 10 或更高版本,以获取常规功能和安全更新。 同样地,安装 Google Chrome 1…

PWM、脉冲

要求:一、PWM输出PWM波生成原理在此处使用TIM2生成PWM,PA1输出PWM波。CNT小于CCR时,输出高电平;CNT大于CCR时,输出低电平。 输入捕获测量频率的原理输入捕获的捕获意思是它在PWM波上升沿或者下降沿的时候,会…

文件IO(1)

.文件IO1.概念标准IO是有缓存的IO,文件IO没有缓存,适合于通信、硬件设备操作标准IO是库函数,文件IO是系统调用2.系统调用与库函数系统调用:是Linux内核中的代码,只能在Linux系统中使用库函数:是对系统调用的…

【AI】Pycharm中要注意Python程序文件的位置

博主试着在本地电脑用Pycharm环境运行随便一个机器学习然后做图像识别的模型,Python的程序一直报博主学习图片的路径不正确,博主查了好几遍,也没找出问题,后来借助Deepseek才知道,Python主程序的位置一定要在Project下…

TDengine 可观测性最佳实践

TDengine 介绍 TDengine 是一款开源、高性能、云原生的时序数据库,专为物联网、车联网、工业互联网、金融、IT 运维等场景优化设计。它不仅提供了高效的数据存储和查询功能,还带有内建的缓存、流式计算、数据订阅等系统功能,能大幅减少系统设…

Jenkins 搭建鸿蒙打包

1、创建流水线工程 选择 Freestyle project 2、配置模板仓库、凭证 配置仓库地址 创建凭证,凭证选择账号-密码(能够访问该仓库的个人或管理员 Gitlab 账密) 到这里执行构建,便可以克隆仓库到工作目录 3、安装插件 3.1 Rebuild…

【SpringBoot】02 基础入门-什么是Spring Boot?:Spring与SpringBoot

文章目录1、Spring能做什么1.1、Spring的能力1.2、Spring的生态1.3、Spring5重大升级1.3.1、响应式编程1.3.2、内部源码设计2、为什么用SpringBoot2.1、SpringBoot优点2.2、SpringBoot缺点3、时代背景3.2、分布式分布式的困难分布式的解决3.3、云原生上云的困难4、如何学习Spri…

FFmpeg 编译安装和静态安装

FFmpeg 编译安装和静态安装 简介 FFmpeg 是一个领先的多媒体框架,能够解码、编码、转码、复用、解复用、流化、过滤和播放几乎所有人类和机器创建的格式。本指南将详细介绍如何在 CentOS 8.5.2111 系统上从源代码编译并安装 FFmpeg 6.1.1 版本。从源代码编译安装可…

人大BABEC地平线高效率具身导航!Aux-Think:探索视觉语言导航中数据高效的推理策略

作者: Shuo Wang1,3^{1,3}1,3, Yongcai Wang1^{1}1, Wanting Li1^{1}1 , Xudong Cai1^{1}1, Yucheng Wang3^{3}3, Maiyue Chen3^{3}3, Kaihui Wang3^{3}3, Zhizhong Su3^{3}3, Deying Li1^{1}1, Zhaoxin Fan2^{2}2单位:1^{1}1中国人民大学,2^…

01. maven的下载与配置

1.maven的下载与初步配置a.下载并配置仓库地址下载maven压缩包,并解压,解压后应有如下几个文件点击conf,打开settings.xml(我用的VScode打开的),我们需要声明一下内部仓库的地址,以及私服的一些…

1701. 请输出所有的3位对称数

问题描述请输出所有的 33 位对称数,对称数指的是一个整数 nn 正过来和倒过来是一样的,比如:101、121、282…101、121、282…请从小到大输出符合条件的3位对称数,每行 11 个。输入无。输出从小到大按题意输出符合条件的数&#xff…

C++算法·排序

排序的定义 这个不用说吧 就是根据某个条件对一个数列进行有序的操作 例如要求从小到大排序、从大到小排序等等 排序的分类 比较排序(Comparison(Comparison(Comparison Sorts)Sorts)Sorts) 特点:通过元素间的比较决定顺序 时间复杂度下限:O(nO(nO(n…

微服务项目中的注册中心——Nacos配置

从零开始:Nacos服务注册与配置中心实战教程 Nacos(Dynamic Naming and Configuration Service)是阿里巴巴开源的服务发现、配置管理工具,集注册中心与配置中心于一体,广泛应用于微服务架构。本文将从环境搭建到实战配…

日期格式化成英文月,必須指定語言環境

如果不指定Locale.ENGLISH 在有些JDK下 輸出6月 INV USD 314,791.77,DUE 25-07 [PAID USD 503,389.56 ON 2025-07-16]Mar INV USD 52,042.00,DUE 25-07 [PAID USD 52,042.00 ON 2025-08-11]所以必…

【6】Transformers快速入门:Transformer 的注意力层 是啥?

一句话看懂注意力层作用:让 AI 像人一样 “抓重点” (比如读“猫追老鼠”,自动聚焦 “追” 这个动作,忽略无关词)1. 为什么需要注意力? 问题场景(翻译例子): 英文&#x…