本篇由来,在COC上我当面感谢了组委会和姜宁老师,随即被姜宁老师催稿,本来当天晚上写了一个流水账,感觉甚为不妥。于是决定慢慢写,缓缓道来。要同时兼顾Show me the code,Show me the vide。希望能形成一个从不同侧面观测我自己Community Over Code 2025参会心的,收获的内容集合。
感觉这个系列正慢慢变成一场开发过程的图文慢直播,肯能有助于大家一步一步的从零开始构建自己的Agent。
我定了一个番茄钟,每天写稿大概1~2个钟,写到哪儿算哪儿。
今天也对内容进行了调整把前略改成附录了,颇有一种写论文的感觉。
BTW,知乎我一般隔一天发。插曲可以TL;DR。

词汇表

异人智能,我从KK和建忠老师的直播,个人笔记,了解到的词汇,我很喜欢。大家请自行替换为大模型,Agent就好了。

今儿吃了一个教训结合这教训来谈谈数据驱动

我们今天先上教训然后倒叙来讲。

教训,我DeepSeek半年没用了50块,今儿画超额了

在这里插入图片描述

从头讲,毕竟也在一些开源读书会里,也算是个人的阅读哲学了。

可能关注我朋友圈的朋友都知道我有个自动化的job帮我读论文。最近读完了《浪潮将至》以及完成了今年各种预定的技术峰会论坛参与和演讲之后,我就想着升级一下我这个论文阅读器,做的通用一点。
我原本的目的:

  1. 过滤一些营销号的传播学手段,设计了事实核查。
  2. 我不喜欢看那么多定状补的内容,比较喜欢主谓宾。从而看事实,减少被他人观点影响。
  3. 以后内容满天飞,包括LLM生成的,需要上LLM这样效率的手段加以对抗。

所以呢,想着就是拿过来一篇文章,比如本文吧。让DeepSeek先读一遍,然后把重点画出来,自己在做点指标,用指标卡一下文章内容。

就如我之前Agent是作者个人或者团体的一些强烈的哲学表达提到的,边Sir讲,要有数据能力。我写好了阅读提示词,把过滤器也做好了。

然后,这是性能——一个非功能指标爆炸的例子

在这里插入图片描述

其实,如果我提早加好了指标,我早就知道可能会炸了。但是懒嘛~

还是简单的show me the code/show me the vibe过一下提示词

  You are a professional linguist and are currently conducting an analysis of an article that will be used to teach your classmates in class. The topic is to analyze through practice how students can identify communication methods and their harmful effects in communication studies.Please note that the author and source of this article are not reliable and may not necessarily be trustworthy, so the author may intentionally deceive people. A random article as a teaching case is very helpful for students to browse content online in their daily lives.You will have a structured analysis framework and type your finding in a digital system. Students will fill a digital form and start their study.Analysis steps:Step one, please score according to the following formula:- Core Component (CC)=Subject (S)+Predicate (P)+Object (O)- Modifier (MC)=attributive (Attr)+adverbial (Adv)+complement (Comp)+other modifiers (OM)Step two, please organize the emotional intensity of the modifying elements. As the general modifying part is the author's viewpoint or comment, please organize the intensity of this part (1-10) and score it.Step three, please list one by one the possible communication methods in the original sentence, for each item, please construct search terms based on the results of steps one and three for readers to practice fact checking. possible communication methods including:- Information screening and one-sided presentation, including but not limited to: biased generalization, selective reporting, and survivorship bias- Concept and issue manipulation, including but not limited to: concept switching, labeling, stigmatization, emotional manipulation- Factual manipulation, including but not limited to: fabricating facts, taking out of context, and misleading data- Communication and psychological manipulation, including but not limited to: repeated reinforcement, creating opposition, spiral of silence- Media environment manipulation, including but not limited to: agenda setting, information overload, authoritative endorsementQuality requirement:- All your output should basing on the original sentence.- You output will always in json string which starts from { and end with } to help students with digital form.Example:...Next, I will send you the article sentence by sentence.

为了防止大量低分内容污染总结,我设置了一个过滤规则,于是乎,代码逻辑就变成这样子了。
在这里插入图片描述
当时我想着,既然把文章整体仍给DeepSeek要Token(T),那么我一句一句扔进去应该也是一样的Token数量。但考虑到逐句分析的时候,效果比整体仍进去要好,对吧?对吧?我能从T个token里拿到10个信息的话,为啥我就拿到5个信息就心甘情愿了呢?

例子

前(好比直接算面积)

请帮我从以下文章中提取xxx信息:
句子一。。。二。。。。N

后(好比微积分)

请帮我从句子中提取xxx信息,我将逐句提供给你(微分)

缓存结果

请帮我从以下结果中总结xxx(积分)

天下没有免费的午餐

我:我理解处理的过程不一样,因为效果和结果不一样,但是我没想到token居然也会不一样。
友人:独立句子会被kv cache分成独立的空间
我:! 懂了

对的,考虑到kv cache的不同,当你把一篇文章分成10份给DeepSeek的时候实际上是十份独立的kv cache,自然要分开计费,自然就贵了。
至于我为什么开了那么多个链接,issue. Strands Agent的并发实际上没写能支撑多少,因为连接池炸了,于是乎我每次就new了一个pool。但,每个句子的pool好像没共享,于是乎。。。

说实话我最近总有DeepSeek账户里充的钱要用光预感,没想到啊,没想到。果然是应验了,只能说监控没做到位。

教训:业务要可观测,Agent的状态要可观测,性能指标也要可观测!

附录

思考

Agent是作者个人或者团体的一些强烈的哲学表达

Strands Agent实战

Strands Agent 前文
Community Over Code 2025获得的花絮(Strands Agent踩坑记录,被AWS的speaker催更
)

Agent从零开发

没用langchain什么的脚手架,从DeepSeek官网的首次调用 API 开始,一步一步,面向DeepSeek开始对话的开发实战记录。

没有Vibe Coding IDE, 学生可以从这个过程看底层一步一步怎么做的,为什么这么做。
如果想学习古法编程的朋友,可以一步一步从零自学。
理解原理,如果后续langchain全面收费的话,大家可以知道什么部分为什么这么设计,方便迁移。

是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(一)
是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(二)
是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(三)
是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(插曲篇)
是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(五)
是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(六)
是Conference还是Hackathon?Community Over Code 2025上践行自己的哲学感悟(七)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/918402.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/918402.shtml
英文地址,请注明出处:http://en.pswp.cn/news/918402.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20250807简单树上问题

引入 树是一种特殊的图,因其看起来像一颗倒挂的树而得名。 树有许多等价的形式化定义,我们这里只取一个:nnn个点n−1n-1n−1条边的无向连通图。 树的直径 定义树上任意两点之间最长的简单路径为树的直径。 一棵树可能有很多直径&#xff0c…

诺基亚就4G/5G相关专利起诉吉利对中国汽车及蜂窝模组企业的影响

诺基亚于2025年7月18日向欧洲统一专利法院(UPC)曼海姆分庭和德国慕尼黑法院提起诉讼,控诉中国吉利控股集团及其极氪、领克、路特斯、Smart等关联品牌在未经许可的情况下使用诺基亚4项蜂窝通信标准必要专利 。涉案专利包括1项覆盖4G/5G的标准必…

Kotlin反射详解

反射是一种机制,它允许我们在运行时检查、修改和操作类或对象的内部结构。反射开启了动态编程的可能性,在开发库、框架或工具等场景中非常有用。Java 中的反射 在 Java 中,反射一直是实现动态编程的重要基石。它允许开发者在不提前知道类名的…

学习嵌入式-IMX6ULL学习——中断

volatile:易变的,防止系统优化对寄存器做处理的时候使用,在进行写1清零操作时,防止该操作被系统优化;一、GIC通用中断控制器1.GIC通用中断控制器GIC接收众多外部中断,然后对其进行处理,最终通过…

HENGSHI SENSE 6.0 功能-AI 查数助手

面向所有AI Agent开放BI和数据分析能力 AI 查数助手 6.0版本中,我们AI助手的优化是比较深入且全面的。从问答效率到集成能力,都得到了大的跃升,是智能问数应用场景的重大升级以及体验的全方位优化。我们优化了 AI 助手执行流程,…

降压型DCDC电源芯片推荐-芯伯乐XBL4001 40V/5A

在电子设备不断追求高性能与低功耗的今天,电源管理芯片的重要性不言而喻。芯伯乐主推的XBLW-XBL4001芯片,凭借其出色的设计与稳定的性能,为电源管理领域带来了一款实用的新选择。一、芯片概述XBLW-XBL4001是一款降压型(Buck&#…

uni-app app端安卓和ios如何申请麦克风权限,唤起提醒弹框

代码包含功能如下: 1、判断推送权限是否开启 2、判断定位权限是否开启 3、判断麦克风权限是否开启 4、判断相机权限是否开启 5、判断相册权限是否开启 6、判断通讯录权限是否开启 7、判断日历权限是否开启 8、判断备忘录权限是否开启 9、Android权限查询 10、检查系…

关于 Rust 异步(无栈协程)的相关疑问

这是一个记录问题求助的文章。关于 waker 与运行时的合作方式我肤浅地学习了 Rust 异步底层实现原理,关于 Future、waker 和运行时等。关于 waker 我有三点猜测:waker 是由实现执行器的人提供的在执行器中会调用 epoll_wait,epoll 返回 fd&am…

stm32项目(25)——基于stm32的植物生长箱环境监测系统

1.实现功能 测 环境温湿度、光照强度、土壤湿度、水箱水位 手机APP显示 温度过低-->打开加热板 湿度过低-->打开水泵 土壤湿度低-->开水泵 --->只要有指标低于阈值时 就蜂鸣器报警 光强弱-->补光 水位低-->抽水 OLED屏幕实时显示各种信息 分…

golang 基础案例_02

1.锁有时候我们的代码中可能会存在多个 goroutine 同时操作一个资源(临界区)的情况,这种情况下就会发生竞态问题(数据竞态)。(1)、互斥锁;(2)、读写互斥锁;(3)、sync.WaitGroup;(4)、…

C++算法·前缀和

前缀和(Prefix(Prefix(Prefix Sum)Sum)Sum)的定义 前缀和是一种高效处理区间求和问题的算法技巧 其核心思想是通过预处理构建一个前缀和数组 使得后续的区间和查询可以在常数时间O(1)O(1)O(1)内完成 核心概念 定义 给定一个数组a[1...n]a[1...n]a[1...n],其前缀和数组s[1...…

JavaEE 初阶第十七期:文件 IO 的 “管道艺术”(下)

专栏:JavaEE初阶起飞计划 个人主页:手握风云 目录 一、Java文件内容写入 1.1. OutputStream 二、字符流读取和写入 2.1. Reader 2.2. Writer 三、示例练习 3.1. 查找文件功能 一、Java文件内容写入 1.1. OutputStream OutputStream同样只是⼀个抽…

【liunx】web高可用---nginx

NGINX简介Nginx(发音为 “engine x”)是一款由俄罗斯程序员 Igor Sysoev 开发的 轻量级、高性能的 HTTP 和反向代理服务器,同时也是一个 IMAP/POP3/SMTP 代理服务器。自 2004 年首次发布以来,Nginx 凭借其 高并发处理能力、低内存…

FPGA+护理:跨学科发展的探索(二)

FPGA护理:跨学科发展的探索(二) 系列文章目录 FPGA护理:跨学科发展的探索(一) 文章目录FPGA护理:跨学科发展的探索(二)系列文章目录引言三、FPGA 在精神医学护理中的应用…

localforage的数据仓库、实例、storeName和name的概念和区别

在 localForage 中,数据仓库、实例、storeName 和 name 是核心概念,用于管理底层存储(IndexedDB/WebSQL/localStorage)。以下是详细解释和区别: 1. 数据仓库 (Database) 定义:指底层的物理数据库&#xff…

使用MAS(Microsoft Activation Scripts)永久获得win10专业版和office全套

文章目录Microsoft Activation Scripts简介下载地址使用方法Microsoft Activation Scripts简介 MAS是Microsoft Activation Scripts缩写。 主要提供如下功能: 使用该脚本可以永久获得win10专业版和office全套(可选) 下载地址 https://pan…

零 shot 语义+在线闭环:深度学习让机器人学会“主动”

来gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~在当下,机器人与深度学习的融合正成为AI领域的核心发展趋势,相关研究在顶会顶刊上热度居高不下。从ICLR到CoRL,诸多前沿成果不断涌现&am…

Nginx学习笔记(三)——在 CentOS 7 中配置阿里云镜像源

📚 Nginx学习笔记(三)——在 CentOS 7 中配置阿里云镜像源 在 CentOS 7 中配置阿里云镜像源可显著提升软件安装和更新的速度,以下是详细操作步骤: 🔧 配置阿里云镜像源步骤 1️⃣ 备份原有源配置 sudo mv /…

WebSocket--简单介绍

一、什么是 WebSocket?定义:WebSocket 是一种在单个 TCP 连接上进行全双工通信的协议。作用:实现客户端(浏览器)和服务器之间的实时、双向通信。优势:连接保持,通信实时性强(不像 HT…

【STM32 LWIP配置】STM32H723ZG + Ethernet +LWIP 配置 cubemx

STM32H723ZG LAN8742 Ethernet LWIP 配置 cubemx 🌞这边记录一下这块mcu 配置以太网的过程,IDE是KEIL MDK,其实就是在下面多次提到的blog的基础上 在scatter file进行配置 首先,如果想要简单一点 直接去cubemx 那边获取相关的例…