关键点解析

使用上下文管理器
with get_openai_callback() as cb:
这一行是核心。cb 会自动收集本次调用的 prompt tokens、completion tokens 以及 total tokens。
自动统计
在上下文退出时，cb 中已经包含了这次调用的消耗情况，无需额外手动计算。
累加到全局状态
通过：
```
state["token_count"].prompt_tokens += cb.prompt_tokens
```
就能把每次调用的消耗累加起来，便于后续统一展示。
附加信息管理
示例中我还加了 metadata，比如生成的名字和时间戳，这样就能把统计和业务逻辑自然结合起来。

from langchain_openai import ChatOpenAI
from langchain.callbacks import get_openai_callback# ========== 初始化模型 ==========
llm = ChatOpenAI(model="gpt-3.5-turbo",   # 你也可以换成 gpt-4o-mini 或其他模型temperature=0
)# 模拟全局状态，记录 Token 累计情况
state = {"token_count": {"prompt_tokens": 0,"completion_tokens": 0,"total_tokens": 0,}
}def call_llm(prompt: str):"""调用 LLM 并统计 token 消耗"""with get_openai_callback() as cb:response = llm.invoke(prompt)# 打印本次调用消耗print(f"本次调用消耗: prompt={cb.prompt_tokens}, "f"completion={cb.completion_tokens}, total={cb.total_tokens}")# 累加到全局 statestate["token_count"]["prompt_tokens"] += cb.prompt_tokensstate["token_count"]["completion_tokens"] += cb.completion_tokensstate["token_count"]["total_tokens"] += cb.total_tokensreturn response.content# ========== 示例运行 ==========
if __name__ == "__main__":result1 = call_llm("请写一首五言绝句，主题是春天。")print("模型回复:", result1, "\n")result2 = call_llm("请用一句话总结一下这首诗。")print("模型回复:", result2, "\n")print("累计 Token 使用情况:", state["token_count"])

关键点解析

相关文章

漫谈《数字图像处理》之实时美颜技术

MATLAB基于PSO（粒子群算法）优化BP神经网络和NSGA-II（非支配排序遗传算法）多目标优化

白平衡分块统计数据为什么需要向下采样？

Deathnote: 1靶场渗透

windows系统服务器测试部署springboot+vue+mysql项目

Java 与 Docker 的最佳实践

大数据工程师认证推荐项目：基于Spark+Django的学生创业分析可视化系统技术价值解析

【MySQL自学】SQL主键使用误区：你必须知道的关键细节

Electron 执行python脚本

Leetcode高频 SQL 50 题（基础版）题目记录

RAGFlow切分方法详解

支付域——支付与交易概念

（自用）cmd常用命令自查文档

剧本杀APP系统开发：引领娱乐行业新潮流的科技力量

LangChain框架深度解析：定位、架构、设计逻辑与优化方向

面试常备与开发必知：一文掌握MySQL字符串拼接的所有核心技巧

数据可视化大屏精选开源项目

LeetCode 3516.找到最近的人：计算绝对值大小

【面试】MySQL 面试常见优化问题

Access开发导出PDF的N种姿势，你get了吗？