深度定制 LLM 知识,除了 RAC ，现在又有新技术

假设有一份200页的产品手册,你想让 LLM 准确回答里面的相关问题,要实现这个目标,除了常用的检索增强生成技术 rep ,现在有了新思路,缓存增强生成 CAG ，它是什么,何时使用.

在这里插入图片描述

RAG检索增强是常规套路,CAG缓存增强是后起之秀让我们来对比一下他们的优缺点. 我们先来了解一下,检索增强生成 RAG 的工作流程

RAG检索增强流程

在这里插入图片描述

第一步索引阶段这个步骤在提前处理的情况下也允许动态加入

就像煮饭备料一样

RAG 会将文档切成小块
再转换成向量
存入向量数据库

第二步查询阶段

用户提问后

系统将问题转为向量
在向量数据库中检索相似内容

第三步增强阶段

将检索到的相关内容添加到提示词中

第四步生成阶段

LLM 基于增强后的提示词生成回答

RAG工作流程缺点

了解过 RAG的工作流程,它的局限性大家可能也都猜到了

检索存在延迟
检索的质量和内容影响回答准确性
架构复杂,需要费心维护向量数据库

CAG检索增强流程

在 RAG 基础上,CAG 提供了另一种解题思路, 它比 RAG 工作流程更短主要包括两个阶段
在这里插入图片描述

第一阶段预处理流程

对知识源进行处理,提取关键信息
接着将信息结构化
利用 LLM 将文档转化为键值对缓存

以一本书为例, 就是把它的关键内容, 组成对应关系进行缓存. 像
章节标题对应章节摘要、人物名称对应人物描述、核心概对应概念解释、常见问题对应答案

第二阶段查询流程

初始阶段,所有键值对都加载到缓存当中
把缓存加载到 LLM 的上下文窗口中
与用户提问一起发送给 LLM
LLM 直接从上下文的知识缓存中检索, 并生成回答

CAG检索增强流优势

省略了检索步骤使 CAG 拥有了明显的优势,

无检索延迟,响应自然更快,
LLM 直接加载所有缓存知识回答一致性更高,
无检索系统架构更简单,降低了维护的复杂性

最后我们来总结一 RAG 和 CAG 到底何时用

何时使用 RAG的场景

有规模庞大的知识库, 如超出 LLM 上下文窗口容量的,
更新频繁的资料
面向开放领域的多样化问题
需要精准引用原文出处的

何时使用 CAG 的场景

知识领域固定且规模适中的: 如书籍
看重响应速度用 CAG 能快几秒
需要全局理解和一致性: 如财务报表分析,
可以被有效提炼和结构化的知识

总结

RAG 和 CAG ,它们代表了两种不同的知识增强范式一个动态检索、一个预加载缓存
选择哪种技术取决于你的具体需求,知识规模和性能要求
在这里插入图片描述

文章:
https://blog.csdn.net/simoncool23/article/details/145224445

RAG检索增强流程

第一步索引阶段这个步骤在提前处理的情况下也允许动态加入

第二步查询阶段

第三步增强阶段

第四步生成阶段

RAG工作流程缺点

CAG检索增强流程

第一阶段预处理流程

第二阶段查询流程

CAG检索增强流优势

最后我们来总结一 RAG 和 CAG 到底何时用

何时使用 RAG的场景

何时使用 CAG 的场景

总结

相关文章

基于vue、node.js、express的网络教学系统设计与实现/基于vue、node.js、express的在线学习系统设计与实现

享元模式引发的关于ECS和对象池的思考记录

STM32驱动SG90舵机全解析：从PWM原理到多舵机协同控制

goland怎么取消自动删除未使用的包

halcon基于透视的可变形模型匹配

Flink Stream API - 源码开发需求描述

「 CentOS7 安装部署k8s」

Disbursement on Quarantine Policy（概率、逆元计算期望）

AI 在金融领域的落地案例

平衡二叉树的调整

深入解析：如何设计灵活且可维护的自定义消息机制

PostgreSQL——用户管理

东软8位MCU使用问题总结

深度学习在订单簿分析与短期价格预测中的应用探索

Hashmap源码

【JAVA 字符串常量池、new String的存储机制、==与equals的区别，以及字符串重新赋值时的指向变化】

博客项目 Spring + Redis + Mysql

前端处理导出PDF。Vue导出pdf

【GM3568JHF】FPGA+ARM异构开发板烧录指南

C++ 多进程编程深度解析【C++进阶每日一学】

RAG检索增强流程

第一步 索引阶段 这个步骤在提前处理的情况下 也允许动态加入

第二步 查询阶段

第三步 增强阶段

第四步 生成阶段

RAG工作流程缺点

CAG检索增强流程

第一阶段 预处理流程

第二阶段 查询流程

CAG检索增强流优势

最后我们来总结 一 RAG 和 CAG 到底何时用

何时使用 RAG的场景

何时使用 CAG 的场景

总结

相关文章

第一步索引阶段这个步骤在提前处理的情况下也允许动态加入

第二步查询阶段

第三步增强阶段

第四步生成阶段

第一阶段预处理流程

第二阶段查询流程

最后我们来总结一 RAG 和 CAG 到底何时用