web/2025/9/4 20:47:55/文章来源:https://blog.csdn.net/qq_39507327/article/details/151114015

RAG（检索增强生成）的完整流程可分为5个核心阶段：

数据准备：清洗文档、分块处理（如PDF转文本切片）；
向量化：使用嵌入模型（如BERT、BGE）将文本转为向量；
索引存储：向量存入数据库（如Milvus、Faiss、Elasticsearch）；
检索增强：用户提问向量化后检索相关文档；
生成答案：将检索结果与问题组合输入大模型生成回答。

也可以从三个阶段来回答：

在 RAG 索引阶段，首先对原始文档进行解析，并将其拆分成多个较小的文本块。随后，这些文本块会通过嵌入模型进行向量化处理，生成的向量将被存储在向量数据库中，供后续检索使用。
在 RAG 检索阶段，RAG 系统会将用户的查询同样进行向量化，并在向量数据库中执行语义相似度匹配，筛选出与查询最相关的一组文本块。
最后在生成阶段，系统将用户查询与检索到的相关文本块进行组合，通过提示工程（Prompt Engineering）设计适当的输入格式，然后交由大语言模型生成最终的回答，至此完成整个 RAG 的流程。

扩展知识

文档处理的关键细节

文档分块策略：

按语义切分：用SemanticSplitter确保每块语义独立（如问答对单独成块）；
按结构切分：HTML/PDF按标题层级切割（如HTMLHeaderTextSplitter保留结构）；
递归切分：RecursiveCharacterTextSplitter兼顾文本连贯性和长度限制。

检索阶段的优化策略

多阶段检索：

粗筛：用BM25快速匹配关键词（如“iPhone 15”）；
精排：向量相似度+重排序模型（如Cohere Reranker）；

混合检索：同时使用向量和关键词结果，通过RRF（倒数排名融合）合并。

生成阶段的Prompt设计示例

▼

python

复制代码

# 示例Prompt模板（网页2） prompt = "用户问题: {query}\n相关文档: {doc1}\n{doc2}\n请结合以上信息回答。"

可以进行上下文压缩：对检索结果摘要（如RAPTOR树状摘要）减少冗余输入。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/web/95388.shtml
繁体地址，请注明出处：http://hk.pswp.cn/web/95388.shtml
英文地址，请注明出处：http://en.pswp.cn/web/95388.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

研发文档版本混乱的根本原因是什么，怎么办

研发文档版本混乱的根本原因是什么，怎么办

研发文档版本混乱的根本原因通常包括缺乏统一的版本控制制度、团队协作不畅、文档管理工具使用不当以及项目需求频繁变化等因素。这些问题使得研发团队在日常工作中容易出现文档版本混乱的情况，导致信息的不一致性、沟通不畅以及开发进度的延误。为了解决这一问题&a…

阅读更多...

ChartView的基本使用

ChartView的基本使用

Qt ChartView（准确类名 QChartView）是 Qt Charts 模块里最常用的图表显示控件。一句话概括：“它把 QChart 画出来，并自带缩放、平移、抗锯齿等交互能力”。QML ChartView 简介（一句话先记住：ChartView 是 Q…

阅读更多...

系统扩展策略

系统扩展策略

1、核心指导思想：扩展立方体在讨论具体策略前，先了解著名的扩展立方体（Scale Cube），它定义了三种扩展维度： X轴：水平复制（克隆） 策略：通过负载均衡器&#…

阅读更多...

HBuilder X 4.76 开发微信小程序集成 uview-plus

HBuilder X 4.76 开发微信小程序集成 uview-plus

简介本文记录了在HBuilder中创建并配置uni-app项目的完整流程。首先创建项目并测试运行，确认无报错后添加uView-Plus组件库。随后修改了main.js、uni.scss、App.vue等核心文件，配置manifest.json并安装dayjs、clipboard等依赖库。通过调整vite.c…

阅读更多...

第4章：内存分析与堆转储

第4章：内存分析与堆转储

本章概述内存分析是 Java 应用性能调优的核心环节之一。本章将深入探讨如何使用 VisualVM 进行内存分析，包括堆内存监控、堆转储生成与分析、内存泄漏检测以及内存优化策略。通过本章的学习，你将掌握识别和解决内存相关问题的专业技能。学习目标理解 Jav…

阅读更多...

面经分享一：分布式环境下的事务难题：理论边界、实现路径与选型逻辑

面经分享一：分布式环境下的事务难题：理论边界、实现路径与选型逻辑

一、什么是分布式事务？分布式事务是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。一个典型的例子就是跨行转账：用户从银行A的账户向银行B的账户转账100元。这个操作包含两个步骤：从A账户扣减100元。向B账户…

阅读更多...

C++的演化历史

C++的演化历史

C是一门这样的编程语言： 兼顾底层计算机硬件系统和高层应用抽象机制从实际问题出发，注重零成本抽象、性能、可移植性、与C兼容语言特性和细节很多，学习成本较高，是一门让程序员很难敢说精通的语言 C是自由的，支持5种…

阅读更多...

Qt6实现绘图工具：12种绘图工具全家桶！这个项目满足全部2D场景

Qt6实现绘图工具：12种绘图工具全家桶！这个项目满足全部2D场景

项目概述一个基于Qt框架开发的专业绘图工具，实现了完整的2D图形绘制、编辑和管理功能。该项目采用模块化设计，包含图形绘制、图层管理、命令模式撤销重做、用户界面等多个子系统，是学习现代C++和Qt框架的最佳实践。核心功能特性 12种专业绘图工具多图层绘制系统完整的…

阅读更多...

Linux驱动开发学习笔记

Linux驱动开发学习笔记

第1章 Linux驱动开发的方式mmap映射型设计方法。【不推荐】将芯片上的物理地址映射到用户空间的虚拟地址上，用户操作虚拟地址来操作硬件。使用文件操作集(file_operatiopns)设计方法。【极致推荐】platfrom总线型设置方法。【比较流行】设备树。【推荐】第2章 Linux…

阅读更多...

mac中进行适用于IOS的静态库构建

mac中进行适用于IOS的静态库构建

前沿: 进行C开发完成之后,需要将代码编译成静态库,并且在IOS的手机系统中执行,因此记录该实现过程. 1主要涉及内容 1.1 整体文件架构 gongyonglocalhost Attention % tree -L 2 . ├── build │ ├── __.SYMDEF │ ├── cmake_install.cmake │ ├── CMakeCache…

阅读更多...

C++二维数组的前缀和

C++二维数组的前缀和

C二维数组的前缀和的方法很简单，可以利用公式res[i][j]arr[i][j]res[i-1][j]prefix[i][j-1]-res[i-1][j-1]。输入4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16输出1 3 6 10 6 14 24 36 15 33 54 78 28 60 96 136#include<bits/stdc.h> using namespace std; int…

阅读更多...

Wifi开发上层学习1：实现一个wifi搜索以及打开的app

Wifi开发上层学习1：实现一个wifi搜索以及打开的app

Wifi开发上层学习1：实现一个wifi搜索以及打开的app 文章目录Wifi开发上层学习1：实现一个wifi搜索以及打开的app背景demo实现1.添加系统权限以及系统签名2.布局配置3.逻辑设计3.1 wifi开关的实现3.2 wifi扫描功能3.3 连接wifi总结一、WiFi 状态控制接口二…

阅读更多...

【DSP28335 入门教程】定时器中断：为你的系统注入精准的“心跳”

【DSP28335 入门教程】定时器中断：为你的系统注入精准的“心跳”

大家好，欢迎来到 DSP28335 的核心精讲系列。我们已经掌握了如何通过外部中断来响应“外部事件”，但系统内部同样需要一个精准的节拍器来处理“内部周期性任务”。单纯依靠 DELAY_US() 这样的软件延时，不仅精度差，而且会在延时期间…

阅读更多...

从零开始：用代码解析区块链的核心工作原理

从零开始：用代码解析区块链的核心工作原理

区块链技术被誉为信任的机器，它正在重塑金融、供应链、数字身份等众多领域。但对于许多开发者来说，它仍然像一个神秘的黑盒子。今天，我们将抛开炒作的泡沫，深入技术本质，用大约100行Python代码构建一个简易的区块链&am…

阅读更多...

网络通信IP细节

网络通信IP细节

目录 1.通信的NAT技术 2.代理服务器 3.内网穿透和内网打洞 1.通信的NAT技术 NAT技术产生的背景是我们为了解决IPV4不够用的问题，NAT在通信的时候可以对IP将私网IP转化为公网IP，全局IP要求唯一，但是私人IP不是唯一的。将报文发给路由器进行…

阅读更多...

国内真实的交换机、路由器和分组情况

国内真实的交换机、路由器和分组情况

一、未考虑拥挤情况理想状态的网络通信前面我对骨干网： 宜春城区SDH网图分析-CSDN博客数据链路层MAC传输： 无线通信网卡底层原理（Inter Wi-Fi AX201）_ax201ngw是cnvio转pci-e-CSDN博客物理层、数据链路层、网络层及传输层…

阅读更多...

atomic常用类方法

atomic常用类方法

Java中的java.util.concurrent.atomic包提供了多种原子操作工具类，以下是核心类及其方法：‌1. AtomicBoolean‌‌方法‌：get()：获取当前值set(boolean newValue)：强制设置值compareAndSet(boolean expect, boolean upd…

阅读更多...

算法题打卡力扣第3题：无重复字符的最长子串(mid)

算法题打卡力扣第3题：无重复字符的最长子串(mid)

文章目录题目描述解法一：暴力解解法二：滑动窗口题目描述解法一：暴力解遍历每一个可能的子串，然后逐一判断每个子串中是否有重复字符。具体步骤： 使用两层嵌套循环来生成所有子串的起止位置： 外层循环 i…

阅读更多...

HTML5 简介和基础骨架

HTML5 简介和基础骨架

一、HTML5 简介HTML5 是 HTML（超文本标记语言）的第五个主要版本，于 2014 年 10 月由 W3C（万维网联盟）正式发布。它不仅是对 HTML4.01 和 XHTML 的升级，更是一套完整的 Web 技术标准，包含了新的标…

阅读更多...

.NET技术深度解析：现代企业级开发指南

.NET技术深度解析：现代企业级开发指南

每日激励： “不要一直责怪过去的自己，他曾经站在雾里也很迷茫” 🌟 Hello，我是蒋星熠Jaxonic！ 🌈 在浩瀚无垠的技术宇宙中，我是一名执着的星际旅人，用代码绘制探索的轨迹。 &#x1…

阅读更多...

最新文章