RAGFlow 是一个基于深度文档理解的开源 RAG（检索增强生成）引擎。与 LLM 集成后，它能够提供真实的问答功能，并以来自各种复杂格式数据的可靠引用为支撑。

教程链接：OpenBayes 控制台

使用云平台:OpenBayes

signup - OpenBayes

首先点击「公共教程」，在公共教程中找到「构建 RAG 系统：基于 Qwen3 Embedding 的实践」，单击打开。

页面跳转后，点击右上角「克隆」，将该教程克隆至自己的容器中。

平台会默认选配好原教程所使用的算力资源、镜像版本，不需要再进行手动选择。目前平台计费方式已经更新，大家可以按照需求选择「按量付费」或「包日/周/月」。点击「继续执行」，等待分配资源。

模型文件较大，稍等容器启动 5-6 分钟后访问，否则将显示「Bad Gataway」。代码和数据同步完成，带容器状态显示为「运行中」后，打开 API 地址。

一、启动 RAGFlow 服务器

本教程已为 RAGFlow 的服务配置完毕，您无需自行部署，启动容器后，可直接点击 API 地址访问。

登录信息如下：

用户名：admin@123.com

密码：123456

二、创建一个知识库

借助多个知识库，您可以构建更灵活、更多样化的问答系统。要创建您的第一个知识库，请执行以下操作：

以下屏幕截图展示了知识库的配置页面。合理的知识库配置对于未来的 AI 聊天至关重要。例如，选择错误的嵌入模型或分块方法会导致聊天中出现意外的语义丢失或答案不匹配的情况

1.选择分块 RAGFlow 提供多种分块模板，方便对不同布局的文件进行分块，并确保语义完整性。在分块方法中，您可以选择适合您文件布局和格式的默认模板。下表列出了每个支持的分块模板的描述及其兼容的文件格式：

注意：您还可以在数据集页面上更改文件的分块方法。

2.选择嵌入嵌入模型将块转换为嵌入。一旦知识库包含块，它就无法更改。要切换到不同的嵌入模型，必须删除知识库中所有现有的块。支持以下嵌入模型：

BAAI/bge-large-zh-v1.5
maidalun1020/bce-embedding-base_v1
Qwen3-embedding（默认）

3.上传 RAGFlow 的文件管理允许您将一个文件链接到多个知识库。您也可以将单个文件或文件夹（批量上传）从本地计算机上传到知识库。建议您将文件上传到「文件管理」，然后再链接到目标知识库，以避免永久删除风险。

4.解析文件解析的两个核心操作：

对文件进行分块（依据布局）
构建嵌入和全文索引（关键字索引）

选择分块方法和嵌入模型后，即可开始解析文件。

5.干预文件解析 RAGFlow 允许您查看和干预分块结果：

点击解析完成的文件，进入 Chunk 页面
将鼠标悬停在快照上以预览每个块
双击分块文本以编辑内容或添加关键字
在测试文本中提出简单问题，即可验证检索设置是否合理。

6.运行检索 RAGFlow 使用「全文搜索 + 向量搜索」多重召回机制。建议在设置 AI 聊天前调整以下参数：

相似度阈值：默认 0.2，低于该值的块将被过滤
向量相似度权重：默认 0.3，用于调节向量相似度对总分的贡献比
Reranker模型：教程提供了Qwen3-Reranker-0.6B重排序模型
留空时使用关键词相似度和向量相似度。
配置时则使用关键词相似度与 reranker 评分。

查看更多详情

三、根据知识库建立 AI 聊天

知识库、无幻觉聊天和文件管理是 RAGFlow 的三大支柱。 RAGFlow 中的聊天基于一个或多个特定知识库。创建知识库并完成文件解析后，即可开始 AI 对话。

1.开始人工智能您可以通过创建助手来开始 AI 对话：单击页面中间顶部的「聊天选项卡 > 创建助手」，以显示下一个对话的聊天配置对话框。 RAGFlow 提供灵活的模型配置方式：每个对话可选择不同模型，也可在系统设置中配置默认模型。

2.配置助手信息

助手名称：您的聊天助手名称。每个助手都对应一个具备唯一配置的对话（知识库、提示、搜索设置等）。空响应：留空：RAGFlow 在无法检索到答案时尝试生成内容（可能出现幻觉）。填写：限制回答来源于知识库，统一返回指定内容。显示引用：默认启用。RAGFlow 会标明回答所依据的来源信息。选择知识库：支持多选。需保证所选知识库使用相同的嵌入模型，否则会报错。