RAG搭建本地AI知识库,在使用过程中遇到的三大痛点,以及相应的进阶方案。
1. RAG知识库的三大痛点
--
内容理解不足:
AI难以全面理解导入资料的内容,比如在向量编码时候,生硬的截断等导致分析结果不理想。
eg: 知识库分割器造成截断。
信息提取不准确:
AI在提取关键信息时可能存在偏差,RAG靠输入的检索字符的向量编码,和知识库中的向量编码对比,影响最终结论的准确性。
综合分析能力有限:
AI无法像人类一样进行复杂的逻辑推理和综合分析,导致结论缺乏深度。
比如:一个excel文档,有300条数据,因为rag切分之后,无法求出整个文档的最大或最小值
2. 进阶方案
引入重排序模型:
通过优化内容的排序逻辑,提高信息提取的准确性。
使用数据库MCP Server:
利用MCP(Model Context Protocol)技术,增强AI知识库的存储和处理能力。
比如:使用postgre mcp server,连接数据库,进行数据的分析。
借助超大上下文模型:
通过扩展模型的上下文能力,提升AI对复杂内容的理解与分析能力。
现在大模型的发展,prompt 长度越来越长,可以直接把整个文档或者资料库,投给大模型。
5. 实用工具和资源
CherryStudio下载:用户可以通过Cherry-ai.com下载CherryStudio。
硅基流动:访问硅基流动获取更多模型资源。
PostGreSQL MCP:通过GitHub上的PostGreSQL MCP了解更多MCP相关技术。