以下是一份在 Ubuntu 系统上本地部署 RAGFlow 的详细教程。
一、基础环境准备
1.硬件要求
–CPU ≥ 4核
–RAM ≥ 16 GB
–磁盘空间 ≥ 50 GB(建议 SSD)

2.系统配置

更新系统

sudo apt update && sudo apt upgrade -y

设置内核参数(Elasticsearch 必需)

sudo sysctl -w vm.max_map_count=262144
echo “vm.max_map_count=262144” | sudo tee -a /etc/sysctl.conf # 永久生效

二、安装 Docker 与 Docker Compose
1.卸载旧版本(如有)

sudo apt remove docker docker-engine docker.io containerd runc
2.安装依赖与 Docker

sudo apt install apt-transport-https ca-certificates curl gnupg-agent software-properties-common
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable”
sudo apt update
sudo apt install docker-ce docker-ce-cli containerd.io
3.安装 Docker Compose v2.26.1+

sudo curl -L “https://github.com/docker/compose/releases/download/v2.26.1/docker-compose- ( u n a m e − s ) − (uname -s)- (unames)(uname -m)” -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
4.配置国内镜像加速
创建 /etc/docker/daemon.json:

Json {
“registry-mirrors”: [“https://docker.1panel.live”, “https://dockerproxy.cn”]
}
重启服务:
sudo systemctl daemon-reload
sudo systemctl restart docker

三、部署 RAGFlow
1.克隆仓库

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
chmod +x ./entrypoint.sh # 授予执行权限
2.启动服务(默认使用 CPU 版本)

docker compose -f docker-compose.yml up -d
注:GPU 加速需使用 docker-compose-gpu.yml(需已安装 NVIDIA 驱动) 。
3.验证服务状态

docker logs -f ragflow-server # 出现 “RAGFlow is running!” 即成功
4.访问 Web UI
浏览器打开:http://<服务器IP>:8080(默认端口 8080,可在 .env 中修改 SVR_HTTP_PORT) 。

四、配置 Ollama 本地模型
1.安装 Ollama

curl -fsSL https://ollama.com/install.sh | sh
2.修改配置文件(监听所有 IP)

sudo vim /etc/systemd/system/ollama.service
添加两行:
Ini [Service]
Environment=“OLLAMA_HOST=0.0.0.0:11434”
Environment=“OLLAMA_MODELS=/path/to/ollama_cache” # 自定义模型存储路径
重启服务:
sudo systemctl daemon-reload
sudo systemctl restart ollama
3.下载模型(如 DeepSeek-R1)

ollama run deepseek-ai/deepseek-r1:latest

⚙️ 五、RAGFlow 模型与知识库配置
1.Web UI 中添加 Ollama 模型
–登录 RAGFlow → 右上角头像 → 模型供应商 → 选择 Ollama
–填写信息:
•模型名称:deepseek-r1(与 ollama list 名称一致)
•基础 URL:http://<服务器IP>:11434
•最大 Token:4096

2.设置系统模型
–聊天模型:选择刚添加的 deepseek-r1
–嵌入模型:推荐 shaw/dmeta-embedding-zh:latest(需先通过 Ollama 下载)

3.创建知识库
–知识库 → 新建知识库 → 上传文档(支持 Word/PDF/Excel 等)
–配置解析方法(按文档类型选择模板)

4.新建助理并测试
–聊天 → 新建助理 → 绑定知识库 → 开始问答测试

⚠️ 六、常见问题解决
•端口冲突:修改 ragflow/docker/.env 中的 SVR_HTTP_PORT,重启服务。
•镜像拉取慢:确保 Docker 镜像加速配置生效(见第二.4步)。
•Ollama 连接失败:检查防火墙是否放行 11434 端口,确认 OLLAMA_HOST 配置正确。
•模型加载错误:确认 Ollama 模型名称与 RAGFlow 中填写一致,且已下载完成。

💎 总结
本教程覆盖了从系统配置到模型集成的全流程,关键点包括:
1.内核参数 vm.max_map_count 对 Elasticsearch 至关重要;
2.Docker 镜像加速可大幅提升部署效率;
3.Ollama 需配置为 0.0.0.0 监听以实现跨容器通信;
4.知识库支持的文档类型丰富,解析方法需匹配文件格式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/87871.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/87871.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/87871.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[netty5: WebSocketClientHandshaker WebSocketClientHandshakerFactory]-源码分析

在阅读这篇文章前&#xff0c;推荐先阅读以下内容&#xff1a; [netty5: WebSocketFrame]-源码分析[netty5: WebSocketFrameEncoder & WebSocketFrameDecoder]-源码解析 WebSocketClientHandshakerFactory WebSocketClientHandshakerFactory 是用于根据 URI 和协议版本创…

4.2 如何训练⼀个 LLM

⼀般⽽⾔&#xff0c;训练⼀个完整的 LLM 需要经过图1中的三个阶段——Pretrain、SFT 和 RLHF。 4.2.1 Pretrain 预训练任务与架构 任务类型&#xff1a;采用因果语言模型&#xff08;CLM&#xff09;&#xff0c;通过预测下一个 token 进行训练&#xff0c;与传统预训练模型…

Qt中的QObject::moveToThread方法详解

一、QObject::moveToThread方法QObject::moveToThread()是Qt框架中一个非常重要的功能&#xff0c;它允许改变QObject及其子对象的线程关联性。这个功能在多线程编程中特别有用&#xff0c;可以将耗时操作移到工作线程执行&#xff0c;避免阻塞主线程/GUI线程。基本用法void QO…

【9】用户接入与认证配置

本文旨在帮助网络管理员在 SD-WAN 环境中实现安全、稳定的用户接入与认证策略,涵盖本地/远程认证、权限管理、密码策略、SSH、会话控制等关键配置要素。 1.密码策略与账户安全 从 IOS XE SD-WAN 17.3.1 起,Cisco 引入密码强化功能,用于统一用户密码的复杂度与有效性要求。密…

第十六节:第三部分:多线程:线程安全问题、取钱问题的模拟

线程安全问题介绍&#xff1a;取钱的线程安全问题 取钱的线程安全问题 取钱案例需求分析 线程安全问题出现的原因 代码&#xff1a;模拟线程安全问题&#xff08;上述取钱案例&#xff09; Account类&#xff08;账户类&#xff09; package com.itheima.day3_thread_safe;pu…

APE:大语言模型具有人类水平的提示工程能力

摘要 通过以自然语言指令作为条件输入&#xff0c;大型语言模型&#xff08;LLMs&#xff09;展现出令人印象深刻的通用计算能力。然而&#xff0c;任务表现严重依赖于用于引导模型的提示&#xff08;prompt&#xff09;质量&#xff0c;而最有效的提示通常是由人类手工设计的…

X86 CPU 工作模式

1.概述 1.实模式 实模式又称实地址模式&#xff0c;实&#xff0c;即真实&#xff0c;这个真实分为两个方面&#xff0c;一个方面是运行真实的指令&#xff0c;对指令的动作不作区分&#xff0c;直接执行指令的真实功能&#xff0c;另一方面是发往内存的地址是真实的&#xff…

Java设计模式之行为型模式(策略模式)介绍与说明

一、策略模式简介 策略模式&#xff08;Strategy Pattern&#xff09;是一种行为型设计模式&#xff0c;它定义了一系列算法&#xff0c;并将每个算法封装起来&#xff0c;使它们可以相互替换&#xff0c;且算法的变化不会影响使用算法的客户。策略模式让算法独立于使用它的客…

【BIOS+MBR 微内核手写实现】

本文基于BIOS+MBR的架构,从四部分讲解微内核是如何实现的: 1)搭建微内核编译调试环境 2)梳理微内核的代码结构:伪指令讲解 3)手写实现微内核框架,输出简单的字符串 4)讲解微内核启动阶段的具体运行过程 先完成内核工程创建,如下图 我们这里使用nasm风格的汇编编写,…

从C/C++迁移到Go:内存管理思维转变

一、引言 在当今高速发展的软件开发世界中&#xff0c;语言迁移已成为技术进化的常态。作为一名曾经的C/C开发者&#xff0c;我经历了向Go语言转变的全过程&#xff0c;其中最大的认知挑战来自内存管理模式的根本性差异。 我记得第一次接触Go项目时的困惑&#xff1a;没有析构函…

正确设置 FreeRTOS 与 STM32 的中断优先级

在裸机开发&#xff08;非 RTOS&#xff09;时&#xff0c;大多数 STM32 外设的中断优先级通常不需要手动配置&#xff0c;原因如下&#xff1a; ✅ 裸机开发中默认中断优先级行为 特点说明默认中断优先级为 0如果你不设置&#xff0c;STM32 HAL 默认设置所有外设中断为 0&…

EasyExcel之SheetWriteHandler:解锁Excel写入的高阶玩法

引言在 EasyExcel 强大的功能体系中&#xff0c;SheetWriteHandler 接口是一个关键的组成部分。它允许开发者在写入 Excel 的 Sheet 时进行自定义处理&#xff0c;为实现各种复杂的业务需求提供了强大的支持。通过深入了解和运用 SheetWriteHandler 接口&#xff0c;我们能够更…

Python单例模式魔法方法or属性

1.单例模式概念定义:单例模式(Singleton Pattern)是一种创建型设计模式&#xff0c;它确保一个类只能有一个实例&#xff0c;并提供一个全局访问点来获取该实例。这种模式在需要控制资源访问、配置管理或协调系统操作时特别有用。核心特点:私有构造函数&#xff1a;防止外部通过…

【Kubernetes系列】Kubernetes 资源请求(Requests)

博客目录 引言一、资源请求的基本概念1.1 什么是资源请求1.2 请求与限制的区别 二、CPU 请求的深入解析2.1 CPU 请求的单位与含义2.2 CPU 请求的调度影响2.3 CPU 请求与限制的关系 三、内存请求的深入解析3.1 内存请求的单位与含义3.2 内存请求的调度影响3.3 内存请求的特殊性 …

大型语言模型中的自动化思维链提示

摘要 大型语言模型&#xff08;LLMs&#xff09;能够通过生成中间推理步骤来执行复杂的推理任务。为提示演示提供这些步骤的过程被称为思维链&#xff08;CoT&#xff09;提示。CoT提示有两种主要范式。一种使用简单的提示语&#xff0c;如“让我们一步一步思考”&#xff0c;…

Private Set Generation with Discriminative Information(2211.04446v1)

1. 遇到什么问题&#xff0c;解决了什么遇到的问题现有差分隐私生成模型受限于高维数据分布建模的复杂性&#xff0c;合成样本实用性不足。深度生成模型训练依赖大量数据&#xff0c;加入隐私约束后更难优化&#xff0c;且不保证下游任务&#xff08;如分类&#xff09;的最优解…

C++编程语言入门指南

一、C语言概述 C是由丹麦计算机科学家Bjarne Stroustrup于1979年在贝尔实验室开发的一种静态类型、编译式、通用型编程语言。最初被称为"C with Classes"(带类的C)&#xff0c;1983年更名为C。它既具有高级语言的抽象特性&#xff0c;又保留了底层硬件操作能力&…

ZED相机与Foxglove集成:加速机器人视觉调试效率的实用方案

随着机器人技术的发展&#xff0c;实时视觉数据流的高效传输和可视化成为提升系统性能的重要因素。通过ZED相机&#xff08;包括ZED 2i和ZED X&#xff09;与Foxglove Studio平台的结合&#xff0c;开发者能够轻松访问高质量的2D图像、深度图和点云数据&#xff0c;从而显著提高…

目标检测新纪元:DETR到Mamba实战解析

&#x1f680;【实战分享】目标检测的“后 DEⱯ”时代&#xff1a;DETR/DINO/RT-DETR及新型骨干网络探索&#xff08;含示例代码&#xff09; 目标检测从 YOLO、Faster R-CNN 到 Transformer 结构的 DETR&#xff0c;再到 DINO、RT-DETR&#xff0c;近两年出现了许多新趋势&am…

【IOS】XCode创建firstapp并运行(成为IOS开发者)

&#x1f60f;★,:.☆(&#xffe3;▽&#xffe3;)/$:.★ &#x1f60f; 这篇文章主要介绍XCode创建firstapp并运行 学其所用&#xff0c;用其所学。——梁启超 欢迎来到我的博客&#xff0c;一起学习&#xff0c;共同进步。 喜欢的朋友可以关注一下&#xff0c;下次更新不迷路…