1.DeepSeek部署-Win版本

2.DeepSeek部署-Linux版本

3.DeepSeek部署-一键部署(Linux版本)

4.DeepSeek部署-进阶版本(Linux+GPU)

5.DeepSeek部署-基于vLLM部署

前面部署了vLLM版本以后,访问它比较麻烦。如何才能更好的实现访问呢,这个就是我们今天要讲的Open WebUI,它可以向我们使用官方DeepSeek一样直接在网页进行对话。

OpenWeb UI 是一个功能丰富且用户友好的自托管 Web 用户界面,主要用于管理和操作各种本地和云端的人工智能模型。它支持多种大型语言模型(LLM)运行程序,包括 Ollama 和兼容 OpenAI 的 API,旨在完全离线操作。以下是关于 OpenWeb UI 的详细介绍:

主要特点

  1. 用户界面:直观且响应式,可在任何设备上提供卓越的体验。支持多种主题和自定义选项,满足个人喜好。

  2. 性能:快速响应和流畅的性能,即使在处理复杂任务时也是如此。支持多模型和多模态交互,实现更强大的功能。

  3. 功能:包括全面 Markdown 和 LaTeX 支持,本地 RAG 集成,Web 浏览功能,提示预设,RLHF 注释,对话标记,模型管理功能,语音输入和文本转语音,高级参数微调,图像生成集成等。

  4. API 支持:支持 OpenAI API 和其他兼容 API,扩展其功能。

安装和使用

  • 安装:通过 Docker 或 Kubernetes(如 kubectl、kustoize 或 helm)无缝安装,支持 ollama 和 cuda 标记的图像。
  • Ollama/OpenAI API 集成:轻松集成与 OpenAI 兼容的 API,与 Ollama 模型一起进行多功能对话。
  • Pipelines 插件支持:使用 Pipelines 插件框架将自定义逻辑和 Python 库无缝集成到 Open WebUI 中

1.创建conda 虚拟环境

conda create --name openwebui python=3.12.9

2.安装Open WebUI

pip install open-webui -i https://mirrors.aliyun.com/pypi/simple/

3.启动Open WebUI

# 禁用OLLAMA API
export ENABLE_OLLAMA_API=False
# 设置OpenAI API的基础URL为本地服务器
export OPENAI_API_BASE_URL=http://127.0.0.1:8000/v1
# 设置默认模型路径
export DEFAULT_MODELS="/root/deepseekr1_1.5b/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
# 启动Open WebUI
open-webui serve

4.配置Open WebUI

图片

5.开始提问

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/72168.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/72168.shtml
英文地址,请注明出处:http://en.pswp.cn/web/72168.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(vue)elementUi中el-upload上传附件之后 点击附件可下载

(vue)elementUi中el-upload上传附件之后 点击附件可下载 handlePreview(file) {console.log(file)const fileUrl https://.../zzy/ file.urlconst a document.createElement(a)a.href fileUrla.download file.namea.style.display none// a.setAttribute(download, file.…

你认为 Java 的优势是什么?

你认为 Java 的优势是什么? 回答重点 我觉得可以从跨平台、垃圾回收、生态、面向对象四个方面来阐述。 跨平台 首先 Java 是跨平台的,不同平台执行的机器码是不一样的,而 Java 因为加了一层中间层 JVM,所以可以做到一次编写多平台(如 Windows、Linux、macOS)运行,即…

SpringBoot——Maven篇

Spring Boot 是一个用于快速开发基于 Spring 框架的应用程序的工具。它具有许多特性,其中一些重要的特性包括: 1. 自动配置:Spring Boot 提供了自动配置的机制,可以根据应用程序的依赖和环境自动配置应用程序的各种组件&#xff…

搭建基于chatgpt的问答系统

一、语言模型,提问范式与 Token 1.语言模型 大语言模型(LLM)是通过预测下一个词的监督学习方式进行训练的,通过预测下一个词为训练目标的方法使得语言模型获得强大的语言生成能力。 a.基础语言模型 (Base LLM&…

leetcode0056. 合并区间 - medium

1 题目:合并区间 官方难度 - 中等 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 。请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间 。 示例 1…

系统开发资源

一、前端篇 1.1 菜鸟CSS教程 1.2 HTML/CSS/JS 在线工具 二、后端篇 三、其他篇 3.1 菜鸟官网 3.2 黑马程序员学习路线 3.3 根据地区获取经纬度

计算机视觉cv2入门之图像的读取,显示,与保存

在计算机视觉领域,Python的cv2库是一个不可或缺的工具,它提供了丰富的图像处理功能。作为OpenCV的Python接口,cv2使得图像处理的实现变得简单而高效。 示例图片 目录 opencv获取方式 图像基本知识 颜色空间 RGB HSV 图像格式 BMP格式 …

k8s面试题总结(十五)

1.如何使用Kubernetes进行多环境部署(如开发,测试和生产环境)? 使用命名空间(namespaces): 命名空间是用于逻辑隔离和资源分组的一种方式,可以为每个环境创建单独的命名空间。 2.使…

linux中yum和wget指令的区别

yum 和 wget 都是 Linux 上的下载工具,但它们的用途、下载方式和适用场景不同。以下是它们的 主要区别: 1. yum 是软件包管理器,wget 是文件下载工具 功能yumwget用途安装、更新和管理 RPM 软件包从 HTTP/HTTPS/FTP 下载文件工作方式通过 yu…

性能优化:服务器性能影响网站加载速度分析

问题:网站访问加载慢是受部署服务器的核数、带宽、内存影响吗?? 文章目录 前言一、服务器核数(CPU)二、带宽三、内存(RAM)四、其他潜在影响因素五、排查与优化步骤六、总结 前言 网站访问加载速…

【python】一文掌握 Conda 指令 (anaconda备忘清单)

文章目录 入门常用基础命令环境与包管理包与源管理更改环境导出环境配置其它额外提示这是开始使用 conda 命令的快速参考备忘单,初次学习可参考 这里 参考: Anaconda文档官网命令Cheat sheetConda cheatsheet PDF入门 常用基础命令 命令说明conda info查看 conda 的一系列基…

Qt:绘图API

目录 初识绘图 绘图API的使用 绘制形状(QPaintEvent) 绘制文字(画笔QPen) 内部填充(画刷QBrush) 绘制图片(QPixmap) 初识绘图 我们前面学习 Qt 主要是学 Qt 的各种控件,本质上都是画出来的 都是一些常用的东西,Qt 已经提前画好了,拿过…

【附JS、Python、C++题解】Leetcode面试150题(9)——三数之和

一、题目​​​​​ 15. 三数之和 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足: i!j、i!k 且 j! k ,同时还满足:nums[i] nums[j] nums[k] 0 。请你返回所有和为 0 且不重复的三元组。 注意…

开源、创新与人才发展:机器人产业的战略布局与稚晖君成功案例解析

目录 引言 一、开源:机器人产业的战略布局 促进技术进步和生态建设 吸引人才和合作伙伴 建立标准和网络效应 降低研发风险与成本 二、稚晖君:华为"天才少年计划"的成功典范 深厚的技术积累与动手能力 强烈的探索和创新意识 持续公开…

Android笔记:Android平台下SVG格式的解析与实践

在移动应用开发的广阔天地里,开发者们始终致力于打造视觉效果卓越、适配各类设备屏幕的优质应用。SVG(Scalable Vector Graphics,可缩放矢量图形)作为基于 XML 的图形格式,以其鲜明特性,为 Android 开发者提供了实现这一愿景的关键路径。接下来,本文将全方位深入解析在 …

mac本地部署Qwq-32b记录

导语 昨天看到阿里开源了Qwq-32b,号称性能可以媲美Deepseek-R1。今天晚上有空就在Mac上折腾了一下,使用ollma进行了部署,效果感觉还不错,特此记录。 环境 硬件 型号:Macbook M1 Pro 14寸内存:32G 环境…

blender学习25.3.11

【05-进阶篇】Blender咖啡小场景之咖啡杯建模_哔哩哔哩_bilibili 杯子 首先做一个圆柱体 循环切割 crtlr 往下拖拽 框住按s往里收 Gz向上点 点击顶面按插入i,往里收一下,这样就插入了一个面 插入完成之后选中这个面,按下键盘的挤压E 然后…

数据可信、隐私可控:CESS 如何打造波卡生态数据新基建?

原文:https://messari.io/report/cess-network-a-deep-dive-into-programmable-data-value-infrastructure作者:Messari编译:OneBlock波卡生态一直以来以其跨链互操作性和灵活性吸引了众多创新项目,尤其是在 DePIN(去中…

Android 列表页面终极封装:SmartRefreshLayout + BRVAH 实现下拉刷新和加载更多

在 Android 开发中,列表页面是常见的 UI 设计模式,而下拉刷新和加载更多是提升用户体验的关键功能。本文将带你从零开始,封装一个高复用性的 SmartRefreshHelper 工具类,结合 SmartRefreshLayout 和 BRVAH,实现高效、灵…

css基本功

为什么 ::first-letter 是伪元素&#xff1f; ::first-letter 的作用是选择并样式化元素的第一个字母&#xff0c;它创建了一个虚拟的元素来包裹这个字母&#xff0c;因此属于伪元素。 grid布局 案例一 <!DOCTYPE html> <html lang"zh-CN"><head&…