华为云Flexus+DeepSeek征文 | 华为云ModelArts Studio实战指南:创建高效的AingDesk知识库问答助手
- 前言
- 一、ModelArts Studio介绍
- 1. 华为云ModelArts Studio简介
- 2. 华为云ModelArts Studio主要特点
- 3. 华为云ModelArts Studio主要使用场景
- 二、AingDesk介绍
- 1. AingDesk简介
- 2. AingDesk 主要特点
- 三、部署AingDesk项目
- 1. 创建容器工作
- 2. 查看容器状态
- 3. 本地访问服务
- 四、访问AingDesk服务
- 1. 进入账号注册页
- 2. 设置用户名和密码
- 3. 登录AingDesk
- 五、ModelArts Studio平台开通DeepSeek商用服务
- 1. 进入ModelArts Studio控制台
- 2. 在线推理各服务介绍
- 3. 开通DeepSeek商用服务
- 4. 保存API信息
- 六、AingDesk基本配置
- 1. AI配置流程
- 2. 对话测试
- 七、知识库问答配置与使用
- 1. 配置嵌入模型
- 2. 新建知识库
- 3. 上传文件
- 4. 知识库问答
- 八、总结
前言
在智能问答需求日益增长的今天,华为云ModelArts Studio凭借其强大的功能,为打造高效的AingDesk知识库问答助手提供了可靠的技术支撑。本文作为实战指南,将从基础概念讲解到具体操作流程,逐步引导读者掌握如何借助ModelArts Studio,完成AingDesk知识库问答助手的创建与优化,助力企业提升智能化服务水平。
一、ModelArts Studio介绍
1. 华为云ModelArts Studio简介
华为云ModelArts Studio
是基于ModelArts的一站式大模型即服务平台(MaaS),提供从模型开发、训练到部署的全流程能力,支持主流开源大模型的快速适配与优化,助力企业高效构建AI应用。
- 华为云ModelArts Studio平台官网:https://www.huaweicloud.com/product/modelarts/studio.html
2. 华为云ModelArts Studio主要特点
模型全面
:集成Llama、Baichuan、Yi、Qwen、DeepSeek等主流开源大模型,并基于昇腾AI云服务进行性能与精度优化。免配置、免调优
:提供一键式训练、自动超参调优功能,降低模型开发门槛,显著缩短开发周期。性能优异
:通过昇腾算子优化与显存管理,实现大模型训练与推理性能大幅提升。资源灵活易获取
:支持按需开通、弹性扩缩容,保障高性价比的算力使用,同时支持断点续训与故障恢复。一站式工具链
:涵盖模型调优、压缩、评测、部署等全生命周期工具,开箱即用,低门槛上手。多组件集成能力强
:支持LangChain、RAG、Agent、Guard等多种AI组件即插即用,快速构建复杂AI应用系统。
3. 华为云ModelArts Studio主要使用场景
- 智能问答系统:基于预训练大模型快速构建知识库驱动的问答系统,提升信息检索效率。
- 企业级AI助手开发:利用平台提供的Prompt模板和智能Agent能力,打造能理解任务并自主决策的企业AI助手。
- 个性化内容生成:适用于新闻撰写、营销文案、客服回复等内容创作类任务,提升内容生产效率。
- 多模态AI应用构建:结合图像、语音、文本等多模态数据,开发智能客服、虚拟主播等综合型AI产品。
二、AingDesk介绍
1. AingDesk简介
AingDesk 是一款简单易用的人工智能助手,旨在为用户提供高效、便捷的AI服务体验。它集成了多种强大功能,包括本地知识库支持、主流模型API调用、在线分享能力、联网搜索、智能体创建等,并且正在不断快速进化中。无论是个人用户还是企业用户,都能通过 AingDesk 轻松部署和使用人工智能技术。
2. AingDesk 主要特点
- 一键部署本地AI模型与主流模型API:用户可以轻松部署本地AI模型或调用主流模型API,无需复杂的配置流程。
- 本地知识库支持:提供强大的本地知识库管理功能,帮助用户构建专属的知识体系。
- 智能体创建:支持用户创建个性化的智能代理,实现自动化任务处理和交互。
- 在线分享功能:可将工作成果一键分享给他人,便于协作与传播。
- 支持网页搜索:内置联网搜索功能,实时获取最新信息,拓展知识边界。
- 支持服务器端部署:适用于企业级应用场景,支持在服务器端进行稳定高效的部署。
- MCP客户端支持:兼容MCP(Model Control Protocol)客户端,增强模型控制与交互能力。
- 单次对话中同时与多个模型交流(即将上线):未来将支持在一个会话窗口中同时与多个AI模型互动,提升工作效率。
三、部署AingDesk项目
1. 创建容器工作
请下载镜像名称为aingdesk/aingdesk:latest
,版本标签为 latest 的最新版本。
docker pull aingdesk/aingdesk:latest
本次实践所使用的操作系统为 openEuler 24.03 (LTS),需提前完成 Docker 环境的部署。可以通过 Docker 命令行方式进行部署,也可选择使用 Docker Compose 进行部署,推荐采用 Docker Compose 方式以提升部署效率和管理便捷性。
- Docker命令行方式:使用以下命令快速创建容器。
docker run -d \--name node \-v $(pwd)/data:/data \-v $(pwd)/uploads:/uploads \-v $(pwd)/logs:/logs \-v $(pwd)/bin:/aingdesk/bin \-v $(pwd)/sys_data:/sys_data \-p 7071:7071 \-w /aingdesk \aingdesk/aingdesk
- Docker compose方式:创建以下部署文件docker-compose.yaml,内容如下所示。
vim docker-compose.yaml
version: '3'services:aingdesk:image: aingdesk/aingdeskcontainer_name: aingdeskrestart: unless-stoppedports:- "7071:7071"volumes:- /docker/aningdesk/data:/data- /docker/aningdesk/uploads:/uploads- /docker/aningdesk/logs:/logs- /docker/aningdesk/bin:/aingdesk/bin- /docker/aningdesk/sys_data:/sys_data
开始创建AingDesk容器,推荐使用以下 Docker Compose 命令快速启动并后台运行容器:
docker compose up -d
2. 查看容器状态
检查我们刚才创建的AingDesk容器状态,可以看到该容器已经正常运行了。
[root@node01-server aningdesk]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
02668c853f4a aingdesk/aingdesk "npm run start" 29 seconds ago Up 28 seconds (health: starting) 0.0.0.0:7071->7071/tcp, :::7071->7071/tcp aingdesk
检查容器日志,排查可能存在的错误或异常信息,确保 AingDesk 服务稳定正常运行。
[root@node01-server aningdesk]# docker compose logs
WARN[0000] /docker/aningdesk/docker-compose.yaml: `version` is obsolete
aingdesk |
aingdesk | > aingdesk@1.1.9 start
aingdesk | > node ./public/internal/main.js
aingdesk |
aingdesk | [socket/http] server is: http://127.0.0.1:7071
3. 本地访问服务
在完成部署后,可通过本机访问 AingDesk 服务,以确认服务是否正常运行。在部署服务器上,可使用 curl
命令测试访问服务接口,确保能够成功获取响应,从而验证服务的可用性。
curl 127.0.0.1:7071
四、访问AingDesk服务
1. 进入账号注册页
在本地浏览器中输入 http://【本地IP地址】:7071
,即可访问AingDesk的服务界面。首次进入后,可以看到账号密码设置页面,如下所示:
2. 设置用户名和密码
在AingDesk的初始页面,我们自行设置账号密码,如下所示:
3. 登录AingDesk
注册账号完毕后,使用新注册账号密码重新登录AingDesk,即可进入到AingDesk首页。
五、ModelArts Studio平台开通DeepSeek商用服务
1. 进入ModelArts Studio控制台
访问华为云官网并点击“ModelArts Studio控制台”后,即可直接进入ModelArts Studio控制台,开启我们的AI开发与管理之旅。
- 官网地址:https://www.huaweicloud.com/product/modelarts/studio.html)
2. 在线推理各服务介绍
🚀 在线推理服务说明
在线推理是指模型通过API接口对外提供服务,支持实时调用和体验,并可通过控制台监控面板查看运行状态和服务性能。
🔍 服务类型概览
类型 | 描述 | 计费方式 | 特点说明 |
---|---|---|---|
预置服务 | 平台已部署完成的服务,可立即使用,无需等待模型加载 | 按Token计费 | 快速测试、无等待时间 |
我的服务 | 用户自定义部署的服务,支持调优、压缩或自研模型 | 按算力计费 | 自主控制、灵活适配业务需求 |
免费服务 | 提供基础模型体验功能,适用于学习和初步测试 | 免费 | 存在速率限制,平台不定期调整 |
商用服务 | 面向企业级应用,提供稳定、高性能的API服务 | 按Token计费 | 支持高并发、适合生产环境部署使用 |
💰 计费规则说明
- 免费服务额度:每个模型提供 200万token推理额度,额度耗尽后可:
- 开通商用级别的推理API服务(仅限区域:贵阳一)
- 或将模型部署为“我的服务”后按需付费使用
✅ 提示:模型服务的优惠折扣信息请前往【费用中心】查看。
💬 推理服务计费详情(单位:元 / 千 tokens)
模型名称 | 状态 | 输入价格(¥) | 输出价格(¥) | 备注 |
---|---|---|---|---|
Qwen3-235B-A22B-32K | 未开通 | 0.002 | 0.008 | 商用服务模型 |
DeepSeek-V3-32K | 已开通 | 0.002 | 0.008 | 商用服务模型 |
DeepSeek-R1-32K | 已开通 | 0.004 | 0.016 | 商用服务模型 |
Qwen3-32B-32K | 已开通 | 0.002 | 0.008 | 商用服务模型 |
DeepSeek-R1-32K-0528 | 已开通 | 0.004 | 0.016 | 商用服务模型 |
3. 开通DeepSeek商用服务
在ModelArts Studio控制台首页左侧菜单栏中,选择 模型推理 > 在线推理,然后依次选中所需的商用服务模型 —— DeepSeek-R1-0528、DeepSeek-V3-32K 或 DeepSeek-R1-32K,点击“开通服务”即可完成配置。
4. 保存API信息
我们以DeepSeek-V3-32K商用服务为例,点击【调用说明】,查看其OpenAI SDK信息。
将OpenAI SDK信息的接口信息保存在本地,如下所示:
在 API Key 管理页面中,点击【创建 API Key】按钮,生成所需的 API 密钥。创建完成后,将生成的 API Key 与 OpenAI SDK 的接口信息一并保存,以便后续调用和配置使用。
六、AingDesk基本配置
1. AI配置流程
- 点击主界面的【第三方模型API】,进入模型配置界面。
- 我们选择【添加模型服务商】,进入模型服务商配置页面。
供应商配置项,可参考如下:
- 供应商名称:华为云
- 接口地址:https://api.modelarts-maas.com/v1
- 密钥:刚才注册的申请的华为云API key
- 设置完毕后,点击保存。
- 检查模型名称:选择我们刚才创建的【华为云】服务商,可以所有模型都已经正常识别出来了。
2. 对话测试
在 AI 对话页面进行简单的提问测试后,可以看到模型能够正常返回回答,这表明 AI 模型已成功配置并正常运行。
七、知识库问答配置与使用
1. 配置嵌入模型
在第三方 API 配置中,我们选择“硅基流动”平台。将从其官网注册获取的 API Key 复制并粘贴至对应的 API 密钥输入框后,点击【检查】和【保存API】按钮,即可成功识别并加载该平台下所有的模型列表。
2. 新建知识库
在 AingDesk 主界面左侧点击【知识库】→【新建知识库】,填写知识库名称和描述后,系统将自动识别到硅基流动平台中的 BAAI/bge-m3 嵌入模型。其他参数保持默认设置,确认无误后点击【确认】完成创建。
3. 上传文件
点击【上传文件】按钮,将本地文件上传至 AingDesk,随后点击【确认】。上传完成后,AingDesk 将自动对文档内容进行嵌入处理,完成知识入库。
4. 知识库问答
点击【新建对话】,在弹出的对话框中,于知识库选项里勾选此前创建的“Linux知识库”,完成配置后即可开始基于该知识库的智能问答与交互。
我们可以基于该知识库进行提问,例如询问“Linux基础命令有哪些”。可以看到,AingDesk 会根据此前创建的知识库内容进行智能检索,并准确给出相关回答,效果非常理想。
八、总结
通过本次实战操作,我们成功基于 华为云 Flexus 与 DeepSeek 大模型,在 ModelArts Studio 平台上搭建了一个高效、智能的 AingDesk 知识库问答助手。🚀
从知识库构建、模型部署到问答集成,整个流程高效稳定,充分体现了华为云平台的强大算力支持、灵活的资源配置和出色的 AI 工程能力。💡无论是企业级应用还是个人开发者,都能在华为云上获得一站式、低门槛、高性能的 AI 开发体验。
📣 选择华为云,让AI落地更简单,让智能触手可及!