Milvus 的资源管理分为三层:查询节点、资源组和 数据库。

查询节点:处理查询任务的组件。它在物理机或容器(如 Kubernetes 中的 pod)上运行。

资源组:查询节点的集合,充当逻辑组件(数据库和 Collections)与物理资源之间的桥梁。您可以将一个或多个数据库或集合分配给一个资源组。

下面我将详细解释这三个概念。

🧱 总体图(打个比方)

你可以把整个 Milvus 系统想象成一个「大型图书馆系统」,里头有:

  • 很多“读者”(查询请求)
  • 很多“图书馆分馆”(数据库)
  • 每个分馆有很多“图书柜”(Collection)
  • 后台有一群“图书管理员”(查询节点)在负责查找图书
  • 管理员是按组编排的,比如“第一组负责科技馆”,“第二组负责历史馆”,这就是“资源组”

🧩 一层一层说清楚:


① 查询节点(QueryNode)

是什么?

  • 查询节点是 Milvus 的底层服务组件,专门负责 处理向量检索、聚类、过滤查询等任务
  • 你可以理解为“一台专门干活的工作机器”。

跑在哪里?

  • 查询节点可以跑在物理服务器上,也可以跑在 Kubernetes 的 Pod 中。
  • 一个 Milvus 系统可以有很多个查询节点(多台机器/多个 Pod)。

干嘛用?

  • 查询节点会接收用户的查询任务,比如“在 Collection A 中找相似的向量”,然后自己去磁盘/内存里找结果。
  • 查询节点是消耗 CPU、内存最多的部分,属于“干活的前线工人”。

② 资源组(Resource Group)

是什么?

  • 资源组是一组 QueryNode 的集合,是一个逻辑上的划分。
  • 它的作用是把查询节点分组,每组负责不同的任务/客户/数据库。

举例理解:

  • 假设你有 100 个 QueryNode,你可以划分成 2 个资源组:

    • rg_high_priority:专门给 VIP 租户用,响应快。
    • rg_low_priority:给普通用户用。

为什么要分资源组?

  • 为了资源隔离,比如:

    • VIP 用户不能因为普通用户太多而被拖慢
    • 某个数据库出了问题不会拖垮所有查询节点
  • 资源组就是一个调度系统:让哪些 QueryNode 服务哪些 Collection 或数据库


③ 数据库(Database)

是什么?

  • Milvus 现在支持多数据库(类似 MySQL 的多个库),每个数据库相当于一个「租户空间」。
  • 每个数据库下可以有多个 Collection,比如 vector_db1 下有 itemsusers 表。

和资源组的关系?

  • 你可以把某个数据库“绑定”到某个资源组,让它的所有 Collection 查询都由那组 QueryNode 来处理。

🧠 整体逻辑关系总结图:

              用户查询请求↓┌─────────┐│ Database│   ← 你定义的数据库,如 db1、db2└─────────┘↓┌─────────────┐│ Collection  │ ← 数据表└─────────────┘↓分配到某个资源组↓┌──────────────────┐│ Resource Group A │ ← 一组 QueryNode│  (高优先级)      │└──────────────────┘↓┌────────────────────┐│ QueryNode A1 ~ A10 │ ← 干活的机器└────────────────────┘

✅ 举个完整的例子

假设你有这样一个场景:

  • 有两个客户:阿里巴巴(VIP)和普通客户(长尾用户)
  • 阿里巴巴的数据存放在数据库 vip_customer_db
  • 普通客户数据在 normal_customer_db
  • 你想确保阿里巴巴的查询速度不受其它人影响

你可以这样做:

  1. 创建两个资源组:rg_viprg_normal
  2. 分配更多 QueryNode 给 rg_vip(比如 10 个节点),只给 rg_normal 分 4 个节点
  3. vip_customer_db 绑定到 rg_vip,把 normal_customer_db 绑定到 rg_normal

这样:

  • 阿里巴巴的查询总是在 rg_vip 中处理
  • 即使普通客户量暴增,也不会影响阿里的响应速度
  • 同时资源利用率也更合理,避免大家抢资源

🧠 再次强调区别:

名称是什么谁组成的管理对象举例
查询节点干活的机器(QueryNode)单个服务实例负责执行查询任务一个 Pod / 容器
资源组一组查询节点的集合多个 QueryNode逻辑分组、调度单位高优、低优资源组
数据库存数据的逻辑库(租户单位)多个 Collection用户管理的数据集用户A的数据库 user_db

✅ 一句话总结

数据库 是租户的数据空间,资源组 是逻辑资源划分,查询节点 是实际执行工作的工人。
它们之间是:数据库 ←→ 资源组 ←→ 查询节点 的映射链。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89228.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89228.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/89228.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

我的第一个开源项目:用Python搭建轻量级静态网页服务器—— 零基础也能实现的Web开发初体验

一、为什么选择静态服务器? 极简高效:无需数据库或复杂后端逻辑,适合展示简历、作品集等静态内容 学习曲线平缓:是理解HTTP协议和Web服务原理的最佳入门方式 资源消耗低:单文件Python脚本即可运行,内存占…

github 图床使用免费CDN加速(jsdelivr)

github做图床大部分人都知道,但是国内访问速度不稳定,所以使用jsdelivr加速。 jsdelivr是什么呢?它是一个免费、快速和可信赖的CDN加速服务,直接集成在github中的,无需额外操作即可使用。 本文分两部份,最…

lte高阶调制和AMC

文章目录 LTE高阶调制AMC LTE高阶调制 首先什么是调制?调制是把通信系统中的基带信号(低频)转化成适合信道传输的高频信号的过程。 波长(λ)与频率(f) 基本关系: λc/f,λc/f&…

shardingsphere5.2.1与SpringBoot3.X的版本冲突问题

1.先说一下我的版本配置与遇到的问题 问题产生的依赖和版本: 主要依赖依赖版本jdk17SpringBoot 3.3.13shardingsphere-jdbc 5.2.1 问题产生的原因: 主要就是shardingsphere-jdbc 与SpringBoot版本冲突,因为Spring Boot 需要 SnakeYAML 库来解…

FPGA控制88E1512 PHY芯片完成网络通信

一、88E1512分析 本文不对88E1512进行详细解析,仅对调试过程中重点使用的几个寄存器进行说明。 1.1 MDIO时序分析 根据手册,MDIO时序中,mdc时钟最高为12Mhz。占空比和建立保持时间要求可以观察上述表格。 MDIO的读数据时序图如下&#xff1a…

Ai大模型 - ocr图像识别形成结构化数据(pp-ocr+nlp结合) 以及训练微调实现方案(初稿)

全局目录,一步到位 功能流程第一阶段 基于现有条件进行 调研,测试与评估1.1 ocr深度学习模型 pp-ocr1.2 nlp结构化模型1.3 硬件要求: 第二阶段 模型训练微调2.1 更换ocr-GPU模型, 下载相关环境2.2 nlp模型 语义训练2.3 最低硬件要求:2.4 样本数据: (重点)2.5 进一步增强模型能力…

【Linux】软硬链接,动静态库

目录 一、认识一下常用指令 1、建立一个软链接 2、建立一个硬链接 3、删除文件的第二种方式:删除链接unlink指令 二、什么是硬链接? 三、软硬链接的原理: 四、应用场景 1、建立一个软链接可以快速在一个比较深的路径中找到目标文件进行…

VRR(可变刷新率)和QMS(快速媒体切换)

🔧 一、技术原理的本质区别 技术VRR (可变刷新率)QMS (快速媒体切换)核心目标消除动态帧率波动导致的画面撕裂/卡顿消除静态帧率切换时的黑屏中断工作机制实时调整显示器刷新率(Hz)匹配GPU输出帧率(FPS)→ 动态延长/缩…

GO 语言学习 之 Map

map 是 Go 语言中非常重要的数据结构,常用于需要快速查找、统计或分组数据的场景。 map定义: package mainimport "fmt"func main() {var m1 map[int]string // 创建一个 mapm2 : make(map[int]string) // 创建一个 map m3…

什么是可观测性?监控、日志、追踪三者之间有什么区别?

一、引言:为什么现代系统需要“看得见”? 你是否遇到过这样的情况:系统运行突然变慢,但没人知道问题出在哪?随着微服务、云原生架构的普及,系统的复杂度越来越高,传统的“靠经验判断”已经无法…

扣子(coze)实战|自动搬运+改写+归档!自媒体矩阵终极方案

今天给大家分享的是用coze做一个工作流来自动提取抖音/小红书视频文案及改写并传入到飞书多维表格,我们先来看案例 上传视频链接即可一键生成,废话不多说,上教程~ 一、整体工作流如下: 二、开发思路: 三、详细工作流分…

K8s环境下基于Nginx WebDAV与TLS/SSL的文件上传下载部署指南

#作者:闫乾苓 文章目录 1.问题及背景2.方案说明3.部署步骤3.1 制作TLS/SSL私有证书3.2 创建访问nginx账户密码文件并创建secret3.3 为TLS/SSL私有证书创建secret3.4 为Nginx 配置文件创建confimap3.5 使用deployment,svc部署nginx3.6 客户端curl上传下载…

【Day 7-N17】Python函数(1)——函数定义、位置参数调用函数、关键字参数调用函数、函数的默认值

挑战14天学会Python,第7天学习笔记!加油! 一、概述 函数(Function)是 Python 中用于封装可重用代码块的基本结构。通过定义函数,我们可以将复杂逻辑拆分为更小、更易管理的单元,并通过参数传递…

STM32 驱动 ADS1015 单端 差分 多通道模式 ADC 转换

文章目录 一、ADS1015简介二、引脚功能三、寄存器介绍1.Conversion Register 转化数据存放寄存器2.Config Register 配置寄存器 四、IIC时序1.写寄存器2.读寄存器 五、程序六、实验现象1.单端模式2.差分模式3.伪多通道模式 一、ADS1015简介 ADS1015 是一款由德州仪器&#xff…

RabbitMQ 消费幂等性与消息重放实现

一、幂等性实现 1.1 什么是幂等性? 幂等性是指同一条消息无论被消费多少次,业务结果都只生效一次,防止重复扣款、重复发货等问题。 RabbitMQ 的投递模式是“至少一次交付”(at-least-once delivery),如果消费者处理失败或者没有及…

【HarmonyOS 5】鸿蒙TEE(可信执行环境)详解

【HarmonyOS 5】鸿蒙TEE(可信执行环境)详解 一、TEE是什么? 1、TEE的定义: 可信执行环境(Trusted Execution Environment),简称TEE,是存在于智能手机、平板或任意移动设备主处理器…

算法: 冒泡排序

冒泡排序是一种简单的排序算法,通过相邻元素的比较和交换,使较大的元素逐渐"浮"到数组末尾。 时间复杂度:最佳 O(n) | 平均 O(n) | 最差 O(n) 空间复杂度:O(1) 稳定性:稳定 应用场景/前提条件 适用于小规模数据对几乎已排序的数据效率较高…

基于SpringBoot的家电销售展示平台

源码编号:S567 源码名称:基于SpringBoot的家电销售展示平台 用户类型:双角色,用户、管理员 数据库表数量:14 张表 主要技术:Java、Vue、ElementUl 、SpringBoot、Maven 运行环境:Windows/M…

java+vue+SpringBoo智慧旅游系统(程序+数据库+报告+部署教程+答辩指导)

源代码数据库LW文档(1万字以上)开题报告答辩稿ppt部署教程代码讲解代码时间修改工具 技术实现 开发语言:后端:Java 前端:vue框架:springboot数据库:mysql 开发工具 JDK版本:JDK1.…

Docker 入门教程(三):镜像操作命令

文章目录 🐳 Docker 入门教程(三):镜像操作命令获取镜像:docker pull查看镜像:docker images删除镜像:docker rmi搜索镜像:docker search镜像打标签:docker tag镜像详情与…