1. 背景

TDengine 之前版本一直没有通过 SQL 命令查看数据库占用的磁盘空间大小,从 3.3.5.0 开始,增加了这个方便且实用的小功能,这里详细介绍下。

2. SQL 基本语法

select expr from information_schema.ins_disk_usage [where condtion]

行为说明: 查看各个vgroup 的各个组件磁盘占用情况,并且可以通过查询语句计算压缩率等。

示例:

taos> select * from ins_disk_usage where db_name = "test";

db_name|vgroup_id|wal|data1|data2|data3|cache_rdb|table_meta|

s3|raw_data|

=========================================================

test|13 | 112 | 256 | 2000| 3000| 4000| 8000| 9000| 10000

Query OK, 1 row(s) in set (0.003510s)

3. 快捷命令

快捷命令是比较短的可快速查看信息的命令,查看磁盘空间的命令是:

show disk_info;

示例:

taos> show disk_info;

_db_usage               |

=================================

Compress_radio: 23%     |

Disk_occupied: 400M     |

Query OK, 2 row(s) in set (0.013209s)

行为说明: 

  • compression_ratio: 类型为double 类型,代表当前库的压缩率, 如果估算出来 raw_data 的size 小于1k, 则显示为NULL。
  • disk_occupied: 类型为整数类型,代表当前用户数据占用大小。

命令等同于:

select

    sum(data1 + data2 + data3)/sum(raw_data),

    sum(data1 + data2 + data3)

from information_schema.ins_disk_usage

    where db_name="dbname"

4. 新增系统表

本功能需新增系统表,在 information_schema 中新增 ins_disk_usage 表,各字段含义如下:

字段

含义

类型

单位

备注

db_name

Db 的名称

Varchar

准确值

vgroup_id

Vgroup 的ID号

整数类型

准确值

wal

wal 的大小

长整数类型

K

准确值

data1

一级存储上磁盘占用大小

长整数类型

K

同上, 不包含WAL 值

data2

二级存储上磁盘占用大小

长整数类型

K

准确值,不包含WAL值

data3

三级存储上磁盘占用大小

长整数类型

K

准确值,

cache_rdb

last/last_row占用磁盘的大小

长整数类型

K

同上

table_meta

Table Meta 占用磁盘大小

长整数类型

K

同上

s3

s3 上占用的数据的大小

长整数类型

K

相对准确值

raw_data

预估出来的真实数据的大小,不含mem table

长整数类型

k

估算值

5. 性能

命令资源消耗大:

需要到各 vnode 获取其基本磁盘占用、表数量、行数,行数统计等信息,需要读 header block 信息 IO 使用多。

执行时间:

 预估为秒级,性能和 show table distributed stableName 类似, 如果 DB 上超级表或者普通表的数目为 N, 执行单个 show table distributed table 时间为 T,那么执行该查询的时间则为 N * T。

6. 约束和限制

约束: 本质上是一个运维工具, 且资源消耗比较大,不建议频繁调用,

限制:

  • 如果有大量的删表、删数据行为,不能准确计算得到压缩率等信息,需要等到完全compact 完全结束之后,才能得到一个相对准确的压缩率,如果在compact 还没有结束时,查询得到的磁盘占用可能过大。

  • 本实现统计是按实际文件占用进行统计且忽略了目录本身的大小, 因此和用 `du ` 命令直接统计目录的大小存在一定的区别,两者差距一般小于1M。

  • 多副本情况下,只统计单副本的DB的占用大小

  • 如果要统计单个DB 实际的磁盘占用可以用 select sum(data1+data2+data3+wal+cache_rdb + table_meta) from ins_disk_usage where dbname = "test"

  • 文件大小的磁盘占用大小

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86608.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86608.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/86608.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚂蚁百宝箱体验:如何快速创建“旅游小助手”AI智能体

蚂蚁百宝箱作为站式智能体应用开发平台,致力于为AI开发者提供简单、高效、快捷的智能体创作体验。作为业内领先的AI应用开发平台,开发者可以根据自身的个性化需求,基于各式各样的大模型来创建一个属于自己的智能体应用。 蚂蚁百宝箱&#xf…

AI助力JMeter—从静态参数化到智能动态化的进化之路

Apache JMeter作为开源利器被广泛应用于Web系统、API接口、数据库及消息队列等多场景性能验证。而“变量的使用”作为测试脚本灵活性和可维护性的核心手段,决定了脚本的复用性、可扩展性和数据驱动能力。传统的变量管理手段已难以应对大规模复杂测试任务中“动态化、…

第十六届蓝桥杯C/C++程序设计研究生组国赛 国二

应该是最后一次参加蓝桥杯比赛了,很遗憾,还是没有拿到国一。 大二第一次参加蓝桥杯,印象最深刻的是居然不知道1s是1000ms,花了很多时间在这题,后面节奏都乱了,抗压能力也不行,身体也不适。最后…

OpenCV计算机视觉实战(12)——图像金字塔与特征缩放

OpenCV计算机视觉实战(12)——图像金字塔与特征缩放 0. 前言1. 高斯金字塔1.1 应用场景1.2 实现过程 2. 拉普拉斯金字塔2.1 应用场景2.2 实现过程 3. 图像融合实例3.1 应用场景3.2 实现过程 小结系列链接 0. 前言 图像金字塔技术通过对原始图像按不同分…

【案例】基于Python的生源数据可视化分析:从Excel处理到动态地图展示

文章目录 需求分析技术要点程序流程一些细节核心代码表格的一些操作 心得体会代码汇总 需求分析 请设计一个程序,要求能够统计分析分散在不同表格中的数万条信息,以信息中的身份证号码或生源地代码字段为目标字段,统计每一年全国各省份及本省…

设计模式 | 原型模式

原型模式通过克隆机制实现对象高效创建,是性能敏感场景的利器。本文结合C示例详解实现原理、深拷贝陷阱、应用场景,并与工厂模式对比分析。 为何需要原型模式? 当遇到以下场景时,传统构造方法面临挑战: 创建成本高&am…

Go 语言中的单元测试

1、如何编写单元测试 在任何生产级别的项目开发中,单元测试都扮演着至关重要的角色。尽管许多初创项目在早期可能忽略了它,但随着项目逐渐成熟并成为核心业务,为其编写健壮的单元测试是保障代码质量和项目稳定性的必然选择。本文将带您快速掌…

8. 接口专业测试报告生成pytest-html

pytest-html 终极指南:打造专业级接口测试报告 在接口自动化测试中,清晰的测试报告是质量保障的关键。本文将深入解析如何通过pytest-html插件生成专业级测试报告。 一、核心安装与基础使用 快速安装(国内镜像) pip install -i …

Day45 Tensorboard使用介绍

目录 一、tensorboard的发展历史和原理及基本操作 1.1 发展历史 1.2 tensorboard的原理 1.3 日志目录自动管理 1.4 记录标量数据(Scalar) 1.5 可视化模型结构(Graph) 1.6 可视化图像(Image) 1.7 记…

用AI给AR加“智慧”:揭秘增强现实智能互动的优化秘密

用AI给AR加“智慧”:揭秘增强现实智能互动的优化秘密 引子:增强现实,到底还能怎么更聪明? 还记得当年Pokmon GO火爆全球的场景吗?玩家们手机对准街头,虚拟小精灵活灵活现地跳出来,那就是增强现实(AR)最经典的应用之一。随着硬件发展和算法进步,AR正逐步从“炫酷玩具…

1 Studying《Computer Vision: Algorithms and Applications 2nd Edition》1-5

目录 Chapter 1 Introduction 1.1 什么是计算机视觉? 1.2 简史 1.3 书籍概述 1.4 样本教学大纲 1.5 符号说明 1.6 其他阅读材料 Chapter 2 Image formation 2.1 几何基本元素和变换 2.2 光度图像形成 2.3 数码相机 2.4 其他阅读材料 2.5 练习 Chapter…

Augment插件macOS

macOS苹果电脑vscode-augment免费额度续杯跑满 前言 在AI辅助编程日益普及的今天,Augment作为VS Code中的智能代码助手,为开发者提供了强大的代码生成和优化功能。然而,免费版本每月300次的使用限制往往让重度用户感到困扰。本文将详细介绍如…

OpenCV CUDA模块设备层-----创建一个“常量指针访问器” 的工具函数constantPtr()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在 CUDA 设备端模拟一个“指向常量值”的虚拟指针访问器,使得你可以像访问数组一样访问一个固定值。 这在某些核函数中非常有用&…

Python:操作 Excel 删除工作簿

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 Python 操作 Excel 系列 读取单元格数据按行写入设置行高和列宽自动调整行高和列宽水平…

Python类型注解(Type Hints)的工程实践指南

一、类型注解的核心价值 代码可读性:明确函数输入输出类型 静态检查:配合mypy提前发现类型错误 IDE支持:提升代码补全和重构能力 文档替代:类型即文档的现代编程理念 二、基础语法规范 def greet(name: str, times: int 1)…

Hadoop RPC 分层设计的哲学:高内聚、低耦合的最佳实践

Hadoop RPC Hadoop RPC主要分为四个部分,分别是序列化层、函数调用层、网络传输层和服务器端处理框架,实现机制为: 序列化层:主要作用是将结构化对象转为字节流以便于通过网络进行传输或写入持久存储。函数调用层:主…

MybatisPlus-01.MybatisPlus介绍

一.MybatisPlus介绍 MybatisPlus是对Mybatis的增强和升级,但需要注意的是,MybatisPlus并不是取代Mybatis的,而是要做Mybatis最好的合作伙伴。左边蓝色的小鸟就是MybatisPlus的标志。 在MybatisPlus官方页面上介绍了其特点,首先&am…

人大金仓数据库jdbc连接jar包kingbase8-8.6.0.jar驱动包最新版下载(不需要积分)

看了网上的很多,都是需要下载积分的 分享一下直接访问人大金仓官网,下载对应的数据库jdbc连接jar包kingbase8-8.6.0.jar驱动包: 点击 服务与支持,然后选择 下载中心 选择对应的产品和版本,最后选择软件版本 看到有…

cf 禁止http/1.0和http/1.1的访问 是否会更安全?

使用 Cloudflare(CF)禁止 HTTP/1.0 和 HTTP/1.1 的访问,强制客户端使用 HTTP/2 或更高版本(如 HTTP/3),在某些情况下可以提升网站安全性,但也存在权衡和限制。以下是详细分析,帮你判…

【Docker基础】Docker容器管理:docker pause详解

目录 1 Docker容器管理概述 2 docker pause命令详解 2.1 命令基本语法 2.2 命令功能解析 2.3 暂停与停止的区别 3 docker pause的工作流程 3.1 工作流程概述 3.2 工作流程详解 4 docker pause的使用场景 4.1 资源临时调整 4.2 调试与检查 4.3 服务维护 4.4 数据备…