场景:
使用分库分表的业务有时分库数量几百甚至上千,当主管需要查询每个库中的数据,掌握数据分布情况。要你查看哪些库中的表数量大于某个量级的给找出来 ,你会怎么做。

例子 :
mysql库数量:db_xx_deviceinfo0-999 共1000个库每个库中 28个表。

一、查系统表(缺点:数据不是很精确,优点:快速。)

root@localhost 14:17:  [information_schema]>select TABLE_SCHEMA,TABLE_NAME,TABLE_ROWS from tables where TABLE_SCHEMA like 'db_xx_deviceinfo%' and TABLE_ROWS>200000;
+-----------------------+------------------------+------------+
| TABLE_SCHEMA          | TABLE_NAME             | TABLE_ROWS |
+-----------------------+------------------------+------------+
| db_xx_deviceinfo104 | electric_meter_reading |    1578844 |
| db_xx_deviceinfo696 | electric_meter_reading |    3579983 |
| db_xx_deviceinfo696 | push_data_record       |     975528 |
+-----------------------+------------------------+------------+

二、采用查询业务表的方式(缺点:写脚本去完成,有点麻烦,优点:快速与准确)

1、脚本

#! _*_ coding:utf-8 _*_import pymysql
import sys
from concurrent.futures import ThreadPoolExecutor, as_completedm_host = sys.argv[1]
m_user='tmp_select'
m_port = sys.argv[2]  # 这里是字符串类型
m_db = sys.argv[3]
t_count = sys.argv[4]def get_mysql_connection():"""获取MySQL数据库连接"""# 从密码文件中读取密码try:with open('/root/.ssh/.password.txt', 'r') as f:password = f.read().strip()except Exception as e:print(f"无法读取密码文件: {e}")sys.exit(1)# 连接MySQLtry:conn = pymysql.connect(host=m_host,  # MySQL服务器IPport=int(m_port),  # 关键修复:将字符串转换为整数user=m_user,   # 用户名password=password,   # 密码charset='utf8mb4',cursorclass=pymysql.cursors.DictCursor,connect_timeout=30)return connexcept Exception as e:print(f"数据库连接失败: {e}")sys.exit(1)def check_database_exists(conn, db_name):"""检查数据库是否存在"""try:with conn.cursor() as cursor:cursor.execute("SHOW DATABASES LIKE %s", (db_name,))return cursor.fetchone() is not Noneexcept Exception as e:print(f"检查数据库 {db_name} 是否存在时出错: {e}")return Falsedef check_table_data_count(db_name):"""检查单个库中所有表的数据量"""results = []try:# 为每个线程创建独立的连接with open('/root/.ssh/.pwd.txt', 'r') as f:password = f.read().strip()conn = pymysql.connect(host=m_host,port=int(m_port),user=m_user,password=password,database=db_name,charset='utf8mb4',cursorclass=pymysql.cursors.DictCursor,connect_timeout=10)with conn.cursor() as cursor:# 获取当前数据库中的所有表cursor.execute("SHOW TABLES")tables = cursor.fetchall()for table in tables:table_name = list(table.values())[0]# 查询表的数据量try:cursor.execute(f"SELECT COUNT(*) as count FROM `{table_name}`")count_result = cursor.fetchone()data_count = count_result['count']# 如果数据量大于t_count,记录结果if data_count > int(t_count):result_str = f"库名: {db_name}, 表名: {table_name}, 数据量: {data_count}"results.append(result_str)except Exception as e:print(f"查询表 {db_name}.{table_name} 数据量时出错: {e}")continueconn.close()except Exception as e:print(f"检查数据库 {db_name} 时出错: {e}")return resultsdef main():"""主函数"""print("开始检查各库表数据量...")print(f"连接MySQL服务器: %s:%s, 用户: %s" %(m_host,m_port,m_user))# 生成所有数据库名database_names = [f"{m_db}{str(i)}" for i in range(1000)]# 先检查哪些数据库存在conn = get_mysql_connection()existing_dbs = []print("正在检查存在的数据库...")for db_name in database_names:if check_database_exists(conn, db_name):existing_dbs.append(db_name)conn.close()print(f"发现 {len(existing_dbs)} 个数据库存在")# 使用多线程并行检查每个数据库all_results = []with ThreadPoolExecutor(max_workers=20) as executor:# 提交所有任务future_to_db = {executor.submit(check_table_data_count, db_name): db_name for db_name in existing_dbs}# 处理完成的任务for i, future in enumerate(as_completed(future_to_db)):db_name = future_to_db[future]try:results = future.result()all_results.extend(results)# 实时输出结果for result in results:print(result)# 显示进度if (i + 1) % 10 == 0:print(f"已完成 {i + 1}/{len(existing_dbs)} 个数据库的检查")except Exception as e:print(f"处理数据库 {db_name} 时发生错误: {e}")# 保存结果到文件if all_results:with open('table_data_count_results.txt', 'w', encoding='utf-8') as f:for result in all_results:f.write(result + '\n')print(f"\n检查完成,共找到 {len(all_results)} 个表的数据量大于{t_count}")print("结果已保存到 table_data_count_results.txt 文件中")else:print(f"未找到数据量大于{t_count}的表")if __name__ == "__main__":main()

2、运行查询
python3 910.py 1x2.1x.5.x1 3305 db_xx_deviceinfo 200000
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/96411.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/96411.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/96411.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python之socket网络编程

引言 在互联网时代,网络编程已经成为开发人员必备的技能之一。无论是Web开发、实时通信还是分布式计算,都离不开网络编程的支持。Python提供的socket模块为我们提供了简洁而强大的接口,可以轻松实现客户端和服务器之间的通信。 Socket编程是网…

WPF Telerik.Windows.Controls.Data.PropertyGrid 自定义属性编辑器

1.AI帮忙定义新用户控件 2.在属性上添加TelerikEditorAttribute特性 private ObservableCollection<string> _axisOrder;[Display(Description "点位", GroupName "通用", Name "轴&顺序", Order 1)][DataMember][TelerikEditorAt…

【超详细】别再看零散的教程了!一篇搞定Gitee从注册、配置到代码上传与管理(内含避坑指南最佳实践)

&#x1f525;个人主页&#xff1a;艾莉丝努力练剑 ❄专栏传送门&#xff1a;《C语言》、《数据结构与算法》、C语言刷题12天IO强训、LeetCode代码强化刷题、洛谷刷题、C/C基础知识知识强化补充、C/C干货分享&学习过程记录 &#x1f349;学习方向&#xff1a;C/C方向学习者…

43.shell脚本循环与函数

shell脚本循环与函数 for 循环 for 循环用于一次性读取多个信息&#xff0c;逐一对信息进行操作处理&#xff0c;特别适合处理有范围的数据 语法 for 变量名 in 取值列表 do命令序列 done批量创建用户 #!/bin/bashtouch /root/users.txt echo aka blues cloe dio foks > /ro…

模型部署:(四)安卓端部署Yolov8-v8.2.99实例分割项目全流程记录

模型部署&#xff1a;&#xff08;四&#xff09;安卓端部署Yolov8-v8.2.99实例分割项目全流程记录1、下载ncnn2、下载opencv-mobile3、文件拷贝4、andorid_studio相关配置5、文件内参数设置5、重构项目&#xff1a;6、打包apk7、部署自己训练的实例分割模型1、下载ncnn 地址&…

高并发、低延迟全球直播系统架构

一、 核心架构图 整个系统的数据流和工作流程如下图所示&#xff0c;它清晰地展示了从主播推流到观众观看的完整过程&#xff1a; #mermaid-svg-QzNpj0DWxd5FERPC {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-QzN…

AWS strands agents 当智能体作为独立服务/容器部署时,它们无法共享进程内状态

当智能体作为独立服务/容器部署时&#xff0c;它们无法共享进程内状态。 以下是针对分布式部署中动态内存库的生产就绪解决方案&#xff1a;1. 基于外部存储的内存库基于 DynamoDB 的共享内存import boto3 from strands import Agent, tool from typing import Dict, Any impor…

第五节 JavaScript——引用类型、DOM/BOM 与异步编程

JavaScript 的第五节课通常会深入探讨 ​​引用类型、DOM 操作、BOM 操作、事件处理以及异步编程​​ 等核心概念。这些知识能让你创建动态交互丰富的网页。下面我将详细讲解这些内容并提供示例。 🚀 JavaScript 第五节:引用类型、DOM/BOM 与异步编程 ⚡ 一、引用类型 引…

使用Pycharm进行远程ssh(以Featurize为例)

使用Pycharm进行远程ssh&#xff08;以Featurize为例&#xff09;文章目录介绍应用背景远程连接Python连接Jupyter介绍应用背景 在使用Pycharm 专业版的时候进行远程ssh连接服务器&#xff08;Featurize&#xff09;的Python解释器和Jupyter 远程连接Python 打开Pycharm点击…

深入研究:ClickHouse中arrayExists与hasAny在ORDER BY场景下的性能差异

最近公司大数据情况下ClickHouse查询性能极差&#xff0c;后来发现在大数据量ORDER BY场景下&#xff0c;arrayExists(x -> x in ...)比hasAny性能快10倍&#xff01;&#xff01;&#xff01;&#xff01; 一、问题重述与研究背景 在大数据量 ORDER BY场景下&#xff0c;…

Spring AI (二)结合Mysql做聊天信息存储

上文讲了&#xff0c;用Spring ai做简单的聊天功能&#xff0c;没看过的可以查看下 Spring AI结合豆包模型 这里简单结合下Jdbc做下聊天记录的存储和查询&#xff0c;让对话变的更智能。 首先是Pom的支持 <dependency><groupId>org.springframework.ai</grou…

【docker】data-root 数据迁移(防止无法加载镜像和容器问题)

操作系统&#xff1a;ubuntu 24.04 docker版本&#xff1a;docker-ce 28.1.1 目标&#xff1a;将/var/lib/docker 的数据迁移到/data/docker停止docker sudo systemctl stop docker.socket sudo systemctl stop docker这个步骤一定要做&#xff0c;否则容易导致数据不一致。 rs…

二、网页的“化妆师”:从零学习 CSS

一、CSS 是什么 1.1 CSS 的定义 CSS&#xff08;Cascading Style Sheets&#xff0c;层叠样式表&#xff09; 是一种用来给 HTML 页面 添加样式的语言。 简单来说&#xff1a; HTML 负责结构 —— 决定网页上有什么内容。 CSS 负责样式 —— 决定这些内容“长什么样”。 如果…

传统项目管理与敏捷的核心差异

在项目管理领域&#xff0c;传统方法与敏捷方法代表了两种不同的管理思维与实践路径。传统项目管理强调计划性、规范性和阶段性推进&#xff0c;而敏捷则注重灵活性、快速迭代和价值交付。 正如彼得德鲁克所说&#xff1a;“没有完美的计划&#xff0c;只有不断调整的行动。”理…

axios+ts封装

http.ts import axios from axios import type { AxiosInstance, AxiosRequestConfig, AxiosResponse } from axios import qs from qs/*** 扩展AxiosRequestConfig&#xff0c;增加一些自定义的属性* isAuth: 自定义的参数中&#xff0c;用来判断是否携带token 因为AxiosReq…

2026新选题:基于K-Means实现学生求职意向聚类推荐职位

作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验&#xff0c;被多个学校常年聘为校外企业导师&#xff0c;指导学生毕业设计并参与学生毕业答辩指导&#xff0c;…

SpringCloud gateway配置predicates的匹配规则

需求 通过gateway的route规则&#xff0c;实现分组流量配置 资源 一个nacos&#xff0c;一个gateway &#xff0c;一个服务app&#xff08;部署双实例group-1&#xff0c;group-2&#xff09;&#xff0c;实现特定条件下往分组一和分组二流量切换。 方案 1 配置文件 nacos…

android14 硬键盘ESC改BACK按键返回无效问题

在之前的android版本中修改外接键盘ESC为BACK按键做返回键使用&#xff0c;直接修改如下代码即可&#xff1a;--- a/frameworks/base/data/keyboards/Generic.kcmb/frameworks/base/data/keyboards/Generic.kcm-499,7 499,7 key PLUS {### Non-printing keys ###key ESCAPE { …

【开题答辩全过程】以 asp高校外卖订单系统的设计与实现为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人&#xff0c;语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

UVa1063/LA3807 The Rotation Game

UVa1063/LA3807 The Rotation Game题目链接题意输入格式输出格式分析AC 代码IDA*分3次BFS题目链接 本题是2004年icpc亚洲区域赛上海赛区的H题 题意 如下图所示形状的棋盘上分别有8个1、2、3&#xff0c;要往A&#xff5e;H方向旋转棋盘&#xff0c;使中间8个方格数字相同。图&…