在MySQL中,插入数据的效率可以通过多种方式逐步提升。以下是从简单到复杂的优化路径,帮助你逐步提高数据插入的性能:

一、基础插入:逐条插入

这是最基础的插入方式,适用于少量数据的插入操作。虽然简单,但效率较低,因为每次插入都需要与数据库建立连接并发送请求。

示例:

INSERT INTO table_name (column1, column2) VALUES (value1, value2);

缺点:

每次插入都需要建立连接和提交事务。
适合小数据量,不适合大数据量。

二、批量插入(VALUES方式)

这是MySQL中推荐的批量插入方式,通过一次SQL语句插入多条数据,减少与数据库的交互次数。

示例:

INSERT INTO table_name (column1, column2) 
VALUES 
(value1, value2), 
(value3, value4), 
(value5, value6);

优点:

一次插入多条数据,减少网络开销。
适合中等规模的数据插入。
注意事项:

SQL语句长度不能超过MySQL的max_allowed_packet限制。
如果数据量太大,可能会导致内存溢出或插入失败。

三、分批次插入(分片+事务)

当数据量非常大时,可以将数据分成多个批次进行插入,每个批次使用事务提交,避免一次性插入过多数据导致性能问题。

示例(Java + MyBatis):

List<User> userList = ...; // 所有数据
int batchSize = 1000; // 每批插入1000条
for (int i = 0; i < userList.size(); i += batchSize) {List<User> batch = userList.subList(i, Math.min(i + batchSize, userList.size()));userMapper.batchInsert(batch);
}

优点:

分批次插入可以避免内存溢出。
事务提交可以保证数据一致性。
适合大数据量插入。
注意事项:

每次插入的批次大小需要根据实际情况调整,通常在1000~5000条之间。
如果使用MyBatis,可以结合ExecutorType.BATCH来提高性能。

四、使用LOAD DATA INFILE(高级方式)

这是MySQL中最快的数据导入方式,适用于从文本文件导入大量数据。它通过读取文件一次性加载数据,避免了逐条插入的开销。

示例:

LOAD DATA INFILE '/path/to/data.txt'
INTO TABLE table_name
FIELDS TERMINATED BY ',' 
LINES TERMINATED BY '\n';

优点:

速度远快于INSERT语句。
适合从文件导入大量数据。
注意事项:

需要确保文件路径可访问。
需要配置MySQL的local_infile参数为ON。
适用于ETL、数据迁移等场景。

五、使用JDBC批量插入(rewriteBatchedStatements)

在JDBC连接中设置rewriteBatchedStatements=true,可以开启MySQL的批量插入优化功能,自动将多个INSERT语句合并为一个。

示例(Java连接URL):

String url = "jdbc:mysql://localhost:3306/mydb?rewriteBatchedStatements=true";

优点:

自动优化SQL语句,提高插入效率。
适合MyBatis等ORM框架。
注意事项:

需要确保MySQL版本支持该参数。
与MyBatis结合使用时,可以进一步优化性能。

六、使用MyBatis的批量插入(推荐)

MyBatis提供了批量插入的功能,可以通过foreach标签生成批量插入语句,并结合事务管理来提高性能。

示例(MyBatis XML):

<insert id="batchInsert" parameterType="java.util.List">INSERT INTO table_name (column1, column2)VALUES<foreach collection="list" item="model" index="index" separator=",">(#{model.column1}, #{model.column2})</foreach>
</insert>

示例(Java代码):

SqlSession sqlSession = sqlSessionFactory.openSession(ExecutorType.BATCH);
try {UserMapper userMapper = sqlSession.getMapper(UserMapper.class);for (User user : userList) {userMapper.insert(user);}sqlSession.commit();
} finally {sqlSession.close();
}

优点:

支持MyBatis的批量处理功能。
事务管理保证数据一致性。
适合复杂业务场景。
注意事项:

需要配置ExecutorType.BATCH。
每次插入的批次大小需要合理设置。

七、使用LOAD DATA命令(最高效方式)

对于从文件导入数据的场景,LOAD DATA是最高效的方式。它通过读取文件一次性加载数据,避免了逐条插入的开销。

示例:

LOAD DATA INFILE '/path/to/data.csv'
INTO TABLE table_name
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
IGNORE 1 LINES; -- 忽略表头

优点:

速度最快,适合大规模数据导入。
无需事务管理,适合ETL、数据迁移等场景。
注意事项:

需要确保文件路径可访问。
需要配置MySQL的local_infile参数为ON。
适合批量导入数据,不适合实时插入

总结:从简单到最优的插入方式

最佳实践建议

优先使用LOAD DATA INFILE:对于从文件导入数据的场景,这是最高效的方式。

合理设置批量大小:根据数据量和内存限制,设置合适的批次大小(通常在1000~5000条之间)。

使用事务管理:在批量插入时,使用事务管理保证数据一致性。

开启JDBC批量插入:在JDBC连接中设置
rewriteBatchedStatements=true,提高插入效率。

避免使用UUID主键:在插入数据时,按主键顺序插入,可以减少索引维护成本。

通过以上方法,你可以逐步优化MySQL的插入性能,提高数据处理效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86454.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86454.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/86454.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Rabbitmq的五种消息类型介绍,以及集成springboot的使用

交换机类型 Fanout Exchange 扇型交换机&#xff0c;这个交换机没有路由键概念&#xff0c;就算你绑了路由键也是无视的。 这个交换机在接收到消息后&#xff0c;会直接转发到绑定到它上面的所有队列 Direct Exchange 直连型交换机&#xff0c;根据消息携带的路由键将消息投递…

日语学习-日语知识点小记-进阶-JLPT-真题训练-N2阶段(4):2022年12月2023年12月

日语学习-日语知识点小记-进阶-JLPT-真题训练-N2阶段&#xff08;4&#xff09;&#xff1a;2022年12月&2023年12月 1、前言&#xff08;1&#xff09;情况说明&#xff08;2&#xff09;工程师的信仰&#xff08;3&#xff09;真题训练 2、2个卷的单词部分1、 真题-2023年…

从代码学习深度强化学习 - Actor-Critic 算法 PyTorch版

文章目录 前言算法原理1. 从策略梯度到Actor-Critic2. Actor 和 Critic 的角色3. Critic 的学习方式:时序差分 (TD)4. Actor 的学习方式:策略梯度5. 算法流程代码实现1. 环境与工具函数2. 构建Actor-Critic智能体3. 组织训练流程4. 主程序:启动训练5. 实验结果总结前言 在深…

Python 数据分析与可视化 Day 8 - Pandas 高级操作技巧

✅ 今日目标 掌握 Pandas 的索引体系&#xff08;Index / MultiIndex&#xff09;使用 set_index() 和 reset_index() 管理数据索引理解 pivot_table 与 melt、stack/unstack 重塑数据形态初步理解“宽表”与“长表”在数据分析与可视化中的应用场景 &#x1f4da; 一、深入理…

Spring Boot整合百度AI人脸比对实战

目录 一、简述 二、依赖 三、代码步骤 3.1 实体注入 3.2 服务实现 3.3 其它实现 四、小结 欢迎来到 盹猫(>^ω^<)的博客 本篇文章主要介绍了 [Spring Boot整合百度AI人脸比对实战] ❤博主广交技术好友&#xff0c;喜欢文章的可以关注一下❤ 一、简述 人脸识别在日…

使用 pip 安装 numpy 包卡在 Preparing metadata 阶段问题解决

TOC 1 问题描述 使用 pip 安装numpy卡在下面最后一行的阶段&#xff1a; Collecting numpy1.26.4 (from -r requirements.txt (line 2))Using cached https://mirrors.aliyun.com/pypi/packages/65/6e/09db70a523a96d25e115e71cc56a6f9031e7b8cd166c1ac8438307c14058/numpy-…

新手向:Anaconda3的安装与使用方法

我们在刚开始接触Python时使用的是Python的直接编译器,如果我们需要进行其他的项目编写往往需要使用另一个版本的Python ,这样反复的下载很是麻烦并且还会造成系统变量的紊乱.这次我们引入Anaconda3,可创建虚拟的Python环境,满足不同项目的需要,当不用的时候可以直接放心删除不…

C#中的设计时构造函数

以下是关于设计时构造函数的详细整理&#xff0c;包括定义、适用场景、相关概念和实际应用&#xff1a; 一、设计时构造函数的定义 设计时构造函数&#xff08;Design-time Constructor&#xff09;是专门为开发工具&#xff08;如Visual Studio、Blazor Designer等&#xff0…

Spring Boot 2.x 项目搭建 (一)

以下是基于Spring Boot 2.x&#xff08;兼容JDK 1.8&#xff09;的项目搭建指南及Markdown文档生成方案&#xff0c;整合了多个搜索结果中的最佳实践&#xff1a; 一、项目初始化 1. 使用Spring Initializr创建项目 步骤&#xff1a; 访问 start.spring.io 或通过IDE&#x…

Kotlin作用域函数:掌握apply/let/run/with/also精髓

一、作用域函数详解 1. apply&#xff1a;对调用对象进行配置或操作&#xff0c;并返回该对象本身。 接收者引用&#xff1a;this&#xff08;可省略&#xff0c;直接调用接收者成员&#xff09;返回值&#xff1a;接收者对象本身&#xff08;T&#xff09;核心用途&#xff…

Spring Boot监视器:应用监控终极指南

Spring Boot 监视器详解 Spring Boot 监视器(Monitor)是用于监控和管理 Spring Boot 应用程序运行状态的核心组件,主要通过 Spring Boot Actuator 和 Spring Boot Admin 两大工具实现。 一、核心监视器组件 1. Spring Boot Actuator 功能定位:提供应用程序内部运行状态的原…

SpringBoot 中 @Transactional 的使用

SpringBoot 中 Transactional 的使用 一、Transactional 的基本使用二、Transactional 的核心属性三、使用避坑&#xff08;失效场景&#xff09;3.1 自调用问题3.2 异常处理不当3.3 类未被 Spring 管理3.4 异步方法内使用失效 四、工作实践4.1 事务提交之后执行一些操作4.2 事…

6.26_JAVA_微服务_Elasticsearch

1、ES文档中keyword意思是&#xff1a;字符串&#xff0c;但不需要分词 2、ES细节CreateIndexRequest request new CreateIndexRequest("items");会让你导包&#xff0c;会有两个选择&#xff1a; import org.elasticsearch.action.admin.indices.create.CreateInd…

Java 大视界 -- 基于 Java 的大数据可视化在智慧城市能源消耗动态监测与优化决策中的应用(324)

Java 大视界 -- 基于 Java 的大数据可视化在智慧城市能源消耗动态监测与优化决策中的应用&#xff08;324&#xff09; 引言&#xff1a;正文&#xff1a;一、Java 驱动的能源数据采集与预处理基建1.1 多源异构数据合规接入层&#xff08;ISO 50001IEC 61850 双标准适配&#x…

C++ 快速回顾(二)

C 快速回顾&#xff08;二&#xff09; 前言一、友元类二、友元函数三、深浅拷贝浅拷贝深拷贝 前言 用于快速回顾之前遗漏或者补充C知识 一、友元类 友元的优点是可以快速的轻松的访问的原本由于私有保护的字段和函数&#xff0c;同时这也是它的缺点这样破坏了原本封装性。 …

ldl-DeserializationViewer一款强大的序列化数据可视化工具

ldl-DeserializationViewer 一款强大的序列化数据可视化工具&#xff0c;能够将Java序列化的缓存数据转换为可读的JSON格式&#xff0c;无需原始DTO类定义。 A powerful visualization tool for serialized data that converts Java serialized cache data to readable JSON f…

NetworkSecurity SIG成立,助力国产操作系统安全生态发展

近期&#xff0c;ZeroOnes实验室团队成员在OpenAtom openKylin&#xff08;简称“openKylin”&#xff09;社区发起成立NetworkSecurity SIG&#xff0c;负责基于openKylin系统开展网络安全工具的研发与适配&#xff0c;助力国产操作系统安全生态发展。 ZeroOnes实验室专注于网…

回归任务与分类任务的区别

回归任务&#xff08;Regression&#xff09;与分类任务&#xff08;Classification&#xff09;是机器学习的两大核心任务类型&#xff0c;其根本区别在于输出变量的性质和任务目标。以下是系统性对比&#xff1a; 1. 本质区别&#xff1a;输出变量类型 任务类型输出&#xf…

Webshell工具的流量特征分析(菜刀,蚁剑,冰蝎,哥斯拉)

Webshell工具的流量特征分析&#xff08;菜刀&#xff0c;蚁剑&#xff0c;冰蝎&#xff0c;哥斯拉&#xff09; 0x00 前言 使用各种的shell工具获取到目标权限&#xff0c;即可进行数据操作&#xff0c;今天来简要分析一下目前常使用的各类shell管理工具的流量特诊&#xff…

【linux】全志Tina配置swupdate工具进行分区打包

一、文件路径 1、描述文件&#xff1a; .\build\swupdate\sw-description-ab 2、镜像打包文件&#xff1a; .\build\swupdate\sw-subimgs-ab.cfg 二、文件作用 1、sw-description-ab 用于描述版本信息和ab区中要打包的分区信息以及挂载点。 2、sw-subimgs-ab.cfg 用于…