MyBatis批量插入数据的性能优化方案-小浪学习网

mybatis批量插入性能优化的核心在于利用数据库批处理能力，减少交互次数，主要通过以下方式实现：1. 使用executortype.batch配置sqlsession，缓存多条插入操作并一次性提交，减少网络和数据库解析开销；2. 利用mybatis的标签构建多值插入sql，将多条insert合并为一条执行；3. 在jdbc连接中添加rewritebatchedstatements=true参数，提升驱动层面的批处理效率；4. 对超大数据量进行分批提交，避免内存溢出和事务过大；5. 通过日志、监控工具或性能测试验证批量插入是否生效；6. 针对常见问题如内存溢出、sql过长、主键冲突等，采取分批处理、忽略冲突或替换记录等策略解决；7. 与传统jdbc相比，mybatis在保持底层jdbc批处理机制的基础上，提供了更高层次的封装，简化开发流程并提升效率。

MyBatis批量插入数据的性能优化方案

MyBatis批量插入的性能优化，核心在于充分利用数据库的批处理能力，减少与数据库的交互次数，将多条插入操作打包成一次性提交。这通常涉及MyBatis的ExecutorType.BATCH配置以及sql语句层面的优化。

MyBatis批量插入数据的性能优化方案

解决方案

要实现MyBatis批量插入的性能优化，可以从几个关键点入手，它们往往是相互配合的：

首先，最直接且有效的方式是利用MyBatis的批处理执行器。当你通过SqlSessionFactory.openSession(ExecutorType.BATCH)来获取SqlSession时，MyBatis会启用批量模式。在这种模式下，你连续执行的insert操作并不会立即提交到数据库，而是被MyBatis缓存起来，直到你调用sqlSession.commit()或sqlSession.flushStatements()时，这些操作才会作为一个批次发送给数据库。这极大地减少了网络往返和数据库解析SQL的开销。

MyBatis批量插入数据的性能优化方案

SqlSession sqlSession = sqlSessionFactory.openSession(ExecutorType.BATCH); try {     for (User user : userList) {         sqlSession.insert("com.example.mapper.UserMapper.insertUser", user);     }     sqlSession.commit(); // 提交所有批处理操作 } catch (Exception e) {     sqlSession.rollback();     throw e; } finally {     sqlSession.close(); }

其次，SQL语句本身的结构也至关重要。虽然ExecutorType.BATCH能将多条独立的INSERT语句打包，但如果能将它们合并成一条大的INSERT INTO table (col1, col2) VALUES (v1, v2), (v3, v4), …;语句，效率会更高。MyBatis的标签在这里就显得非常强大，它允许你动态地构建这种多值插入的SQL。

<!-- UserMapper.xml --> <insert id="batchInsertUsers" parameterType="Java.util.List">     INSERT INTO users (id, name, age)     VALUES     <foreach collection="list" item="item" separator=",">         (#{item.id}, #{item.name}, #{item.age})     </foreach> </insert>

然后在Java代码中，直接调用这个Mapper方法，传入一个用户列表即可。这种方式下，MyBatis会生成一条包含所有数据的SQL语句，一次性发送给数据库。

MyBatis批量插入数据的性能优化方案

再来，别忘了JDBC驱动层面的优化。对于mysql数据库，在JDBC连接URL中添加rewriteBatchedStatements=true参数通常能带来额外的性能提升。这个参数会让JDBC驱动尝试将多条独立的PreparedStatement执行转换为一条更高效的批量操作，即使你没有使用MyBatis的构建大SQL，它也能在驱动层面进行优化。

最后，考虑到内存消耗和事务粒度，如果你的批量数据量非常庞大（比如几十万上百万条），一次性全部提交可能会导致内存溢出或数据库事务过大。在这种情况下，可以考虑分批提交。例如，每处理5000或10000条数据就进行一次sqlSession.commit()，然后重新开始下一个批次。这样既能利用批处理的优势，又能控制资源消耗。

如何判断MyBatis批量插入是否真的生效了？

判断MyBatis批量插入是否真正生效，这事儿不能光凭感觉，得有点实锤的依据。毕竟，我们是想优化性能，不是做表面功夫。

一个直接的办法是观察MyBatis的日志。如果你把日志级别调到DEBUG，尤其是针对MyBatis执行SQL的包（比如org.apache.ibatis.executor.BatchExecutor或org.apache.ibatis.executor.SimpleExecutor），你会看到SQL的执行情况。当使用ExecutorType.BATCH时，你会发现多次insert调用后，SQL语句并不会立即出现在日志中，直到commit时才可能一次性输出，或者显示多条SQL但只有一次数据库交互。如果使用了，那日志里直接就是一条很长的SQL语句，包含了所有要插入的数据。如果日志里还是每条数据都对应一条独立的INSERT语句，那多半是批量模式没生效或者没用对。

更进一步，可以借助JDBC层面的监控工具，比如P6Spy或者一些APM工具。这些工具能够拦截JDBC调用，清晰地展示实际发送到数据库的SQL语句以及执行次数。如果批处理生效，你会看到executeBatch()被调用，并且发送的SQL语句数量远少于你尝试插入的数据条数（当使用时，可能只有一条）。这比MyBatis自身的日志更能反映底层JDBC的真实行为。

当然，最硬核的验证方式是性能测试。准备一份足够大的数据集，分别在启用和不启用批量插入优化的情况下进行测试，对比总耗时。如果优化有效，你会看到显著的时间缩短。同时，可以监控数据库服务器的资源使用情况，比如CPU、IO和网络流量。批量插入通常会降低网络IO和CPU开销，因为减少了SQL解析和执行计划的次数。如果这些指标没有明显改善，那可能优化并未达到预期。

MyBatis批量插入时可能遇到的常见问题及解决策略

在实际应用中，MyBatis批量插入虽然高效，但也并非一帆风顺，总会遇到一些让人头疼的问题。

一个比较常见的挑战是内存溢出（OOM）。当你尝试一次性插入几十万甚至上百万条数据时，如果这些数据全部加载到内存中，或者MyBatis在构建单条超长SQL时，很容易撑爆jvm堆内存。解决这个问题最直接的办法就是分批处理。不要一次性把所有数据都丢给MyBatis，而是手动将大列表拆分成多个小列表（比如每批5000或10000条），然后对每个小列表进行一次批量插入和提交。这样可以有效控制每次操作的内存占用，避免OOM。

另一个问题是SQL语句过长。虽然能生成一条大SQL，但不同的数据库对单条SQL语句的长度有上限。例如，MySQL的max_allowed_packet参数就限制了SQL包的大小。如果生成的SQL超出了这个限制，数据库会直接拒绝执行。应对之道与内存溢出类似，也是分批构建SQL。如果数据量大到可能触及SQL长度限制，就得考虑分批次生成和执行构建的SQL。或者，退而求其次，使用ExecutorType.BATCH配合多次独立的insert调用，让JDBC驱动去处理批次，这样每条SQL本身不会太长。

主键冲突也是个麻烦事。在批量插入时，如果其中某条数据的主键与数据库中现有记录冲突，默认情况下，整个批次的操作可能会失败回滚。这取决于数据库的配置和事务隔离级别。如果你希望忽略冲突并继续插入其他数据，可以在SQL层面进行处理。比如，MySQL可以使用INSERT IGNORE INTO …来忽略主键冲突，或者REPLACE INTO …来替换现有记录。postgresql则有ON CONFLICT DO NOTHING或ON CONFLICT DO UPDATE。选择哪种策略取决于业务需求。但要注意，使用这些特定数据库的语法会降低SQL的通用性。

此外，事务回滚的粒度有时也会让人纠结。批量操作通常被视为一个原子单元，要么全部成功，要么全部失败。这意味着如果批处理中的任何一条记录插入失败，整个批次都会回滚。在大多数业务场景下，这种原子性是期望的。但如果你的业务允许部分成功，比如希望即使有几条记录失败，其他成功的记录也能保留，那批量插入的默认行为可能就不符合预期了。这时，你可能需要放弃纯粹的批量操作，转而采用更细粒度的循环插入（虽然效率会降低），并在每次插入后捕获异常，或者在应用层对失败的数据进行筛选和重试。不过，这种需求通常比较特殊，需要仔细权衡效率和业务逻辑的复杂性。

MyBatis批量插入与传统JDBC批处理的异同

谈到MyBatis的批量插入，我们其实是在聊JDBC批处理机制在MyBatis框架中的应用。它们之间既有共通之处，也有各自的特点。

相同点：从本质上讲，MyBatis的批量插入，无论是通过ExecutorType.BATCH还是构建大SQL，底层都殊途同归，依赖的是JDBC API提供的批处理能力。具体来说，就是java.sql.Statement或java.sql.PreparedStatement接口的addBatch()和executeBatch()方法。它们的核心目的都是一致的：减少客户端（应用服务器）与数据库服务器之间的网络往返次数。通过将多条SQL操作打包成一个批次发送，可以显著降低网络延迟和数据库处理单个请求的开销，从而提升整体的执行效率。可以说，MyBatis只是为JDBC的批处理机制提供了一个更高级、更便捷的封装。

不同点：最大的区别在于抽象层次和开发体验。传统JDBC批处理要求开发者手动管理Connection、PreparedStatement，并显式地调用addBatch()来添加参数，最后调用executeBatch()来执行。整个过程需要编写大量的样板代码，参数的设置也比较繁琐，容易出错。

// 传统JDBC批处理示例 Connection conn = null; PreparedStatement ps = null; try {     conn = dataSource.getConnection();     conn.setAutoCommit(false); // 关闭自动提交，开启事务     ps = conn.prepareStatement("INSERT INTO users (name, age) VALUES (?, ?)");     for (User user : userList) {         ps.setString(1, user.getName());         ps.setInt(2, user.getAge());         ps.addBatch(); // 添加到批次     }     ps.executeBatch(); // 执行批次     conn.commit(); // 提交事务 } catch (SQLException e) {     if (conn != null) conn.rollback();     throw e; } finally {     // 关闭资源 }

而MyBatis则提供了更高层次的抽象。开发者只需在XML Mapper文件中定义好SQL语句（可以利用动态构建），或者在Java代码中通过SqlSession调用Mapper接口方法，并配置ExecutorType.BATCH。MyBatis框架会负责将这些操作转换为底层的JDBC批处理调用。这大大简化了开发工作量，减少了样板代码，提高了开发效率和代码的可维护性。

在SQL构建的灵活性上，MyBatis的标签在构建单条大SQL方面表现出色，它能非常方便地将集合数据映射成VALUES (), (), …的语法，这在某些场景下比JDBC循环addBatch()效率更高，因为数据库只需要解析一条SQL。而传统JDBC虽然也能手动拼接出这种大SQL，但其复杂度和出错率会显著增加。

总的来说，MyBatis的批量插入是站在巨人（JDBC）肩膀上的优化，它将底层复杂的JDBC批处理操作封装起来，以更符合ORM框架思维的方式暴露给开发者，让我们能以更优雅、更高效的方式实现批量数据操作。

文章版权归作者所有，未经允许请勿转载。

THE END