当前位置: 首页 > backend >正文

C#.NET EFCore.BulkExtensions 扩展详解

简介

EFCore.BulkExtensions 是一个开源库,用于扩展 Entity Framework Core 的功能,提供高效的批量操作(Bulk Operations)支持。原生 EF Core 在处理大量数据时性能较差(例如逐条插入 / 更新),而该库通过优化 SQL 执行,显著提升了批量操作的效率。

为什么需要 BulkExtensions?

EF Core 原生操作瓶颈

操作类型10,000 记录耗时瓶颈原因
SaveChanges5-10 秒逐条SQL + 变更跟踪
AddRange3-5 秒仍生成多条INSERT
Update8-15 秒逐条UPDATE语句

BulkExtensions 性能优势

操作类型10,000 记录耗时性能提升
BulkInsert0.5-1 秒10x
BulkUpdate1-2 秒8x
BulkDelete0.3-0.8 秒15x

核心功能

批量插入 (BulkInsert)
using (var context = new ApplicationDbContext())
{var products = new List<Product>{new Product { Name = "Product 1", Price = 9.99m },new Product { Name = "Product 2", Price = 19.99m },// 1000+ 条记录...};// 批量插入await context.BulkInsertAsync(products);
}// 基础用法
context.BulkInsert(entities);// 高级配置
context.BulkInsert(entities, options => {options.BatchSize = 2000;          // 每批数量options.InsertIfNotExists = true;   // 仅插入不存在记录options.SetOutputIdentity = true;   // 获取数据库生成IDoptions.PropertiesToExclude = new List<string> { "CreatedDate" }; // 排除属性
});
批量更新 (BulkUpdate)
using (var context = new ApplicationDbContext())
{var products = await context.Products.Where(p => p.Price < 10).ToListAsync();// 修改价格foreach (var product in products){product.Price *= 1.1m; // 提价10%}// 批量更新await context.BulkUpdateAsync(products);
}context.BulkUpdate(entities, options => {options.BatchSize = 1000;options.PropertiesToInclude = new List<string> { "Name", "Price" }; // 仅更新指定列options.UpdateByProperties = new List<string> { "ProductCode" };    // 自定义更新条件
});
批量删除 (BulkDelete)
using (var context = new ApplicationDbContext())
{// 按条件批量删除(无需先查询)await context.BulkDeleteAsync<Product>(p => p.IsDiscontinued);
}// 通过实体删除
context.BulkDelete(entities);// 通过条件删除
context.Products.Where(p => p.IsObsolete).BatchDelete();// 等效SQL: DELETE FROM Products WHERE IsObsolete = 1
批量合并 (UPSERT/BulkInsertOrUpdate)
using (var context = new ApplicationDbContext())
{var products = new List<Product>{// 新记录(ID=0)将被插入new Product { Name = "New Product", Price = 29.99m },// 已有记录(ID>0)将被更新new Product { Id = 1, Name = "Updated Product", Price = 14.99m }};// 批量合并await context.BulkMergeAsync(products);
}context.BulkInsertOrUpdate(entities, options => {options.MergeOnProperty = "UniqueCode"; // 根据此字段判断插入/更新
});
批量读取 (BulkRead)
var existingData = context.Products.Where(p => p.CategoryId == 1).BatchRead(include: p => p.Supplier); // 包含关联实体

关键技术实现

SQL 批量生成
/* BulkInsert 生成的SQL */
INSERT INTO [Products] ([Name], [Price])
VALUES 
('Product1', 10.99),
('Product2', 20.50),
... -- 2000行/批
临时表策略 (SQL Server)
CREATE TABLE #TempProducts (...) -- 创建临时表
BULK INSERT INTO #TempProducts   -- 批量插入临时表
MERGE INTO Products USING #TempProducts -- 合并操作
变更跟踪绕过
  • 直接操作数据库,跳过 EF 变更跟踪

  • 上下文不更新实体状态

性能优化

批处理配置
var optimalOptions = new BulkConfig {BatchSize = 4000,              // SQL Server 推荐值UseTempDB = true,              // SQL Server 专用SetOutputIdentity = true,      // 需要返回ID时启用CalculateStats = true,         // 获取操作统计WithHoldlock = true,           // 高并发安全PropertiesToExclude = new List<string> { "CreatedDate", "Version"   // 排除非更新字段}
};
关闭变更跟踪
context.ChangeTracker.AutoDetectChangesEnabled = false;
不同数据库优化策略
数据库推荐 BatchSize特殊配置
SQL Server2000-5000UseTempDB=true
PostgreSQL3000-7000PgBulkImport=true
MySQL1000-3000MySqlBulkCopy=true
SQLite500-1000事务分割(每批单独事务)
百万级数据导入
const int totalRecords = 1_000_000;
const int batchSize = 5000;for (int i = 0; i < totalRecords; i += batchSize)
{var batch = data.Skip(i).Take(batchSize).ToList();context.BulkInsert(batch, options => {options.BatchSize = batchSize;options.SetOutputIdentity = false;});context.DetachAllEntities(); // 防止内存膨胀
}
错误处理
try {context.BulkInsert(entities);
} 
catch (DbUpdateException ex) {// 处理唯一键冲突等错误
}

高级用法

配置批量操作选项
var options = new BulkConfig
{SetOutputIdentity = true,          // 返回自增IDBatchSize = 1000,                  // 每批处理记录数UseTempDB = true,                  // 使用临时表(提高性能)PropertiesToInclude = "Name,Price" // 仅更新指定属性
};await context.BulkUpdateAsync(products, options);
处理导航属性
var options = new BulkConfig
{CascadeOperations = true,          // 启用级联操作IncludeGraph = true                // 包含关联对象
};// 批量插入产品及其关联的评论
await context.BulkInsertAsync(productsWithReviews, options);
自定义映射
var mapping = new Dictionary<string, string>
{{ "ProductName", "Name" },         // CSV中的ProductName映射到实体的Name{ "UnitPrice", "Price" }
};await context.BulkReadAsync<Product>(csvFilePath, mapping);
事务处理
using (var transaction = await context.Database.BeginTransactionAsync())
{try{await context.BulkInsertAsync(products1);await context.BulkUpdateAsync(products2);await transaction.CommitAsync();}catch (Exception){await transaction.RollbackAsync();throw;}
}

与EF Core原生操作对比

功能EF Core 原生BulkExtensions优势说明
插入10k记录5-10秒0.3-0.8秒减少网络往返
更新10k记录8-15秒1-2秒批量UPDATE语句
删除10k记录7-12秒0.2-0.5秒单条DELETE WHERE
内存消耗高 (变更跟踪)极低绕过变更跟踪
事务控制自动或显式事务默认每批独立事务避免大事务锁表
关联数据操作完善有限支持推荐用于根实体操作

最佳实践

批处理大小调优
// 动态计算批大小
int optimalBatchSize = Math.Max(1000, totalRecords / 20);
定期清理上下文
// 防止内存泄漏
context.ChangeTracker.Clear();
context.DetachAllEntities();
异步操作支持
await context.BulkInsertAsync(entities);
await context.BulkUpdateAsync(entities);
http://www.xdnf.cn/news/15835.html

相关文章:

  • 物联网安装调试-温湿度传感器
  • 分布式文件系统04-DataNode海量数据分布式高可靠存储
  • python中读取 Excel 表格数据
  • 【数据结构】揭秘二叉树与堆--用C语言实现堆
  • 【MySQL】索引中的页以及索引的分类
  • LLVM中AST节点类型
  • string【下】- 补充
  • MySQL中的排序和分页
  • 集群与高可用
  • Facebook 开源多季节性时间序列数据预测工具:Prophet 饱和预测 Saturating Forecasts
  • Go并发聊天室:从零构建实战
  • Shell脚本-tee工具
  • 小程序和H5数据mock配置过程
  • 前端环境搭建---基于SpringBoot+MySQL+Vue+ElementUI+Mybatis前后端分离面向小白管理系统搭建
  • LLM 的Top-P参数 是在LLM中的每一层发挥作用,还是最后一层?
  • SpringBoot五分钟快速入门指南
  • NW993NX584美光固态闪存NX559NX561
  • [故障诊断方向]基于二维时频图像和数据增强技术的轴承故障诊断模型
  • 数据分析综合应用 30分钟精通计划
  • 动态规划——数位DP经典题目
  • 量子计算与AI融合的技术突破与实践路径
  • 6. 装饰器模式
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘pillow’问题
  • 小架构step系列19:请求和响应
  • Java行为型模式---中介者模式
  • [故障诊断方向]SNNs:针对小样本轴承故障诊断的孪生神经网络模型
  • Selenium 中 findElement 方法全解析:定位网页元素的 7 种方式
  • BeanFactory 和 FactoryBean 的区别
  • Java行为型模式---访问者模式
  • 用Dynamic chunk去干掉tokenizer?