当前位置: 首页 > news >正文

C# 高效读取大文件

        在 C# 中高效读取大文件时,需根据文件类型和场景选择不同的技术方案,以下为综合实践方法及注意事项:

一、文本文件读取方案

逐行读取

StreamReader.ReadLine‌:通过流式处理逐行加载文本,避免一次性加载整个文件到内存,适合超大文本文件(如日志文件)。

using (StreamReader sr = new StreamReader("file.txt", Encoding.UTF8, bufferSize: 1024*1024)) 
{
    string line;
    while ((line = sr.ReadLine()) != null) 
    {
        // 处理每行数据
    }
}

File.ReadLines():返回 IEnumerable<string> 实现惰性加载,语法简洁但需注意异常处理(如文件不存在时抛出 FileNotFoundException)。

分批次处理

结合数据库事务分批入库(如每 1 万条提交一次),减少内存峰值和 I/O 压力:

List<string> batch = new List<string>(10000);
while ((line = sr.ReadLine()) != null) 
{
    batch.Add(line);
    if (batch.Count >= 10000) 
    {
        InsertToDatabase(batch);
        batch.Clear();
    }
}

二、二进制文件读取方案

FileStream + 字节数组

直接操作字节流,适合非文本文件(如图像、音视频):

using (FileStream fs = new FileStream("file.bin", FileMode.Open)) 
{
    byte[] buffer = new byte[4096];
    int bytesRead;
    while ((bytesRead = fs.Read(buffer, 0, buffer.Length)) > 0) 
    {
        // 处理二进制数据块
    }
}

BufferedStream 加速

对底层流添加缓冲区(默认 4KB),减少直接访问存储设备的频率,提升 I/O 效率。

三、优化技巧

        缓冲区设置:通过 StreamReader 构造函数指定 bufferSize(如 1MB),平衡内存与读取频率。

        编码处理:明确指定文本编码(如 Encoding.GetEncoding("GB2312"))避免乱码。

        资源释放:使用 using 语句确保流对象及时释放,防止内存泄漏。

四、方案对比

方法                                适用场景                    内存占用        灵活性

StreamReader               超大文本逐行处理        低                高(可控性强)

File.ReadLines()            中小文本简洁操作        中                中

FileStream                     二进制文件处理            低                高

注意事项:对于超大规模文件(如数十 GB),需避免 File.ReadAllLines 等一次性加载方法,防止内存溢出
 

如果您喜欢此文章,请收藏、点赞、评论,谢谢,祝您快乐每一天。 

http://www.xdnf.cn/news/605089.html

相关文章:

  • JVM 性能优化终极指南:全版本兼容、参数公式与场景实战
  • 百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
  • C# AutoMapper对象映射详解
  • 从细胞工厂到智能制造:Extracellular 用时序数据库 TDengine 打通数据生命线
  • 题目 3330: 蓝桥杯2025年第十六届省赛真题-01 串
  • Spring循环依赖相关问题
  • C++(初阶)(十九)——红黑树
  • LLM多轮对话效果优化之道
  • 每日c/c++题 备战蓝桥杯(修理牛棚 Barn Repair)
  • 【信息系统项目管理师】第19章:配置与变更管理 - 38个经典题目及详解
  • 【Ubuntu】如何在一个脚本文件中跑三个python文件?以及端口被占的解决方法
  • 如何最简单、通俗地理解什么是NLP?
  • el-table控制type=“expand“展开列 根据条件显示或隐藏展开按钮
  • 【萤火工场GD32VW553-IOT开发板】流水灯
  • Git子模块原理与实战详解
  • 【MATLAB代码】扩展卡尔曼滤波估计pmsm的位置误差
  • #6 百日计划第六天 java全栈学习
  • 编译原理 期末速成
  • 从零开始:Python语言进阶之继承
  • window 显示驱动开发-视频内存供应和回收(二)
  • 计算机语言&计算机安全知识
  • 十、Linux 网络服务基础
  • NLweb本地部署指南
  • EasyRTC音视频实时通话WebP2P技术赋能的全场景实时通信解决方案
  • 数据分析概述and环境配置
  • 照片时光机APP:修复老照片,重现往昔美好
  • Windows逆向工程提升之IMAGE_EXPORT_DIRECTORY
  • Git和Gitcode交互教程
  • 85. Java Record 深入解析:构造函数、访问器、序列化与实际应用
  • 关于千兆网络变压器的详细介绍