当前位置: 首页 > news >正文

【文本数据找重复记录】2021-11-23

缘由在输入文件中找到所有相同的连续行组。在输出文件中放置每个这样的组的信息,包括重复行的文本,重复的数量和该组开始的行号。-编程语言-CSDN问答

void 文本数据找重复记录()
{//缘由https://ask.csdn.net/questions/7576185?spm=1010.2135.3001.5893&answer=53602933std::ifstream fi;fi.open("..\\Debug\\回复专用\\in.txt", std::ios::in);if (!fi.is_open())std::cout << "open file in.txt fail" << std::endl;std::ofstream fo;fo.open("..\\Debug\\回复专用\\out.txt", std::ios::out);if (!fo.is_open())std::cout << "open file out.txt fail" << std::endl;std::string str, str1, ju, sc; int line = 0, count = 1, zs = 0, w = 0;while (getline(fi, str1)){if (++line > zs && ju.find(std::to_string(zs) + ";") == -1){while (getline(fi, str))if (str == str1)++count, ju += std::to_string(line++) + ";";else ++line;++zs;if (count > 1)fo << str1 << " " << zs << " " << count << std::endl; else;fi.close(); fi.open("..\\Debug\\回复专用\\in.txt", std::ios::in);count = 1; line = 0; sc = std::to_string(zs - 1) + ";";if ((w = ju.find(sc)) != -1)ju = ju.replace(w, (sc).size(), ""); else;}}fo.close();
}

限制条件自己构建,不涉及原数据,这就是工巧之处,ju可用替换处理前面已过的多余的字符以节省字符串长度。

 

http://www.xdnf.cn/news/395263.html

相关文章:

  • C++编程中,什么是野指针?
  • SpringBoot3.0 分组校验
  • jsAPI
  • Docker 部署Nexus仓库 搭建Maven私服仓库 公司内部仓库
  • BI PaaS化实践:衡石如何通过可插拔数仓加速企业数据湖仓一体?
  • UNet网络 图像分割模型学习
  • 用户线程和守护线程
  • 机器学习极简入门:从基础概念到行业应用
  • 视频编码原理讲解一:VCL层和NAL层的讲解
  • 微服务架构-注册中心、配置中心:nacos入门
  • IPLOOK超轻量核心网,助力5G专网和MEC边缘快速落地
  • macOS 15 (Sequoia) 解除Gatekeeper限制
  • 可变参数模板
  • 微服务架构-限流、熔断
  • 小智AI机器人 - 代码框架梳理2
  • 【GPT入门】第38课 RAG评估指标概述
  • 什么是深度神经网络
  • AI自动化测试工具有哪些?
  • 优秀的流程图设计软件【留存】
  • stm32实战项目:无刷驱动
  • 深入浅出之STL源码分析7_模版实例化与全特化
  • 封装和分用(网络原理)
  • C# 方法(方法重载)
  • 查看YOLO版本的三种方法
  • 关于解决MySQL的常见问题
  • Linux基础开发工具一(yum/apt ,vim)
  • 滑动窗口——将x减到0的最小操作数
  • Python中的标识、相等性与别名:深入理解对象引用机制
  • Gartner 《2025大数据管理规划指南》学习心得
  • 【安装配置教程】ubuntu安装配置Kodbox