当前位置: 首页 > ds >正文

【C#】获取不重复的编码(递增,非GUID)

获取不重复的编码:从原始实现到高效优化

本文针对软件开发中“为新对象分配唯一编码”的常见需求,以C#通信设备管理场景为例,从原始代码分析入手,逐步讲解基于LINQ和哈希集合的优化方案,帮助开发者理解不同场景下的最佳实践。

一、需求背景:为什么需要“不重复编码”?

在业务开发中,“编码唯一性”是保障数据准确性的基础要求。以通信设备管理系统为例:

  • 系统维护一个通信模块集合ComList(存储ICommunication类型对象)
  • 每个新接入的通信模块(ec)需分配唯一Encode
  • Encode重复,会导致设备标识混乱,引发查询错误、指令发送失败等问题

因此,在将新模块添加到集合前,必须先找到一个“未被使用的编码”,这是确保系统稳定运行的关键步骤。

二、原始实现:逻辑可行但不够优雅

先看一段常见的原始代码,核心思路是“从0开始逐个检查,直到找到未使用的编码”:

// 原始代码:获取不重复编码
bool flag = false;
int encode = 0;
do
{flag = true; // 假设当前编码可用// 遍历集合检查编码是否已存在foreach (ICommunication tempEC in ComList){if (tempEC.Encode == encode){encode++; // 编码已使用,自增后重新检查flag = false;break; // 跳出foreach,进入下一轮do-while}}// 若编码可用,跳出循环if (flag == true){break;}
} while (true);// 为新模块赋值并添加到集合
key = key + encode;
ec.Key = key;
ec.Encode = encode;
ComList.Add(ec);

原始代码的问题

  1. 冗余标记变量:用flag控制循环退出,增加理解成本(实际可通过循环条件直接表达)
  2. 嵌套层次深do-while嵌套foreach,再嵌套if,代码结构复杂
  3. 重复遍历:每次检查都需手动遍历集合,未利用现有工具简化逻辑

三、第一次优化:用LINQ简化逻辑

C#的LINQ(Language Integrated Query) 提供了丰富的集合操作方法,其中Any()方法可直接判断“集合是否存在满足条件的元素”,能大幅简化代码。

1. 优化后代码

// 优化方案1:基于LINQ的简洁实现
int encode = 0;
// 循环条件:若集合中存在该编码,则继续自增检查
while (ComList.Any(ec => ec.Encode == encode))
{encode++;
}// 后续赋值与添加逻辑不变
key = key + encode;
ec.Key = key;
ec.Encode = encode;
ComList.Add(ec);

2. 核心逻辑解析:ComList.Any(ec => ec.Encode == encode)

这行代码是优化的核心,拆解理解:

  • ComList:待检查的通信模块集合(存储ICommunication对象)
  • Any()方法:LINQ扩展方法,作用是“判断集合是否至少存在一个满足条件的元素”
    • 返回值:bool(存在则true,不存在则false
    • 优势:短路求值——找到第一个满足条件的元素后,立即停止遍历,避免无效循环
  • ec => ec.Encode == encode:lambda表达式(匿名函数),定义判断规则
    • ec:集合中元素的临时变量(可理解为“each communication”,建议取有意义的名称)
    • ec.Encode:获取当前模块的编码属性
    • == encode:判断当前编码是否与待分配的encode重复

通俗解释:检查ComList中是否有任何一个模块的Encode等于当前encode值。若有(返回true),则encode自增继续检查;若无(返回false),则找到可用编码,循环结束。

3. 优化点总结

  • 去除flag变量,用while条件直接控制退出,逻辑更直观
  • 消除嵌套层次,代码从“嵌套结构”变为“线性结构”,可读性提升
  • 代码量减少60%+,同时保持功能完全一致

四、第二次优化:大数据量场景的性能提升

方案1在中小数据量(如ComList元素<1000)场景下足够高效,但当集合元素极多(如万级以上)或需频繁分配编码时,每次调用ComList.Any()都需遍历集合,性能会下降。

此时可通过哈希集合(HashSet) 优化——哈希集合的Contains方法时间复杂度为O(1),远快于普通集合的O(n)

1. 优化思路

  1. 预提取ComList中所有已使用的Encode,存入HashSet<int>
  2. 基于哈希集合的Contains方法检查编码是否重复,大幅减少查找时间

2. 优化后代码

// 优化方案2:大数据量场景下的高性能实现
// 步骤1:预提取已使用的编码到哈希集合
var existingEncodes = new HashSet<int>(ComList.Select(ec => ec.Encode));// 步骤2:检查可用编码
int encode = 0;
while (existingEncodes.Contains(encode))
{encode++;
}// 后续赋值与添加逻辑不变
key = key + encode;
ec.Key = key;
ec.Encode = encode;
ComList.Add(ec);

3. 关键代码解析

  • ComList.Select(ec => ec.Encode):LINQ的Select方法“投影”集合元素,将ICommunication对象转换为其Encode属性(得到IEnumerable<int>序列)
  • new HashSet<int>(...):通过序列初始化哈希集合,存储所有已使用的编码
  • existingEncodes.Contains(encode):哈希集合的快速查找方法,无论集合大小,均能瞬间判断编码是否存在

4. 适用场景

  • ComList元素数量多(如>1000)
  • 短时间内频繁添加新模块(需多次获取不重复编码)

注意:若数据量小,方案2的“哈希集合初始化开销”可能大于遍历节省的时间,反而得不偿失,此时方案1更优。

五、总结:不同场景的方案选择

场景推荐方案核心优势时间复杂度
中小数据量(<1000)LINQ Any()代码简洁、无额外开销O(n)
大数据量/频繁操作哈希集合查找速度极快O(1)
原始实现不推荐逻辑冗余、可读性差O(n²)

最终推荐代码(通用场景)

若不确定数据量,可优先使用方案1(LINQ实现),代码简洁且满足多数业务需求:

// 完整通用实现代码
using System;
using System.Collections.Generic;
using System.Linq; // 需引用LINQ命名空间// 假设的通信模块接口
public interface ICommunication
{int Encode { get; set; }string Key { get; set; }
}// 通信模块实现类
public class CommunicationModule : ICommunication
{public int Encode { get; set; }public string Key { get; set; }
}public class CommunicationManager
{// 通信模块集合private List<ICommunication> ComList = new List<ICommunication>();// 添加新通信模块(核心方法)public void AddNewModule(string keyPrefix){// 1. 获取不重复编码int encode = 0;while (ComList.Any(ec => ec.Encode == encode)){encode++;}// 2. 为新模块赋值ICommunication ec = new CommunicationModule();string key = keyPrefix + encode;ec.Key = key;ec.Encode = encode;// 3. 添加到集合ComList.Add(ec);Console.WriteLine($"新模块添加成功:Key={key},Encode={encode}");}
}

六、拓展思考

  1. 编码起始值:若需从非0值(如100)开始分配编码,只需将int encode = 0改为int encode = 100即可
  2. 编码步长:若需按固定步长(如2)分配编码,可将encode++改为encode += 2
  3. 并发安全:若多线程同时添加模块,需在编码检查和添加集合时加锁(如lock(ComList)),避免并发冲突

如果有其他特殊业务场景,欢迎在评论区交流讨论!


标签:#C# #LINQ #哈希集合 #性能优化 #软件开发最佳实践

http://www.xdnf.cn/news/19092.html

相关文章:

  • 怎么理解API?
  • R-Zero:通过自博弈机制让大语言模型无需外部数据实现自我进化训练
  • LeetCode-238除自身以外数组的乘积
  • 大脑的藏宝图——神经科学如何为自然语言处理(NLP)的深度语义理解绘制新航线
  • PowerShell下vim编辑文件时产生的额外文件
  • 网站防爆破安全策略分析
  • KingBase数据库迁移利器:KDTS工具 MySQL数据迁移到KingbaseES实战
  • 学习设计模式《二十四》——访问者模式
  • 【数字投影】创新展厅视觉体验,3D Mapping投影全面解读
  • LaTeX论文转word插入mathtype公式
  • C/C++ 数据结构 —— 线索二叉树
  • 【C++】map 容器的使用
  • django配置多个app使用同一个static静态文件目录
  • Android Glide最佳实践:高效图片加载完全指南
  • 滥用Mybatis一级缓存引发OOM问题
  • 网络安全监控中心
  • 阿里云——计算服务深度解析与选型
  • ChatGPT 上线 “学习模式”:全版本开放,重构 AI 教育逻辑
  • 基于单片机步进电机控制电机正反转加减速系统Proteus仿真(含全部资料)
  • 北斗导航|接收机自主完好性监测算法综述
  • java数据类型获取长度方式总结
  • SpringBoot集成 DeepSeek 对话补全功能
  • Spark学习记录
  • Unity 客户端和服务器端 基于网络的账户管理系统
  • 除自身以外数组的乘积是什么意思
  • 【OpenGL】LearnOpenGL学习笔记16 - 帧缓冲(FBO)、渲染缓冲(RBO)
  • 【JUC】——线程池
  • 点评项目(Redis中间件)第一部分Redis基础
  • docker run 后报错/bin/bash: /bin/bash: cannot execute binary file总结
  • 边缘计算:一场由物理定律发起的“计算革命”