当前位置: 首页 > ds >正文

离散化思想

1.离散化场景

出现数据范围极大,但是数据量却不大的时候,如果我们要用数据值来映射数组下标,此时数据范围大不好直接映射,我们可以先将数据映射为一个较小的值,然后我们再用离散化后的数据处理问题。

eg:-1e9  <= x <= 1e9

此时不能直接根据x的值映射到数组中,因为x的值太大了,数组要开这么多空间是不允许的

离散化的过程:
1.升序排序数据

2.去重

升序排序并去重后我们就按照数据值的大小给原数据提供从1开始的映射值

图示:


2.模板题:

代码实现由两种:

方法一:升序排序+ 去重+二分查找

#include<iostream>
#include<algorithm>
using namespace std;
const int N = 1e5 + 10;
int n;
int cnt;//记录去重后的数据个数
int a[N];//初始数据数组
int disc[N];//离散化后数据
int find(int x)
{int l = 1;int r = cnt;int mid = 0;while (l < r){mid = (l + r) / 2;if (disc[mid] < x){l = mid + 1;}elser = mid;}return l;
}
int main()
{cin >> n;for (int i = 1; i <= n; i++){cin >> a[i];disc[++cnt] = a[i];}sort(disc + 1, disc + 1 + n);//升序排序cnt = unique(disc + 1, disc + 1 + n) - (disc + 1);//去重for (int i = 1; i <= n; i++){cout << a[i] << "的离散化值为" << find(a[i]) << endl;}return 0;
}

注意:

1.unique可以对指定迭代器区间进行去重,并返回去重后的迭代器区间末尾迭代器,所以我们用unique可以完成去重,用他的返回值减去disc+1(区间开始位置迭代器)得到去重后的数据个数

2.find函数作用:利用二分查找的算法将disc数组a[i]值对应的离散化索引找到并返回

方法二:排序+哈希表

#include<iostream>
#include<algorithm>
#include<unordered_map>
using namespace std;
const int N = 1e5 + 10;
int n;
int cnt;
int a[N];//初始数据数组
int disc[N];//离散化后数据
unordered_map<int, int> m;//原数据值,索引
int main()
{cin >> n;for (int i = 1; i <= n; i++){cin >> a[i];disc[++cnt] = a[i];}sort(disc + 1, disc + 1 + cnt);//升序排序int num = 0;for (int i = 1; i <= n; i++){if (m.count(disc[i])){continue;}num++;m[disc[i]] = num;}for (int i = 1; i <= n; i++){cout << a[i] << "的离散化值为" << m[a[i]] << endl;}return 0;
}

注意:

1.哈希表的key是数据值,value是离散化后的数据值

2.当数据值已经出现过在哈希表中,我们就直接跳过即可,不用重复录入

3.最后是要根据原数据值来查找的,所以我们用a[i]当key

http://www.xdnf.cn/news/12180.html

相关文章:

  • 链路聚合+VRRP
  • python入门(1)
  • 【.net core】【watercloud】树形组件combotree导入及调用
  • Visual Studio C++ 调试日志与异常定位指南
  • 时序替换实时?是否必要
  • 第16届蓝桥STEMA真题剖析-2025年4月13日Scratch初/中级组
  • OurBMC技术委员会2025年二季度例会顺利召开
  • Java创建多线程的四种方式
  • 使用osqp求解简单二次规划问题
  • 四元数:从理论基础到实际应用的深度探索
  • NNLM和word2vec的区别
  • 2025年文件加密软件推荐,最新款文档加密系统排名
  • (C++)STL:vector的认识与使用全解析
  • 70°视场+亚兆赫兹切换!硅光芯片上的「激光万花筒」登《Nature》封面
  • RDMA简介3之四种子协议对比
  • 基于AI的智能简历筛选系统开发实战
  • 时间复杂度与空间复杂度分析
  • 一站式直播工具:助力内容创作者高效开启直播新时代
  • 基于cnn的通用图像分类项目
  • django之请求处理过程分析
  • 应用层协议:HTTP
  • 网页前端开发(基础进阶3--Vue)
  • PostgreSQL(PostGIS)触发器+坐标转换案例
  • 网络爬虫一课一得
  • OD 算法题 B卷【DNA序列】
  • 解决:如何在Windows adb使用dmesg | grep检查内核日志
  • 关于udp——mqtt运行注意事项
  • CSP is what?
  • SVM超详细原理总结
  • C语言数组初始化方法大全(附带实例)