当前位置: 首页 > ops >正文

C++23 新增扁平化关联容器详解

文章目录

    • 一、引言
      • 已有关联容器回顾
      • 新容器的引入原因
    • 二、`std::flat_set`
      • 定义与特性
      • 代码示例
      • 适用场景
    • 三、`std::flat_multiset`
      • 定义与特性
      • 代码示例
      • 适用场景
    • 四、`std::flat_map`
      • 定义与特性
      • 代码示例
      • 适用场景
    • 五、`std::flat_multimap`
      • 定义与特性
      • 代码示例
      • 适用场景
    • 六、与其他容器的比较
      • 与 `std::set` 和 `std::multiset` 的比较
      • 与 `std::map` 和 `std::multimap` 的比较
    • 七、总结

一、引言

在 C++23 标准中,引入了四个新的关联容器:std::flat_setstd::flat_multisetstd::flat_mapstd::flat_multimap。这些容器是对底层有序随机访问容器进行包装的容器适配器,旨在为开发者提供在某些场景下比传统关联容器更高效的选择。在介绍这四个新容器之前,我们先回顾一下 C++ 中已有的关联容器。

已有关联容器回顾

  • C++98:引入了 std::mapstd::setstd::multimapstd::multiset,这些容器基于红黑树实现,元素按键有序存储,插入、删除和查找操作的时间复杂度为 O ( l o g n ) O(log n) O(logn)
  • C++11:引入了 std::unordered_mapstd::unordered_setstd::unordered_multimapstd::unordered_multiset,这些容器基于哈希表实现,元素无序存储,平均情况下插入、删除和查找操作的时间复杂度为 O ( 1 ) O(1) O(1)

新容器的引入原因

新容器的引入主要是为了在内存消耗和性能方面提供不同的选择。与传统的关联容器相比,平铺容器在某些场景下具有更好的缓存局部性,从而提高性能。

二、std::flat_set

定义与特性

std::flat_set 是一个类似于 std::set 的容器,但它使用扁平化存储的唯一键集合。它的底层实现使用排序的连续存储(通常是 std::vector 或类似结构),而不是树结构。这使得元素在内存中是连续存储的,具有以下特点:

  • 查找速度快:查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)。由于内存连续,缓存命中率高,总体查找速度比 std::set 快。
  • 插入和删除较慢:插入和删除操作通常需要对数组中的元素进行整体移动,尤其在不支持移动构造时,时间复杂度为 O ( n ) O(n) O(n)
  • 迭代速度快:由于内存局部性,迭代速度比 std::set 快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。

代码示例

#include <flat_set>
#include <iostream>int main() {std::flat_set<int> primes{2, 3, 5, 7, 11};// 插入元素primes.insert(13);// 检查存在性if (primes.contains(7)) {std::cout << "7 is a prime number" << std::endl;}// 范围查询auto [begin, end] = primes.equal_range(5);for (auto it = begin; it != end; ++it) {std::cout << *it << " ";}std::cout << std::endl;return 0;
}

适用场景

  • 需要频繁查找但较少插入/删除:由于查找速度快,插入和删除操作相对较慢,适合用于需要频繁查找元素的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

三、std::flat_multiset

定义与特性

std::flat_multiset 类似于 std::flat_set,但允许存储多个具有相同键的元素。它同样使用排序的连续存储,具有与 std::flat_set 类似的性能特点:

  • 查找速度快:查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)
  • 插入和删除较慢:插入和删除操作通常需要对数组中的元素进行整体移动,时间复杂度为 O ( n ) O(n) O(n)
  • 迭代速度快:由于内存局部性,迭代速度快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。

代码示例

#include <flat_set>
#include <iostream>int main() {std::flat_multiset<int> numbers{1, 2, 2, 3, 3, 3};// 插入元素numbers.insert(4);// 查找元素auto range = numbers.equal_range(2);for (auto it = range.first; it != range.second; ++it) {std::cout << *it << " ";}std::cout << std::endl;return 0;
}

适用场景

  • 需要存储重复元素且需要快速查找:与 std::flat_set 类似,但允许存储重复元素,适合需要存储重复元素且需要快速查找的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

四、std::flat_map

定义与特性

std::flat_map 是一个类似于 std::map 的容器,但它使用扁平化存储的键值对容器。它的底层实现使用两个有序数组,一个存储键,另一个存储值,具有以下特点:

  • 查找速度快:查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)。由于内存连续,缓存命中率高,总体查找速度比 std::map 快。
  • 插入和删除较慢:插入和删除操作通常需要对数组中的元素进行整体移动,尤其在不支持移动构造时,时间复杂度为 O ( n ) O(n) O(n)
  • 迭代速度快:由于内存局部性,迭代速度比 std::map 快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。
  • 使用随机访问迭代器:与 std::map 使用双向迭代器不同,std::flat_map 使用随机访问迭代器。
  • 迭代器不稳定:插入和删除元素时迭代器会失效。
  • 无法存储不可复制和不可移动的值类型:由于需要对元素进行移动和复制,无法存储不可复制和不可移动的值类型。
  • 异常安全性弱:在删除和插入时移动值可能会抛出异常。

代码示例

#include <flat_map>
#include <iostream>
#include <string>int main() {std::flat_map<std::string, int> ages{{"Alice", 30},{"Bob", 25},{"Charlie", 35}};// 插入元素(可能触发排序和移动)ages.insert({"David", 28});// 查找元素if (auto it = ages.find("Alice"); it != ages.end()) {std::cout << "Alice is " << it->second << " years old" << std::endl;}// 迭代for (const auto& [name, age] : ages) {std::cout << name << ": " << age << std::endl;}return 0;
}

适用场景

  • 需要频繁查找但较少插入/删除:由于查找速度快,插入和删除操作相对较慢,适合用于需要频繁查找元素的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

五、std::flat_multimap

定义与特性

std::flat_multimap 类似于 std::flat_map,但允许存储多个具有相同键的键值对。它同样使用排序的连续存储,具有与 std::flat_map 类似的性能特点:

  • 查找速度快:查找操作使用二分查找,时间复杂度为 O ( l o g n ) O(log n) O(logn)
  • 插入和删除较慢:插入和删除操作通常需要对数组中的元素进行整体移动,时间复杂度为 O ( n ) O(n) O(n)
  • 迭代速度快:由于内存局部性,迭代速度快。
  • 内存占用小:相对于平衡二叉树,减少了节点指针的维护,从而节省了内存空间。

代码示例

#include <flat_map>
#include <iostream>
#include <string>int main() {std::flat_multimap<std::string, int> scores{{"Alice", 80},{"Bob", 90},{"Alice", 85}};// 插入元素scores.insert({"Charlie", 75});// 查找元素auto range = scores.equal_range("Alice");for (auto it = range.first; it != range.second; ++it) {std::cout << it->first << ": " << it->second << std::endl;}return 0;
}

适用场景

  • 需要存储重复键的键值对且需要快速查找:与 std::flat_map 类似,但允许存储重复键的键值对,适合需要存储重复键的键值对且需要快速查找的场景。
  • 需要快速迭代:内存连续的特性使得迭代速度快,适合需要快速遍历元素的场景。
  • 内存受限环境:内存占用小的特点使得它在内存受限的环境中更具优势。

六、与其他容器的比较

std::setstd::multiset 的比较

特性std::set/std::multisetstd::flat_set/std::flat_multiset
底层实现红黑树排序的连续存储(通常是 std::vector
查找速度 O ( l o g n ) O(log n) O(logn) O ( l o g n ) O(log n) O(logn),但缓存友好,总体速度更快
插入和删除速度 O ( l o g n ) O(log n) O(logn) O ( n ) O(n) O(n)
迭代速度较慢较快
内存占用较大较小
迭代器稳定性稳定不稳定

std::mapstd::multimap 的比较

特性std::map/std::multimapstd::flat_map/std::flat_multimap
底层实现红黑树排序的连续存储(通常是 std::vector
查找速度 O ( l o g n ) O(log n) O(logn) O ( l o g n ) O(log n) O(logn),但缓存友好,总体速度更快
插入和删除速度 O ( l o g n ) O(log n) O(logn) O ( n ) O(n) O(n)
迭代速度较慢较快
内存占用较大较小
迭代器稳定性稳定不稳定
迭代器类型双向迭代器随机访问迭代器

七、总结

C++23 引入的 std::flat_setstd::flat_multisetstd::flat_mapstd::flat_multimap 为开发者提供了在某些场景下比传统关联容器更高效的选择。这些容器在查找和迭代操作上具有更好的性能,同时内存占用更小。然而,它们的插入和删除操作相对较慢,迭代器也不稳定。因此,在选择使用这些容器时,需要根据具体的应用场景进行权衡。如果需要频繁进行查找和迭代操作,且插入和删除操作较少,那么这些平铺容器是一个不错的选择。

http://www.xdnf.cn/news/7498.html

相关文章:

  • 微小店推客系统开发:构建全民营销矩阵,解锁流量增长密码
  • Java EE进阶1:导读
  • Spring Cloud Gateway深度解析:原理、架构与生产实践
  • 根据当前日期计算并选取上一个月和上一个季度的日期范围,用于日期控件的快捷选取功能
  • MySQL 8.0 OCP 英文题库解析(七)
  • 在 Git 中添加子模块(submodule)的详细步骤
  • kotlin 将一个list按条件分为两个list(partition )
  • 漏洞检测与渗透检验在功能及范围上究竟有何显著差异?
  • iOS Runtime与RunLoop的对比和使用
  • 基于flask+vue的电影可视化与智能推荐系统
  • PostgreSQL架构
  • HTML应用指南:利用POST请求获取全国申通快递服务网点位置信息
  • 华为云鲲鹏型kC2云服务器——鲲鹏920芯片性能测评
  • 【EI会议火热征稿中】第二届云计算与大数据国际学术会议(ICCBD 2025)
  • 程序运行报错分析文档
  • 使用 adb 命令截取 Android 设备的屏幕截图
  • CentOS 7连接公司网络配置指南
  • BERT 作为Transformer的Encoder 为什么采用可学习的位置编码
  • 打破次元壁,VR 气象站开启气象学习新姿势​
  • 使用SQLite Studio导出/导入SQL修复损坏的数据库
  • 面试突击:消息中间件之RabbitMQ
  • 流复备机断档处理
  • 开疆智能Profinet转RS485网关连接温度送变器配置案例
  • Pytorch分布式训练,数据并行,单机多卡,多机多卡
  • SOC-ESP32S3部分:2-2-VSCode进行编译烧录
  • laravel中如何使用Validator::make定义一个变量是 ,必传的,json格式字符串
  • 大数据Spark(五十九):Standalone集群部署
  • 小白编程学习之巧解「消失的数字」
  • 利用朴素贝叶斯对UCI 的 mushroom 数据集进行分类
  • Ansible模块——通过 URL 下载文件