当前位置: 首页 > ds >正文

【MongoDB学习笔记2】MongoDB的索引介绍

2 索引

索引支持在MongoDB中高效地执行查询。如果没有索引,MongoDB必须执行全集合扫描,及扫描集合中的每个文档,以选择与查询语句匹配的文档。这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以花费几十秒甚至几分钟,这对网站的性能是非常致命的。
如果查询存在适当的索引,MongoDB可以使用该索引限制必须检查的文档数。
索引是特殊的数据结构,它以易于遍历的形式存储集合数据集的一小部分。索引存储特定字段或一组字段的值,按字段值排序。索引项的排序支持有效的相等匹配和机遇范围的查询操作。此外,MongoDB还可以使用索引中的排序返回排序结果。

MongoDB索引使用B树数据结构(确切的说是B-Tree,MySQL是B+Tree)

2.1 索引的类型

2.1.1 单字段索引

MongoDB支持在文档的单个字段上创建用户定义的升序/降序索引,成为单字段索引(single field index)
对于单个字段索引和排序操作,索引键的排序顺序(即升序或降序)并不重要,因为MongoDB可以在任何方向上遍历索引。

在这里插入图片描述

2.1.2 复合索引

MongoDB还支持多个字段的用户定义索引,即复合索引(compound index)
复合索引中列出的字段具有重要意义。例如,如果复合索引有{userid:1,score:-1}组成,则索引首先按userid正序排序,然后在每个userid的值内,再按score倒序排列。

在这里插入图片描述

2.1.3 其他索引

  1. 哈希(Hashed)索引

哈希索引收集并存储索引字段值的哈希值。
哈希索引支持使用哈希分片键分片。基于哈希的分片使用字段的哈希索引作为分片键,在分片集群中对数据分区。
哈希索引非常适合具有像ObjectId值或时间戳这样单调变化字段的分片键。当您使用具有单调递增分片键值的范围分片时,上限为MaxKey的块将接收大多数传入写入。此行为将插入操作限制为单个分片,从而消除了分片集群中分布式写入的优势。

  1. 地理空间索引

地理空间索引支持对存储为GeoJSON对象或传统坐标对的数据进行查询。您可以使用地理空间索引来提高对地理空间数据的查询性能,或运行某些地理空间查询。
MongoDB提供两种类型的地理空间索引:

  • 2dsphere索引,支持解释球体上的几何形状的查询。
  • 2d索引,支持在平面上解释几何图形的查询。
  1. 文本索引

文本索引支持对包含字符串内容的字段进行文本搜索查询。文本索引可提高搜索字符串内容中特定单词或短语时的性能。
一个集合只能有一个文本索引,但该索引可以包含多个字段。

2.2 索引的管理操作

2.2.1 索引的查看

默认的索引

testdb> db.comment.getIndexes()
[ { v: 2, key: { _id: 1 }, name: '_id_' } ]#v: 2		代表版本号
# key: { _id: 1 }	根据_id升序的方式来创建的索引
# name: '_id_' 	索引名,通常是键加下划线的方式命名

2.2.2 索引的创建

语法:

db.collection.createIndex(keys, options)
参数类型描述
keysdocument包含字段和值对的文档,其中字段是索引键,值描述该字段的索引类型。对于字段上的升序索引,使用值1;对于降序索引,使用值-1.另外,MongoDB支持一种不同的索引类型,包括文本、地理空间和哈希索引。
optionsdocument可选,包含一组控制索引创建的选项的文档

部分选项

参数类型描述
backgroundBoolean建索引过程会阻塞其它数据库操作,background可指定以后台方式创建索引,即增加"background"可选参数。"background"默认值为false。
uniqueBoolean建立的索引是否唯一。指定为true创建唯一索引。默认值为false
namestring索引的名称。如果未指定,MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDupsBoolean3.0+版本已废弃。在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为false.
sparseBoolean对文档中不存在的字段数据不启用索引:这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档。默认值为false
expireAfterSecondsinteger指定一个以秒为单位的数值,完成TTL设定,设定集合的生存时间
vindex version索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weightsdocument索引权重值,数值在1到99,999之间,表示该索引相对于其他索引字段的得分权重。
default_languagestring对于文本索引,该参数决定了停用词及词干和词器的规则的列表。默认为英语
language_overridestring对于文本索引,该参数制定了包含在文档中的字段名,语言覆盖默认的language,默认值为language

单字段索引创建

test> db.comment.createIndex({userid:1})
userid_1
test> db.comment.getIndexes()
[{ v: 2, key: { _id: 1 }, name: '_id_' },{ v: 2, key: { userid: 1 }, name: 'userid_1' }
]

复合索引创建

test> db.comment.createIndex({userid:1,nickname:-1})
userid_1_nickname_-1
test> db.comment.getIndexes()
[{ v: 2, key: { _id: 1 }, name: '_id_' },{ v: 2, key: { userid: 1 }, name: 'userid_1' },{v: 2,key: { userid: 1, nickname: -1 },name: 'userid_1_nickname_-1'}
]

2.2.3 索引的移除

移除指定索引

test> db.comment.dropIndex({userid:1})
{ nIndexesWas: 3, ok: 1 }
test>  db.comment.getIndexes()
[{ v: 2, key: { _id: 1 }, name: '_id_' },{v: 2,key: { userid: 1, nickname: -1 },name: 'userid_1_nickname_-1'}
]

移除所有的索引

test>  db.comment.dropIndexes()
{nIndexesWas: 2,msg: 'non-_id indexes dropped for collection',ok: 1
}
test>  db.comment.getIndexes()
[ { v: 2, key: { _id: 1 }, name: '_id_' } ]

2.3 索引的使用

2.3.1 执行计划

分析查询性能通常使用执行计划(解释计划、explain plan)来查看查询的情况,如查询耗费的时间、是否基于索引查询等。
那么,通常我们想知道建立索引是否有效,效果如何,都需要执行计划查看。
语法:

db.collection.find(query,options).explain(options)

在没有使用索引的情况下,数据库在查询的时候是进行全局扫描

testdb> db.comment.find({userid:"1010"}).explain()
{explainVersion: '1',queryPlanner: {namespace: 'testdb.comment',indexFilterSet: false,parsedQuery: { userid: { '$eq': '1010' } },queryHash: 'D1EE2B07',planCacheKey: 'D1EE2B07',maxIndexedOrSolutionsReached: false,maxIndexedAndSolutionsReached: false,maxScansToExplodeReached: false,winningPlan: {stage: 'COLLSCAN',			# 集合扫描,也就是全局扫描,没有使用索引filter: { userid: { '$eq': '1010' } },direction: 'forward'},rejectedPlans: []},command: { find: 'comment', filter: { userid: '1010' }, '$db': 'testdb' },serverInfo: {host: 'Rock9',port: 27017,version: '7.0.11',gitVersion: 'f451220f0df2b9dfe073f1521837f8ec5c208a8c'},serverParameters: {internalQueryFacetBufferSizeBytes: 104857600,internalQueryFacetMaxOutputDocSizeBytes: 104857600,internalLookupStageIntermediateDocumentMaxSizeBytes: 104857600,internalDocumentSourceGroupMaxMemoryBytes: 104857600,internalQueryMaxBlockingSortMemoryUsageBytes: 104857600,internalQueryProhibitBlockingMergeOnMongoS: 0,internalQueryMaxAddToSetBytes: 104857600,internalDocumentSourceSetWindowFieldsMaxMemoryBytes: 104857600,internalQueryFrameworkControl: 'trySbeRestricted'},ok: 1
}

创建一个userid的索引后,可以看到变化

testdb> db.comment.createIndex({userid:1})
userid_1
testdb> db.comment.find({userid:"1010"}).explain()
{explainVersion: '1',queryPlanner: {namespace: 'testdb.comment',indexFilterSet: false,parsedQuery: { userid: { '$eq': '1010' } },queryHash: 'D1EE2B07',planCacheKey: '551E0CE9',maxIndexedOrSolutionsReached: false,maxIndexedAndSolutionsReached: false,maxScansToExplodeReached: false,winningPlan: {stage: 'FETCH',			# 变成了抓取,而不是全局扫描inputStage: {stage: 'IXSCAN',			# 先通过IXSCAN去查询索引userid_1keyPattern: { userid: 1 },indexName: 'userid_1',			isMultiKey: false,multiKeyPaths: { userid: [] },isUnique: false,isSparse: false,isPartial: false,indexVersion: 2,direction: 'forward',indexBounds: { userid: [ '["1010", "1010"]' ] }}},rejectedPlans: []},command: { find: 'comment', filter: { userid: '1010' }, '$db': 'testdb' },serverInfo: {host: 'Rock9',port: 27017,version: '7.0.11',gitVersion: 'f451220f0df2b9dfe073f1521837f8ec5c208a8c'},serverParameters: {internalQueryFacetBufferSizeBytes: 104857600,internalQueryFacetMaxOutputDocSizeBytes: 104857600,internalLookupStageIntermediateDocumentMaxSizeBytes: 104857600,internalDocumentSourceGroupMaxMemoryBytes: 104857600,internalQueryMaxBlockingSortMemoryUsageBytes: 104857600,internalQueryProhibitBlockingMergeOnMongoS: 0,internalQueryMaxAddToSetBytes: 104857600,internalDocumentSourceSetWindowFieldsMaxMemoryBytes: 104857600,internalQueryFrameworkControl: 'trySbeRestricted'},ok: 1
}

2.3.2 覆盖的查询

Covered Queries

当查询条件和查询的投影仅包含索引字段时,MongoDB直接从索引返回结果,而不扫描任何稳当或将文档带入内存。这些覆盖的查询可以非常有效。

在这里插入图片描述

testdb> db.comment.find({userid:"1010"},{userid:1,_id:0}).explain()
{explainVersion: '1',queryPlanner: {namespace: 'testdb.comment',indexFilterSet: false,parsedQuery: { userid: { '$eq': '1010' } },queryHash: '04379864',planCacheKey: 'E51A9E39',maxIndexedOrSolutionsReached: false,maxIndexedAndSolutionsReached: false,maxScansToExplodeReached: false,winningPlan: {stage: 'PROJECTION_COVERED',			# 方法变成coveredtransformBy: { userid: 1, _id: 0 },inputStage: {stage: 'IXSCAN',keyPattern: { userid: 1 },indexName: 'userid_1',isMultiKey: false,multiKeyPaths: { userid: [] },isUnique: false,isSparse: false,isPartial: false,indexVersion: 2,direction: 'forward',indexBounds: { userid: [ '["1010", "1010"]' ] }}},rejectedPlans: []},command: {find: 'comment',filter: { userid: '1010' },projection: { userid: 1, _id: 0 },'$db': 'testdb'},serverInfo: {host: 'Rock9',port: 27017,version: '7.0.11',gitVersion: 'f451220f0df2b9dfe073f1521837f8ec5c208a8c'},serverParameters: {internalQueryFacetBufferSizeBytes: 104857600,internalQueryFacetMaxOutputDocSizeBytes: 104857600,internalLookupStageIntermediateDocumentMaxSizeBytes: 104857600,internalDocumentSourceGroupMaxMemoryBytes: 104857600,internalQueryMaxBlockingSortMemoryUsageBytes: 104857600,internalQueryProhibitBlockingMergeOnMongoS: 0,internalQueryMaxAddToSetBytes: 104857600,internalDocumentSourceSetWindowFieldsMaxMemoryBytes: 104857600,internalQueryFrameworkControl: 'trySbeRestricted'},ok: 1
}
http://www.xdnf.cn/news/17436.html

相关文章:

  • 宁商平台税务新政再升级:精准施策,共筑金融投资新生态
  • 塑料可回收物检测数据集-10,000 张图片 智能垃圾分类系统 环保回收自动化 智慧城市环卫管理 企业环保合规检测 教育环保宣传 供应链包装优化
  • UE5太空射击游戏入门(一):项目创建与飞船控制
  • 5.0.9 C# wpf通过WindowsFormsHost嵌入winform控件
  • 网络基础浅谈
  • 僵尸进程、孤儿进程、进程优先级、/proc 文件系统、CRC 与网络溢出问题处理(实战 + 原理)
  • Docker搭建Jenkins实现自动部署:快速高效的持续集成之道!
  • 进程管理、系统高负载、cpu超过800%等实战问题处理
  • Android 中解决 Button 按钮背景色设置无效的问题
  • Numpy科学计算与数据分析:Numpy广播机制入门与实践
  • conda pip uv与pixi
  • react的form.resetFields()
  • 论文阅读:User Behavior Simulation with Large Language Model-based Agents
  • 五十五、【Linux系统nginx服务】nginx安装、用户认证、https实现
  • MySQL 配置性能优化赛:核心策略与实战技巧
  • HTML5 Web Workers 深度剖析:助力网页性能飞速提升
  • dmctlcvt工具介绍数据文件路径变化后如何拉起数据库
  • 边缘算力×AI应用:如何在2025年实现爆发式增长
  • HTML已死,HTML万岁——重新思考DOM的底层设计理念
  • 用LaTeX优化FPGA开发:结合符号计算与Vivado工具链
  • 《C语言》函数练习题--1
  • 通过CNN、LSTM、CNN-LSTM及SSA-CNN-LSTM模型对数据进行预测,并进行全面的性能对比与可视化分析
  • 前端开发工具大全
  • day069-Jenkins基础使用与参数化构建
  • 【论文阅读】基于元模型的体系知识图谱构建
  • DataEase官方出品丨SQLBot:基于大模型和RAG的智能问数系统
  • C++高频知识点(十五)
  • 浅谈欧拉函数与素数筛法思想
  • Flink的运行模式
  • [网格图DP]3363. 最多可收集的水果数目