[C++刷怪笼]:搜索二叉树--便利的查找工具
1.搜索二叉树的概念即性能分析
1.1二叉搜索树的概念
二叉搜索树又称为二叉排列树,它或者是一颗空树,或者是具有一下性质的二叉树:
- 若它的左⼦树不为空,则左⼦树上所有结点的值都⼩于等于根结点的值
- 若它的右⼦树不为空,则右⼦树上所有结点的值都⼤于等于根结点的值
- 它的左右⼦树也分别为⼆叉搜索树⼆叉搜索树中可以⽀持插⼊相等的值,也可以不⽀持插⼊相等的值,具体看使⽤场景定义,后续我们学习map/set/multimap/multiset系列容器底层就是⼆叉搜索树,其中map/set不⽀持插⼊相等值,multimap/multiset⽀持插⼊相等值比较绝对的情况:
1.2二叉搜索树的性能分析
最优情况下,⼆叉搜索树为完全⼆叉树(或者接近完全⼆叉树),其⾼度为: log2 N(常规情况)
最差情况下,⼆叉搜索树退化为单⽀树(或者类似单⽀),其⾼度为: N(特殊情况)
所以综合⽽⾔⼆叉搜索树增删查改时间复杂度为: O(N)
那么这样的效率显然是⽆法满⾜我们需求的,我们后续课程需要继续讲解⼆叉搜索树的变形,平衡⼆ 叉搜索树AVL树和红⿊树,才能适⽤于我们在内存中存储和搜索数据。
另外需要说明的是,⼆分查找也可以实现 O(log2 N) 级别的查找效率,但是⼆分查找有两⼤缺陷:
1.需要存储在⽀持下标随机访问的结构中,并且有序。
2.插⼊和删除数据效率很低,因为存储在下标随机访问的结构中,插⼊和删除数据⼀般需要挪动数
据。 这⾥也就体现出了平衡⼆叉搜索树的价值。
2.搜索二叉树的基本操作
2.1二叉搜索树的插入(insert)
插⼊的具体过程如下:
1. 树为空,则直接新增结点,赋值给root指针
2. 树不空,按⼆叉搜索树性质,插⼊值⽐当前结点⼤往右⾛,插⼊值⽐当前结点⼩往左⾛,找到空位置,插⼊新结点。
3. 如果⽀持插⼊相等的值,插⼊值跟当前结点相等的值可以往右⾛,也可以往左⾛,找到空位置,插⼊新结点。(要注意的是要保持逻辑⼀致性,插⼊相等的值不要⼀会往右⾛,⼀会往左⾛)
代码具体如下:
//插入节点bool insert(const K& val){//空树if(_root == nullptr){_root = new Node(val);return true;}//非空树Node* parent = nullptr;Node* cur = _root;while(cur){//值大--插入右子树if(cur -> _key < val){parent = cur;cur = cur -> _right;}//值小--插入左子树else if(cur -> _key > val){parent = cur;cur = cur -> _left;}//?elsereturn false;}//到达最终插入节点的位置cur = new Node(val);if(parent -> _key < val)parent -> _right = cur; elseparent -> _left = cur;return true;}
2.2二叉搜索树的查找(find)
1. 从根开始⽐较,查找x,x⽐根的值⼤则往右边⾛查找,x⽐根值⼩则往左边⾛查找。
2. 最多查找⾼度次,⾛到到空,还没找到,这个值不存在。
3. 如果不⽀持插⼊相等的值,找到x即可返回
4. 如果⽀持插⼊相等的值,意味着有多个x存在,⼀般要求查找中序的第⼀个x。如下图,查找3,要找到1的右孩⼦的那个3返回
查找的具体代码如下:
//查找节点bool find(const K& key){if(_root == nullptr)return false;Node* cur = _root;while(cur){if(cur -> _key < key)cur = cur -> _right;else if(cur -> _key > key)cur = cur -> _left;else return true;}return false;}
查找相较于插入比较简单。
2.3二叉搜索树的删除(*重难点*)
二叉搜索树的删除由于涉及到节点指针的指向改变,就出现了不同情况的具体分析如下:
⾸先查找元素是否在⼆叉搜索树中,如果不存在,则返回false。
如果查找元素存在则分以下四种情况分别处理:(假设要删除的结点为N)
1. 要删除结点N左右孩⼦均为空
2. 要删除的结点N左孩⼦位空,右孩⼦结点不为空
3. 要删除的结点N右孩⼦位空,左孩⼦结点不为空
4. 要删除的结点N左右孩⼦结点均不为空
对应以上四种情况的解决⽅案:
1. 把N结点的⽗亲对应孩⼦指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样的)
2. 把N结点的⽗亲对应孩⼦指针指向N的右孩⼦,直接删除N结点
3. 把N结点的⽗亲对应孩⼦指针指向N的左孩⼦,直接删除N结点
4. ⽆法直接删除N结点,因为N的两个孩⼦⽆处安放,只能⽤替换法删除。找N左⼦树的值最⼤结点 R(最右结点)或者N右⼦树的值最⼩结点R(最左结点)替代N,因为这两个结点中任意⼀个,放到N的位置,都满⾜⼆叉搜索树的规则。替代N的意思就是N和R的两个结点的值交换,转⽽变成删除R结点,R结点符合情况2或情况3,可以直接删除
具体实现代码如下:(代码一遍看懂是有难度的,大家多跟着分析几遍,道理就学会了)
//***删除节点***bool erase(const K& key){ Node* parent = nullptr;Node* cur = _root;while(cur){if(cur -> _key < key) {parent = cur;cur = cur -> _right;}else if(cur -> _key > key){parent = cur;cur = cur -> _left;}//找到对应key值//需分情况讨论else{//0-1个孩子的情况//删除情况123都符合,改变父亲指向孩子的节点指针即可//1.把N结点的⽗亲对应孩⼦指针指向空,直接删除N结点(情况1可以当成2或者3处理, //效果是⼀样的)//2. 把N结点的⽗亲对应孩⼦指针指向N的右孩⼦,直接删除N结点//3. 把N结点的⽗亲对应孩⼦指针指向N的左孩⼦,直接删除N结点if(cur -> _left == nullptr){if(parent == nullptr){_root = cur -> _right;}else{if(parent->_left == cur)parent -> _left = cur -> _right;elseparent -> _right = cur -> _right;}delete cur;return true;}else if(cur -> _right == nullptr){if(parent == nullptr)_root = cur -> _left;else {if (parent->_left == cur)parent->_left = cur->_left;elseparent->_right = cur->_left;}delete cur;return true;}//两个孩子的情况else{// 2个孩⼦的情况// 删除情况4,替换法删除// 假设这⾥我们取右⼦树的最⼩结点作为替代结点去删除// 这⾥尤其要注意右⼦树的根就是最⼩情况的情况的处理,对应课件图中删除8的//情况// ⼀定要把cur给rightMinP,否会报错。Node* rightMinP = cur;Node* rightMin = cur->_right;while (rightMin->_left){rightMinP = rightMin;rightMin = rightMin->_left;}cur->_key = rightMin->_key;if (rightMinP->_left == rightMin)rightMinP->_left = rightMin->_right;elserightMinP->_right = rightMin->_right;delete rightMin;return true;}}}return false;}
2.4二叉搜索树具体代码的实现
下面是二叉搜索树模拟实现的代码,大家可以借鉴一下。
#include<iostream>using namespace std;template<class K>
struct BSTNode
{
private:BSTNode<K>* _left;BSTNode<K>* _right;T _key;public://构造函数BSTNode(const K& key): _key(key), _left(nullptr), _right(nullptr){}
};template<typename K>
//Binary search tree
class BSTree
{typedef BSTNode<k> Node;
public://插入节点bool insert(const K& val){//空树if(_root == nullptr){_root = new Node(val);return true;}//非空树Node* parent = nullptr;Node* cur = _root;while(cur){//值大--插入右子树if(cur -> _key < val){parent = cur;cur = cur -> _right;}//值小--插入左子树else if(cur -> _key > val){parent = cur;cur = cur -> _left;}//?elsereturn false;}//到达最终插入节点的位置cur = new Node(val);if(parent -> _key < val)parent -> _right = cur; elseparent -> _left = cur;return true;}//查找节点bool find(const K& key){if(_root == nullptr)return false;Node* cur = _root;while(cur){if(cur -> _key < key)cur = cur -> _right;else if(cur -> _key > key)cur = cur -> _left;else return true;}return false;}//***删除节点***bool erase(const K& key){ Node* parent = nullptr;Node* cur = _root;while(cur){if(cur -> _key < key) {parent = cur;cur = cur -> _right;}else if(cur -> _key > key){parent = cur;cur = cur -> _left;}//找到对应key值//需分情况讨论else{//0-1个孩子的情况//删除情况123都符合,改变父亲指向孩子的节点指针即可//1.把N结点的⽗亲对应孩⼦指针指向空,直接删除N结点(情况1可以当成2或者3处理,效果是⼀样的)//2. 把N结点的⽗亲对应孩⼦指针指向N的右孩⼦,直接删除N结点//3. 把N结点的⽗亲对应孩⼦指针指向N的左孩⼦,直接删除N结点if(cur -> _left == nullptr){if(parent == nullptr){_root = cur -> _right;}else{if(parent->_left == cur)parent -> _left = cur -> _right;elseparent -> _right = cur -> _right;}delete cur;return true;}else if(cur -> _right == nullptr){if(parent == nullptr)_root = cur -> _left;else {if (parent->_left == cur)parent->_left = cur->_left;elseparent->_right = cur->_left;}delete cur;return true;}//两个孩子的情况else{// 2个孩⼦的情况// 删除情况4,替换法删除// 假设这⾥我们取右⼦树的最⼩结点作为替代结点去删除// 这⾥尤其要注意右⼦树的根就是最⼩情况的情况的处理,对应课件图中删除8的情 况// ⼀定要把cur给rightMinP,否会报错。Node* rightMinP = cur;Node* rightMin = cur->_right;while (rightMin->_left){rightMinP = rightMin;rightMin = rightMin->_left;}cur->_key = rightMin->_key;if (rightMinP->_left == rightMin)rightMinP->_left = rightMin->_right;elserightMinP->_right = rightMin->_right;delete rightMin;return true;}}}return false;}void inorder(){_inorder(_root);cout << endl;}private:Node* _root = nullptr;
private:void _inorder(Node* root){if(_root == nullptr) return;_inorder(root -> _left);cout << root -> key << " ";_inorder(root -> _right);}
};
3.二叉搜索树的使用实例--key/value使用场景
3.1key的搜索场景
只有key作为关键码,结构中只需要存储key即可,关键码即为需要搜索到的值,搜索场景只需要判断key在不在。key的搜索场景实现的⼆叉树搜索树⽀持增删查,但是不⽀持修改,修改key破坏搜索树结构了。
场景1:⼩区⽆⼈值守⻋库,⼩区⻋库买了⻋位的业主⻋才能进⼩区,那么物业会把买了⻋位的业主的⻋牌号录⼊后台系统,⻋辆进⼊时扫描⻋牌在不在系统中,在则抬杆,不在则提⽰⾮本⼩区⻋辆,⽆法进⼊。
场景2:检查⼀篇英⽂ 章单词拼写是否正确,将词库中所有单词放⼊⼆叉搜索树,读取⽂章中的单
词,查找是否在⼆叉搜索树中,不在则波浪线标红提示。
3.2key/value的搜索场景
每⼀个关键码key,都有与之对应的值value,value可以任意类型对象。树的结构中(结点)除了需要存储key还要存储对应的value,增/删/查还是以key为关键字⾛⼆叉搜索树的规则进⾏⽐较,可以快速查找到key对应的value。key/value的搜索场景实现的⼆叉树搜索树⽀持修改,但是不⽀持修改key,修改key破坏搜索树性质了,可以修改value。
场景1:简单中英互译字典,树的结构中(结点)存储key(英⽂)和vlaue(中⽂),搜索时输⼊英⽂,则同时查找到了英⽂对应的中⽂。
场景2:商场⽆⼈值守⻋库,⼊⼝进场时扫描⻋牌,记录⻋牌和⼊场时间,出⼝离场时,扫描车牌,查找⼊场时间,⽤当前时间-⼊场时间计算出停⻋时⻓,计算出停⻋费⽤,缴费后抬杆,⻋辆离场。
场景3:统计⼀篇⽂章中单词出现的次数,读取⼀个单词,查找单词是否存在,不存在这个说明第⼀次出现,(单词,1),单词存在,则++单词对应的次数。
3.3key/value二叉搜索树的代码实现
key/value二叉搜索树在普通二叉搜索树的基础上新增了一个value变量,其基本原理是大相径庭的。插入,查找和删除的手段也一样。
下面的代码实现:
#include<iostream>using namespace std;//二叉搜索树实例 -- kv
template<class K, class V>
struct BSTNode
{
private:K _key;V _value;BSTNode<K, V>* _left;BSTNode<K, V>* _right;public:BSTNode(const K& key, const V& value): _key(key), _value(value), _left(nullptr), _right(nullptr)
};template<class K, class V>
class BSTree
{typedef BSTNode<K, V> Node;
public://由于可能创建空树--则需要显式的写默认构造BSTree() = default;BSTree(const BSTree<K, V>* kv){_root.copy(kv._root)}BSTree<K, V>& operator=(const BSTree<K, V>* kv){swap(_root, kv._root);return *this}~BSTree(){Destory(_root);_root = nullptr}bool insert(const K& k, const V& v){if(_root == nullptr){_root._key = k;_root._value = v;}Node* parent = nullptr;Node* cur = _root;while(cur){if(cur -> _key < k){parent = cur;cur = cur -> _right;}else if(cur -> _key > k){parent = cur;cur = cur -> _left;}elsereturn false;}//找到位置cur = new Node(k, v);if(parent -> _key < k) parent -> _right = cur;else parent -> _left = cur;return true;}Node* find(const K& key){Node* cur = _root;while(cur){if(cur -> _key < key) cur = cur -> _right;else if(cur -> _key > key) cur = cur -> _left;else return cur;}return nullptr;}bool erase(const K& key){Node* parent = nullptr;Node* cur = _root;while(cur){if(cur -> _key < key) cur = cur -> _right;else if(cur -> _key > key) cur = cur -> _left;else{if(cur -> _left == nullptr){if(parent == nullptr) _root = cur -> _right;else{if(parent -> _left == cur) parent -> _left = cur -> _right;else parent -> _right = cur -> _right;}delete cur;cur = nullptr;}else if(cur -> _right == nullptr){if(parent == nullptr) _root -> _left = cur -> _left;else{if(parent -> _left == cur) parent -> left = cur -> _right;else parent -> _right = cur -> _right;}delete cur;cur = nullptr;}//左右子树都有节点的情况(没有搞清楚)else{Node* rightMinP = cur;Node* rightMin = cur->_right;while (rightMin->_left){rightMinP = rightMin;rightMin = rightMin->_left;}cur->_key = rightMin->_key;if (rightMinP->_left == rightMin)rightMinP->_left = rightMin->_right;elserightMinP->_right = rightMin->_right;delete rightMin;return true;}}}return false;}void inorder(){_inorder(_root);cout << endl;}
private:void _inorder(Node* root){if(root == nullptr) return;_inorder(root -> _left);cout << " " ;_inorder(root -> _right);}void destory(Node* root){if(root == nullptr) return;destory(root -> _left);destory(root -> _right);delete root;}Node* copy(Node* root){if(root == nullptr) return nullptr;Node* newRoot = new Node(root -> key, root -> value);newRoot -> _left = copy(root -> _left);newRoot -> _right = copy(root -> _right);return newRoot;}private:Node* _root = nullptr;
};int main()
{BSTree<string, string> dict;//BSTree<string, string> copy = dict;dict.Insert("left", "左边");dict.Insert("right", "右边");dict.Insert("insert", "插⼊");dict.Insert("string", "字符串");string str;while (cin>>str){auto ret = dict.Find(str);if (ret){cout << "->" << ret->_value << endl;}else{cout << "⽆此单词,请重新输⼊" << endl;}}return 0;
}int main()
{string arr[] = { "苹果", "西⽠", "苹果", "西⽠", "苹果", "苹果", "西⽠", "苹果", "⾹蕉", "苹果", "⾹蕉" };BSTree<string, int> countTree;for (const auto& str : arr){
// 先查找⽔果在不在搜索树中
// 1、不在,说明⽔果第⼀次出现,则插⼊<⽔果, 1>
// 2、在,则查找到的结点中⽔果对应的次数++
//BSTreeNode<string, int>* ret = countTree.Find(str);auto ret = countTree.Find(str);if (ret == NULL){countTree.Insert(str, 1);}else{ret->_value++;}}countTree.InOrder();return 0;
}
4.总结
总之,二叉搜索树是一种基础且重要的数据结构,理解它的原理、操作以及优缺点等,对于进一步学习更复杂的数据结构和算法有着重要的铺垫作用。