红黑树是一棵二叉搜索树,但是红黑树通过增加一个存储位表示结点的颜色RED或BLACK。通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出2倍,因而是接近平衡的。
⭐1.每个节点不是红色就是黑色。
⭐2.根节点是黑色的。
⭐3.如果一个节点是红色的,则它的两个孩子结点是黑色的。也就意味着,红黑树没有连续的红色节点。
⭐4.对于每个结点,从该结点到其所有后代叶结点的简单路径上,均包含相同数目的黑色结点。也就是说每条路径都有相同数量的黑色节点。
⭐5.每个叶子结点都是黑色的(此处的叶子结点指的是空结点。
一颗红黑树最短的路径是这条路径全黑。最长是一红一黑相间路径。
对于近似平衡来说:
①最优情况就是左右平衡,此时每条路径都是全黑或者是一红一黑相间,形成满二叉树。
②差的情况就是左右越不平衡,情况就越差。比如左子树全黑,而右子树是一黑一红相间。假设左子树全黑的路径长度位h = logN,因为红黑树要求每条路径的黑色节点的数量是相同的,而右子树是一红一黑相间的,那就说明右子树的长度是左子树的两倍h = 2*logN,这是最差的情况了,再差点就不是红黑树了。
红黑树节点的定义,跟AVL树的区别就是红黑树不需要平衡因子,而加入了颜色红跟黑。在定义当中,构造函数初始化列表对颜色_col默认初始化为红色是因为权衡了上面所述红黑树性质中的性质3和性质4。
性质3是说明了红黑树没有连续的红色节点,性质4说明的是每条路径都有相同数量的黑色节点。我们在定义节点的时候,需要给节点的颜色初始化,要么是红色,要么是黑色。
如果我们选择了黑色,那么在插入新节点之前,我们是往红黑树插入的嘛,本身就是红黑树,再插入一个黑色节点的话,那么必定会破坏掉红黑树的规则,是一定被破坏掉的,那么就一定需要对这颗红黑树进行调整。
如果我们选择红色,那么有可能会破坏掉红黑树的规则,也可能不会造成破坏。因为新增的节点的父节点是黑色的,那么就不会造成影响,而父节点是红色的话,那就需要调整。
因此,综上所述,默认初始化为红色是比较好的选择。
//使用枚举
enum Colour
{RED,BLACK,
};template
struct RBTreeNode
{pair _kv;RBTreeNode* _left;RBTreeNode* _right;RBTreeNode* _parent;Colour _col;RBTreeNode(const pair& kv):_kv(kv),_left(nullptr),_right(nullptr),_parent(nullptr) //跟AVL树一样,使用parent节点是为了旋转,_col(RED) //默认是红色{}
};
红黑树是在二叉搜索树的基础上加入了平衡限制条件的树,因此红黑树的插入分为两步:
第一步:按照二叉搜索树的规则插入新节点。
第二步:检测新节点插入后,红黑树的性质是否造到破坏。
判断依据:因为新节点的默认颜色是红色,因此:如果其双亲节点的颜色是黑色,没有违反红黑树任何性质,则不需要调整;但当新插入节点的双亲节点颜色为红色时,就违反了性质三不能有连在一起的红色节点,此时需要对红黑树分情况来讨论:
本文约定好:cur为当前节点,p(parent)为父节点,g(grandther)为祖父节点,u(uncle)为叔叔节点。
①cur为红,p为红,g为黑,u存在且为红
这种情况是插入的节点cur是红色的(默认),cur的双亲节点和叔叔节点是红色的,祖先节点是黑色的。因为不能连续存在红色节点,那么就需要把颜色调整一下即可,不需要旋转。
调整的方法为:将p节点和u节点的颜色改成黑色,同时为了防止g不是一棵单独的树,先把它变成红色,再进行判断,如果是单独的树,那么就把g的颜色变回黑色,如果是一棵子树,那么就往上继续调整。
②cur为红,p为红,g为黑,u不存在/u存在且为黑
这种情况下是需要旋转+变色的。因为当cur为红色,p为红色,g为黑色,而u的情况是:
如果u不存在,cur肯定是新增的节点,因为在新增之前,p和g组成的树是一棵红黑树,在cur新增之后,不符合红黑树的性质。
这种情况下光凭变色是解决不了问题的,因为u为空说明有一条路径只有根节点,而另一条路径上会存在连续红,只凭变色,无论怎么变,都会导致各路径的黑色节点数量不相同,所以需要先根据p和cur的位置来决定旋转的方向而旋转,再变色。
如果u存在,则u是黑色,并且cur原本的颜色一定是黑色的,而现在cur的颜色是红色,那就肯定是第一种情况调整后,导致了现在的cur的颜色变了。
这种情况下就跟u不存在的情况一样,采用旋转+变色来解决问题。此时,u存在不存在已经没什么关系了(单独是看构造红黑树的情况来说)。
③cur为红,p为红,g为黑,u不存在/u存在且为黑
这种情况的颜色是跟情况二的一样,区别就是节点的位置不一样。
这种情况是跟第二中情况差不多,就是多了一步旋转,先左旋再右旋,或者先右旋再左旋。
整体代码如下:
template
class RBTree
{typedef RBTreeNode Node;
public:bool Insert(const pair& kv){//先按二叉搜索树的规矩来创建一棵二叉搜索树if (_root==nullptr){_root = new Node(kv);//因为红黑树的根节点是黑色的_root->_col = BLACK;return true;}Node* parent = nullptr;Node* cur = _root;while (cur){if (cur->_kv.first < kv.first){parent = cur;cur = cur->_right;}else if (cur->_kv.first > kv.first){parent = cur;cur = cur->_left;}else{return false;}}cur = new Node(kv);cur->_col = RED;//多写一步,防止写错代码。if (parent->_kv.first < kv.first){parent->_right = cur;cur->_parent = parent;}else{parent->_left = cur;cur->_parent = parent;}//创建完二叉搜索树//开始创建红黑树,使用颜色来判断是否需要调整//循环往上走,循环条件:当走到的parent不为空,并且parent是红色的//即我们列举是三种情况,parent都是红的,就需要重新调整//如果parent是黑色的,那就不需要了。直接就是一棵红黑树,不进入循环while (parent && parent->_col == RED){//保存祖先节点,即g节点Node* grandfther = parent->_parent;//判断父节点是在祖先节点的哪边if (parent == grandfther->_left){//父节点在左边,那么叔叔节点就在右边Node* uncle = grandfther->_right;//情况一:uncle存在且为红。改变颜色即可if (uncle && uncle->_col == RED){//变色。parent->_col = uncle->_col = BLACK;grandfther->_col = RED;//往上走cur = grandfther;parent = cur->_parent;}else //uncle不存在 或者 存在但是黑色{//情况二 p是g的左孩子,cur是p的左孩子,以g为轴右单旋if (cur == parent->_left){//右单旋RotateR(grandfther);//变色 右单旋后,parent为根节点,变黑色。cur和g节点为红色parent->_col = BLACK;grandfther->_col = RED;}else //情况三 p是g的左孩子,cur是p的右孩子.{//先以p为轴左旋转RotateL(parent);//变成情况二,再以g为轴右单旋RotateR(grandfther);//变色 cur变成根节点,为黑色。p和g是红色cur->_col = BLACK;grandfther->_col = RED;}break;}}else //parent是在grandfther的右边{//叔叔节点就在祖先节点的左边Node* uncle = grandfther->_left;//情况一:uncle存在且为红。改变颜色即可if (uncle && uncle->_col == RED){//变色。parent->_col = uncle->_col = BLACK;grandfther->_col = RED;//往上走cur = grandfther;parent = cur->_parent;}else //uncle不存在 或者 存在但是黑色{//情况二 p是g的右孩子,cur是p的右孩子。if (cur == parent->_right){//左单旋RotateL(grandfther);//变色 右单旋后,parent为根节点,变黑色。cur和g节点为红色parent->_col = BLACK;grandfther->_col = RED;}else //情况三 p是g的右孩子,cur是p的左孩子.{//先以p为轴右旋转RotateR(parent);//变成情况二,再以g为轴左单旋RotateL(grandfther);//变色 cur变成根节点,为黑色。p和g是红色cur->_col = BLACK;grandfther->_col = RED;}break;}}}//最后将根节点置为黑_root->_col = BLACK;return true;}void RotateR(Node* parent){Node* subL = parent->_left;Node* subLR = subL->_right;parent->_left = subLR;if (subLR){subLR->_parent = parent;}Node* ppNode = parent->_parent;subL->_right = parent;parent->_parent = subL;if (ppNode == nullptr){_root = subL;_root->_parent = nullptr;}else {if (ppNode->_left == parent) {ppNode->_left = subL;}else {ppNode->_right = subL;}subL->_parent = ppNode;}}void RotateL(Node* parent){Node* subR = parent->_right;Node* subRL = subR->_left; parent->_right = subRL;if (subRL){subRL->_parent = parent;}Node* ppNode = parent->_parent;subR->_left = parent;parent->_parent = subR;if (ppNode == nullptr){_root = subR;_root->_parent = nullptr;}else{if (ppNode->_left = parent){ppNode->_left = subR;}else{ppNode->_right = subR;}subR->_parent = ppNode;}}private:Node* _root = nullptr;
};
旋转请看:AVL树这篇文章有详细解析。红黑树的旋转直接复用AVL树的旋转的代码即可。
⭐相同点:红黑树和AVL树都是高效的平衡二叉树,增删改查的时间复杂度都是O(log_2 N)。
⭐不同点:红黑树不追求绝对平衡,其只需保证最长路径不超过最短路径的2倍,相对而言降低了插入和旋转的次数。而AVL树是高度平衡的二叉搜索树,旋转的次数比红黑树的要频繁。
所以在经常进行增删的结构中性能比AVL树更优,而且红黑树实现比较简单,所以实际运用中红黑树更多。
也就是因为红黑树在修改操作方面的性能比AVL树好,因此红黑树都用在了C++的STL库(map/set、mutil_map/mutil_set),Java库、Linux内核等等地方。