您好,登錄后才能下訂單哦!
作者 | 安卓大叔
來源 | www.jianshu.com/u/1d933ff900e7
本文將通過圖文的方式講解紅黑樹的知識點,并且不會涉及到任何代碼,相信我,在懂得紅黑樹實現原理前,看代碼會一頭霧水的,當原理懂了,代碼也就按部就班寫而已,沒任何難度。
閱讀本文你需具備知識點:
二叉查找樹
完美平衡二叉樹
事不宜遲,讓我們進入正題吧。
紅黑樹也是二叉查找樹,我們知道,二叉查找樹這一數據結構并不難,而紅黑樹之所以難是難在它是自平衡的二叉查找樹,在進行插入和刪除等可能會破壞樹的平衡的操作時,需要重新自處理達到平衡狀態。現在在腦海想下怎么實現?是不是太多情景需要考慮了?嘖嘖,先別急,通過本文的學習后,你會覺得,其實也不過如此而已。好吧,我們先來看下紅黑樹的定義和一些基本性質。
紅黑樹定義和性質
紅黑樹是一種含有紅黑結點并能自平衡的二叉查找樹。它必須滿足下面性質:
性質1:每個節點要么是黑色,要么是紅色。
性質2:根節點是黑色。
性質3:每個葉子節點(NIL)是黑色。
性質4:每個紅色結點的兩個子結點一定都是黑色。
性質5:任意一結點到每個葉子結點的路徑都包含數量相同的黑結點。
從性質5又可以推出:
性質5.1:如果一個結點存在黑子結點,那么該結點肯定有兩個子結點
圖1就是一顆簡單的紅黑樹。其中Nil為葉子結點,并且它是黑色的。(值得提醒注意的是,在Java中,葉子結點是為null的結點。)
圖1 一顆簡單的紅黑樹
紅黑樹并不是一個完美平衡二叉查找樹,從圖1可以看到,根結點P的左子樹顯然比右子樹高,但左子樹和右子樹的黑結點的層數是相等的,也即任意一個結點到到每個葉子結點的路徑都包含數量相同的黑結點(性質5)。所以我們叫紅黑樹這種平衡為黑色完美平衡。
介紹到此,為了后面講解不至于混淆,我們還需要來約定下紅黑樹一些結點的叫法,如圖2所示。
圖2 結點叫法約定
我們把正在處理(遍歷)的結點叫做當前結點,如圖2中的D,它的父親叫做父結點,它的父親的另外一個子結點叫做兄弟結點,父親的父親叫做祖父結點。
前面講到紅黑樹能自平衡,它靠的是什么?三種操作:左旋、右旋和變色。
左旋:以某個結點作為支點(旋轉結點),其右子結點變為旋轉結點的父結點,右子結點的左子結點變為旋轉結點的右子結點,左子結點保持不變。如圖3。
右旋:以某個結點作為支點(旋轉結點),其左子結點變為旋轉結點的父結點,左子結點的右子結點變為旋轉結點的左子結點,右子結點保持不變。如圖4。
變色:結點的顏色由紅變黑或由黑變紅。
圖3 左旋
圖4 右旋
上面所說的旋轉結點也即旋轉的支點,圖4和圖5中的P結點。
我們先忽略顏色,可以看到旋轉操作不會影響旋轉結點的父結點,父結點以上的結構還是保持不變的。
左旋只影響旋轉結點和其右子樹的結構,把右子樹的結點往左子樹挪了。
右旋只影響旋轉結點和其左子樹的結構,把左子樹的結點往右子樹挪了。
所以旋轉操作是局部的。另外可以看出旋轉能保持紅黑樹平衡的一些端詳了:當一邊子樹的結點少了,那么向另外一邊子樹“借”一些結點;當一邊子樹的結點多了,那么向另外一邊子樹“租”一些結點。
但要保持紅黑樹的性質,結點不能亂挪,還得靠變色了。怎么變?具體情景又不同變法,后面會具體講到,現在只需要記住紅黑樹總是通過旋轉和變色達到自平衡。
balabala了這么多,相信你對紅黑樹有一定印象了,那么現在來考考你:
思考題1:黑結點可以同時包含一個紅子結點和一個黑子結點嗎? (答案見文末)
接下來先講解紅黑樹的查找熱熱身。
紅黑樹查找
因為紅黑樹是一顆二叉平衡樹,并且查找不會破壞樹的平衡,所以查找跟二叉平衡樹的查找無異:
從根結點開始查找,把根結點設置為當前結點;
若當前結點為空,返回null;
若當前結點不為空,用當前結點的key跟查找key作比較;
若當前結點key等于查找key,那么該key就是查找目標,返回當前結點;
若當前結點key大于查找key,把當前結點的左子結點設置為當前結點,重復步驟2;
若當前結點key小于查找key,把當前結點的右子結點設置為當前結點,重復步驟2;
如圖5所示:
圖5 二叉樹查找流程圖
非常簡單,但簡單不代表它效率不好。正由于紅黑樹總保持黑色完美平衡,所以它的查找最壞時間復雜度為O(2lgN),也即整顆樹剛好紅黑相隔的時候。能有這么好的查找效率得益于紅黑樹自平衡的特性,而這背后的付出,紅黑樹的插入操作功不可沒~
紅黑樹插入
插入操作包括兩部分工作:一查找插入的位置;二插入后自平衡。查找插入的父結點很簡單,跟查找操作區別不大:
從根結點開始查找;
若根結點為空,那么插入結點作為根結點,結束。
若根結點不為空,那么把根結點作為當前結點;
若當前結點為null,返回當前結點的父結點,結束。
若當前結點key等于查找key,那么該key所在結點就是插入結點,更新結點的值,結束。
若當前結點key大于查找key,把當前結點的左子結點設置為當前結點,重復步驟4;
若當前結點key小于查找key,把當前結點的右子結點設置為當前結點,重復步驟4;
如圖6所示:
圖6 紅黑樹插入位置查找
ok,插入位置已經找到,把插入結點放到正確的位置就可以啦,但插入結點是應該是什么顏色呢?答案是紅色。理由很簡單,紅色在父結點(如果存在)為黑色結點時,紅黑樹的黑色平衡沒被破壞,不需要做自平衡操作。但如果插入結點是黑色,那么插入位置所在的子樹黑色結點總是多1,必須做自平衡。
所有插入情景如圖7所示:
圖7 紅黑樹插入情景
嗯,插入情景很多呢,8種插入情景!但情景1、2和3的處理很簡單,而情景4.2和情景4.3只是方向反轉而已,懂得了一種情景就能推出另外一種情景,所以總體來看,并不復雜,后續我們將一個一個情景來看,把它徹底搞懂。
另外,根據二叉樹的性質,除了情景2,所有插入操作都是在葉子結點進行的。這點應該不難理解,因為查找插入位置時,我們就是在找子結點為空的父結點的。
在開始每個情景的講解前,我們還是先來約定下,如圖8所示:
圖8 插入操作結點的叫法約定
圖8的字母并不代表結點Key的大小。I表示插入結點,P表示插入結點的父結點,S表示插入結點的叔叔結點,PP表示插入結點的祖父結點。
好了,下面讓我們一個一個來分析每個插入的情景以其處理。
最簡單的一種情景,直接把插入結點作為根結點就行,但注意,根據紅黑樹性質2:根節點是黑色。還需要把插入結點設為黑色。
處理:把插入結點作為根結點,并把結點設置為黑色。
插入結點的Key已存在,既然紅黑樹總保持平衡,在插入前紅黑樹已經是平衡的,那么把插入結點設置為將要替代結點的顏色,再把結點的值更新就完成插入。
處理:
把I設為當前結點的顏色
更新當前結點的值為插入結點的值
由于插入的結點是紅色的,當插入結點的黑色時,并不會影響紅黑樹的平衡,直接插入即可,無需做自平衡。
處理:直接插入。
再次回想下紅黑樹的性質2:根結點是黑色。如果插入的父結點為紅結點,那么該父結點不可能為根結點,所以插入結點總是存在祖父結點。這點很重要,因為后續的旋轉操作肯定需要祖父結點的參與。
情景4又分為很多子情景,下面將進入重點部分,各位看官請留神了。
插入情景4.1:叔叔結點存在并且為紅結點
從紅黑樹性質4可以,祖父結點肯定為黑結點,因為不可以同時存在兩個相連的紅結點。那么此時該插入子樹的紅黑層數的情況是:黑紅紅。顯然最簡單的處理方式是把其改為:紅黑紅。如圖9和圖10所示。
處理:
將P和S設置為黑色
將PP設置為紅色
把PP設置為當前插入結點
圖9 插入情景4.1_1
圖10 插入情景4.1_2
可以看到,我們把PP結點設為紅色了,如果PP的父結點是黑色,那么無需再做任何處理;但如果PP的父結點是紅色,根據性質4,此時紅黑樹已不平衡了,所以還需要把PP當作新的插入結點,繼續做插入操作自平衡處理,直到平衡為止。
試想下PP剛好為根結點時,那么根據性質2,我們必須把PP重新設為黑色,那么樹的紅黑結構變為:黑黑紅。換句話說,從根結點到葉子結點的路徑中,黑色結點增加了。這也是唯一一種會增加紅黑樹黑色結點層數的插入情景。
我們還可以總結出另外一個經驗:紅黑樹的生長是自底向上的。這點不同于普通的二叉查找樹,普通的二叉查找樹的生長是自頂向下的。
插入情景4.2:叔叔結點不存在或為黑結點,并且插入結點的父親結點是祖父結點的左子結點
單純從插入前來看,也即不算情景4.1自底向上處理時的情況,叔叔結點非紅即為葉子結點(Nil)。因為如果叔叔結點為黑結點,而父結點為紅結點,那么叔叔結點所在的子樹的黑色結點就比父結點所在子樹的多了,這不滿足紅黑樹的性質5。后續情景同樣如此,不再多做說明了。
前文說了,需要旋轉操作時,肯定一邊子樹的結點多了或少了,需要租或借給另一邊。插入顯然是多的情況,那么把多的結點租給另一邊子樹就可以了。
插入情景4.2.1:插入結點是其父結點的左子結點
處理:
將P設為黑色
將PP設為紅色
對PP進行右旋
圖11 插入情景4.2.1
由圖11可得,左邊兩個紅結點,右邊不存在,那么一邊一個剛剛好,并且因為為紅色,肯定不會破壞樹的平衡。
咦,可以把PP設為紅色,I和P設為黑色嗎?答案是可以!看過《算法:第4版》的同學可能知道,書中講解的就是把PP設為紅色,I和P設為黑色。但把PP設為紅色,顯然又會出現情景4.1的情況,需要自底向上處理,做多了無謂的操作,既然能自己消化就不要麻煩祖輩們啦~
插入情景4.2.2:插入結點是其父結點的右子結點
這種情景顯然可以轉換為情景4.2.1,如圖12所示,不做過多說明了。
處理:
對P進行左旋
把P設置為插入結點,得到情景4.2.1
進行情景4.2.1的處理
圖12 插入情景4.2.2
插入情景4.3:叔叔結點不存在或為黑結點,并且插入結點的父親結點是祖父結點的右子結點
該情景對應情景4.2,只是方向反轉,不做過多說明了,直接看圖。
插入情景4.3.1:插入結點是其父結點的右子結點
處理:
將P設為黑色
將PP設為紅色
對PP進行左旋
圖13 插入情景4.3.1
插入情景4.3.2:插入結點是其父結點的右子結點
處理:
對P進行右旋
把P設置為插入結點,得到情景4.3.1
進行情景4.3.1的處理
圖14 插入情景4.3.2
好了,講完插入的所有情景了。可能又同學會想:上面的情景舉例的都是第一次插入而不包含自底向上處理的情況,那么上面所說的情景都適合自底向上的情況嗎?答案是肯定的。理由很簡單,但每棵子樹都能自平衡,那么整棵樹最終總是平衡的。好吧,在出個習題,請大家拿出筆和紙畫下試試(請務必動手畫下,加深印象):
習題1:請畫出圖15的插入自平衡處理過程。(答案見文末)
圖15 習題1
紅黑樹刪除
紅黑樹插入已經夠復雜了,但刪除更復雜,也是紅黑樹最復雜的操作了。但穩住,勝利的曙光就在前面了!
紅黑樹的刪除操作也包括兩部分工作:一查找目標結點;而刪除后自平衡。查找目標結點顯然可以復用查找操作,當不存在目標結點時,忽略本次操作;當存在目標結點時,刪除后就得做自平衡處理了。刪除了結點后我們還需要找結點來替代刪除結點的位置,不然子樹跟父輩結點斷開了,除非刪除結點剛好沒子結點,那么就不需要替代。
二叉樹刪除結點找替代結點有3種情情景:
情景1:若刪除結點無子結點,直接刪除
情景2:若刪除結點只有一個子結點,用子結點替換刪除結點
情景3:若刪除結點有兩個子結點,用后繼結點(大于刪除結點的最小結點)替換刪除結點
補充說明下,情景3的后繼結點是大于刪除結點的最小結點,也是刪除結點的右子樹種最右結點。那么可以拿前繼結點(刪除結點的左子樹最左結點)替代嗎?可以的。但習慣上大多都是拿后繼結點來替代,后文的講解也是用后繼結點來替代。另外告訴大家一種找前繼和后繼結點的直觀的方法(不知為何沒人提過,大家都知道?):把二叉樹所有結點投射在X軸上,所有結點都是從左到右排好序的,所有目標結點的前后結點就是對應前繼和后繼結點。如圖16所示。
圖16 二叉樹投射x軸后有序
接下來,講一個重要的思路:刪除結點被替代后,在不考慮結點的鍵值的情況下,對于樹來說,可以認為刪除的是替代結點!話很蒼白,我們看圖17。在不看鍵值對的情況下,圖17的紅黑樹最終結果是刪除了Q所在位置的結點!這種思路非常重要,大大簡化了后文講解紅黑樹刪除的情景!
圖17 刪除結點換位思路
基于此,上面所說的3種二叉樹的刪除情景可以相互轉換并且最終都是轉換為情景1!
情景2:刪除結點用其唯一的子結點替換,子結點替換為刪除結點后,可以認為刪除的是子結點,若子結點又有兩個子結點,那么相當于轉換為情景3,一直自頂向下轉換,總是能轉換為情景1。(對于紅黑樹來說,根據性質5.1,只存在一個子結點的結點肯定在樹末了)
情景3:刪除結點用后繼結點(肯定不存在左結點),如果后繼結點有右子結點,那么相當于轉換為情景2,否則轉為為情景1。
二叉樹刪除結點情景關系圖如圖18所示。
圖18 二叉樹刪除情景轉換
綜上所述,刪除操作刪除的結點可以看作刪除替代結點,而替代結點最后總是在樹末。有了這結論,我們討論的刪除紅黑樹的情景就少了很多,因為我們只考慮刪除樹末結點的情景了。
同樣的,我們也是先來總體看下刪除操作的所有情景,如圖19所示。
圖19 紅黑樹刪除情景
哈哈,是的,即使簡化了還是有9種情景!但跟插入操作一樣,存在左右對稱的情景,只是方向變了,沒有本質區別。同樣的,我們還是來約定下,如圖20所示。
圖20 刪除操作結點的叫法約定
圖20的字母并不代表結點Key的大小。R表示替代結點,P表示替代結點的父結點,S表示替代結點的兄弟結點,SL表示兄弟結點的左子結點,SR表示兄弟結點的右子結點。灰色結點表示它可以是紅色也可以是黑色。
值得特別提醒的是,R是即將被替換到刪除結點的位置的替代結點,在刪除前,它還在原來所在位置參與樹的子平衡,平衡后再替換到刪除結點的位置,才算刪除完成。
萬事具備,我們進入最后的也是最難的講解。
我們把替換結點換到了刪除結點的位置時,由于替換結點時紅色,刪除也了不會影響紅黑樹的平衡,只要把替換結點的顏色設為刪除的結點的顏色即可重新平衡。
處理:顏色變為刪除結點的顏色
當替換結點是黑色時,我們就不得不進行自平衡處理了。我們必須還得考慮替換結點是其父結點的左子結點還是右子結點,來做不同的旋轉操作,使樹重新平衡。
刪除情景2.1:替換結點是其父結點的左子結點
刪除情景2.1.1:替換結點的兄弟結點是紅結點
若兄弟結點是紅結點,那么根據性質4,兄弟結點的父結點和子結點肯定為黑色,不會有其他子情景,我們按圖21處理,得到刪除情景2.1.2.3(后續講解,這里先記住,此時R仍然是替代結點,它的新的兄弟結點SL和兄弟結點的子結點都是黑色)。
處理:
將S設為黑色
將P設為紅色
對P進行左旋,得到情景2.1.2.3
進行情景2.1.2.3的處理
圖21 刪除情景2.1.1
刪除情景2.1.2:替換結點的兄弟結點是黑結點
當兄弟結點為黑時,其父結點和子結點的具體顏色也無法確定(如果也不考慮自底向上的情況,子結點非紅即為葉子結點Nil,Nil結點為黑結點),此時又得考慮多種子情景。
刪除情景2.1.2.1:替換結點的兄弟結點的右子結點是紅結點,左子結點任意顏色
即將刪除的左子樹的一個黑色結點,顯然左子樹的黑色結點少1了,然而右子樹又又紅色結點,那么我們直接向右子樹“借”個紅結點來補充黑結點就好啦,此時肯定需要用旋轉處理了。如圖22所示。
處理:
將S的顏色設為P的顏色
將P設為黑色
將SR設為黑色
對P進行左旋
圖22 刪除情景2.1.2.1
平衡后的圖怎么不滿足紅黑樹的性質?前文提醒過,R是即將替換的,它還參與樹的自平衡,平衡后再替換到刪除結點的位置,所以R最終可以看作是刪除的。另外圖2.1.2.1是考慮到第一次替換和自底向上處理的情況,如果只考慮第一次替換的情況,根據紅黑樹性質,SL肯定是紅色或為Nil,所以最終結果樹是平衡的。如果是自底向上處理的情況,同樣,每棵子樹都保持平衡狀態,最終整棵樹肯定是平衡的。后續的情景同理,不做過多說明了。
刪除情景2.1.2.2:替換結點的兄弟結點的右子結點為黑結點,左子結點為紅結點
兄弟結點所在的子樹有紅結點,我們總是可以向兄弟子樹借個紅結點過來,顯然該情景可以轉換為情景2.1.2.1。圖如23所示。
處理:
將S設為紅色
將SL設為黑色
對S進行右旋,得到情景2.1.2.1
進行情景2.1.2.1的處理
圖23 刪除情景2.1.2.2
刪除情景2.1.2.3:替換結點的兄弟結點的子結點都為黑結點
好了,此次兄弟子樹都沒紅結點“借”了,兄弟幫忙不了,找父母唄,這種情景我們把兄弟結點設為紅色,再把父結點當作替代結點,自底向上處理,去找父結點的兄弟結點去“借”。但為什么需要把兄弟結點設為紅色呢?顯然是為了在P所在的子樹中保證平衡(R即將刪除,少了一個黑色結點,子樹也需要少一個),后續的平衡工作交給父輩們考慮了,還是那句,當每棵子樹都保持平衡時,最終整棵總是平衡的。
處理:
將S設為紅色
把P作為新的替換結點
重新進行刪除結點情景處理
圖24 情景2.1.2.3
刪除情景2.2:替換結點是其父結點的右子結點
好啦,右邊的操作也是方向相反,不做過多說明了,相信理解了刪除情景2.1后,肯定可以理解2.2。
刪除情景2.2.1:替換結點的兄弟結點是紅結點
處理:
將S設為黑色
將P設為紅色
對P進行右旋,得到情景2.2.2.3
進行情景2.2.2.3的處理
圖25 刪除情景2.2.1
刪除情景2.2.2:替換結點的兄弟結點是黑結點
刪除情景2.2.2.1:替換結點的兄弟結點的左子結點是紅結點,右子結點任意顏色
處理:
將S的顏色設為P的顏色
將P設為黑色
將SL設為黑色
對P進行右旋
圖26 刪除情景2.2.2.1
刪除情景2.2.2.2:替換結點的兄弟結點的左子結點為黑結點,右子結點為紅結點
處理:
將S設為紅色
將SR設為黑色
對S進行左旋,得到情景2.2.2.1
進行情景2.2.2.1的處理
圖27 刪除情景2.2.2.2
刪除情景2.2.2.3:替換結點的兄弟結點的子結點都為黑結點
處理:
將S設為紅色
把P作為新的替換結點
重新進行刪除結點情景處理
圖28 刪除情景2.2.2.3
綜上,紅黑樹刪除后自平衡的處理可以總結為:
自己能搞定的自消化(情景1)
自己不能搞定的叫兄弟幫忙(除了情景1、情景2.1.2.3和情景2.2.2.3)
兄弟都幫忙不了的,通過父母,找遠方親戚(情景2.1.2.3和情景2.2.2.3)
哈哈,是不是跟現實中很像,當我們有困難時,首先先自己解決,自己無力了總兄弟姐妹幫忙,如果連兄弟姐妹都幫不上,再去找遠方的親戚了。這里記憶應該會好記點~
最后再做個習題加深理解(請不熟悉的同學務必動手畫下):
習題2:請畫出圖29的刪除自平衡處理過程。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。