可能很多人又有疑問了,既然Hash
索引的效率要比 B-Tree 高很多,為什么大家不都用 Hash 索引而還要使用 B-Tree索引呢?任何事物都是有兩面性的,Hash 索引也一樣,雖然 Hash 索引效率高,但是 Hash索引本身由于其特殊性也帶來了很多限制和弊端,主要有以下這些。 (1)Hash索引僅僅能滿足"=","IN"和"<=>"查詢,不能使用范圍查詢。 由于 Hash 索引比較的是進(jìn)行 Hash 運(yùn)算之后的 Hash值,所以它只能用于等值的過濾,不能用于基于范圍的過濾,因為經(jīng)過相應(yīng)的 Hash算法處理之后的 Hash 值的大小關(guān)系,并不能保證和Hash運(yùn)算前完全一樣。 (2)Hash 索引無法被用來避免數(shù)據(jù)的排序操作。 由于 Hash 索引中存放的是經(jīng)過 Hash 計算之后的 Hash值,而且Hash值的大小關(guān)系并不一定和 Hash運(yùn)算前的鍵值完全一樣,所以數(shù)據(jù)庫無法利用索引的數(shù)據(jù)來避免任何排序運(yùn)算; (3)Hash索引不能利用部分索引鍵查詢。 對于組合索引,Hash 索引在計算 Hash 值的時候是組合索引鍵合并后再一起計算 Hash 值,而不是單獨(dú)計算 Hash值,所以通過組合索引的前面一個或幾個索引鍵進(jìn)行查詢的時候,Hash 索引也無法被利用。 (4)Hash索引在任何時候都不能避免表掃描。 前面已經(jīng)知道,Hash 索引是將索引鍵通過 Hash 運(yùn)算之后,將 Hash運(yùn)算結(jié)果的 Hash值和所對應(yīng)的行指針信息存放于一個 Hash 表中,由于不同索引鍵存在相同 Hash 值,所以即使取滿足某個 Hash 鍵值的數(shù)據(jù)的記錄條數(shù),也無法從 Hash索引中直接完成查詢,還是要通過訪問表中的實(shí)際數(shù)據(jù)進(jìn)行相應(yīng)的比較,并得到相應(yīng)的結(jié)果。 (5)Hash索引遇到大量Hash值相等的情況后性能并不一定就會比B-Tree索引高。 對于選擇性比較低的索引鍵,如果創(chuàng)建 Hash 索引,那么將會存在大量記錄指針信息存于同一個Hash值相關(guān)聯(lián)。這樣要定位某一條記錄時就會非常麻煩,會浪費(fèi)多次表數(shù)據(jù)的訪問,而造成整體性能低下 |
|