1. 索引索引,類似書(shū)籍的目錄,可以根據(jù)目錄的某個(gè)頁(yè)碼立即找到對(duì)應(yīng)的內(nèi)容。 索引的優(yōu)點(diǎn):1. 天生排序。2. 快速查找。 注意點(diǎn):小表使用全表掃描更快,中大表才使用索引。超級(jí)大表索引基本無(wú)效。 索引從實(shí)現(xiàn)上說(shuō),分成 2 種:聚集索引和輔助索引(也叫二級(jí)索引或者非聚集索引) 從功能上說(shuō),分為 6 種:普通索引,唯一索引,主鍵索引,復(fù)合索引,外鍵索引,全文索引。 詳細(xì)說(shuō)說(shuō) 6 種索引: 1、普通索引:最基本的索引,沒(méi)有任何約束。
另外,InnoDB 通過(guò)主鍵聚簇?cái)?shù)據(jù),如果沒(méi)有定義主鍵且沒(méi)有定義聚集索引, MySql 會(huì)選擇一個(gè)唯一的非空索引代替,如果沒(méi)有這樣的索引,會(huì)隱式定義個(gè) 6 字節(jié)的主鍵作為聚簇索引,用戶不能查看或訪問(wèn)。 簡(jiǎn)單點(diǎn)說(shuō):
MySql 將數(shù)據(jù)按照頁(yè)來(lái)存儲(chǔ),默認(rèn)一頁(yè)為 16kb,當(dāng)你在查詢時(shí),不會(huì)只加載某一條數(shù)據(jù),而是將這個(gè)數(shù)據(jù)所在的頁(yè)都加載到 pageCache 中,這個(gè)其實(shí)和 OS 的就近訪問(wèn)原理類似。 MySql 的索引使用 B+ 樹(shù)結(jié)構(gòu)。在說(shuō) B+ 樹(shù)之前,先說(shuō)說(shuō) B 樹(shù),B 樹(shù)是一個(gè)多路平衡查找樹(shù),相較于普通的二叉樹(shù),不會(huì)發(fā)生極度不平衡的狀況,同時(shí)也是多路的。 B 樹(shù)的特點(diǎn)是:他會(huì)將數(shù)據(jù)也保存在非頁(yè)子節(jié)點(diǎn)。 看圖可知: 而這個(gè)特點(diǎn)會(huì)導(dǎo)致非頁(yè)子節(jié)點(diǎn)不能存儲(chǔ)大量的索引。 而 B+ Tree 就是針對(duì)這個(gè)對(duì) B tree 做了優(yōu)化。如下圖所示: 我們看到,B+ Tree 將所有的 data 數(shù)據(jù)都保存到了葉子節(jié)點(diǎn)中,非也子節(jié)點(diǎn)只保存索引和指針。 我們假設(shè)一個(gè)非頁(yè)子節(jié)點(diǎn)是 16kb,每個(gè)索引,即主鍵是 bigint,即 8b,指針為 8b。那么每頁(yè)能存儲(chǔ)大約 1000 個(gè)索引(16kb/ 8b + 8b). 而一顆 3 層的 B+樹(shù)能夠存儲(chǔ)多少索引呢?如下圖: 大約能夠存儲(chǔ) 10 億個(gè)索引。通常 B+ 樹(shù)的高度在 2-4 層,由于 MySql 在運(yùn)行時(shí),根節(jié)點(diǎn)是常駐內(nèi)存的,因此每次查找只需要大約 2 -3 次 IO。可以說(shuō),B+ 樹(shù)的設(shè)計(jì),就是根據(jù)機(jī)械磁盤(pán)的特性來(lái)進(jìn)行設(shè)計(jì)的。 知道了索引的設(shè)計(jì),我們能夠知道另外一些信息:
那么,如果項(xiàng)目中使用了分庫(kù)分表,我們通常都會(huì)需要一個(gè)主鍵進(jìn)行 sharding,那怎么辦呢?在實(shí)現(xiàn)上,我們可以保留自增主鍵,而邏輯主鍵用來(lái)作為唯一索引即可。 2. 鎖機(jī)制關(guān)于 Mysql 的鎖,各種概念就會(huì)噴涌而出,事實(shí)上,鎖有好幾種維度,我們來(lái)解釋一下。 1. 類型維度
2. 鎖的粒度(粒度維度)
3. 鎖的算法(算法維度)
4. 默認(rèn)的讀操作,上鎖嗎?
可以選擇手動(dòng)上鎖:select xxxx for update (排他鎖); select xxxx lock in share mode(共享鎖),稱之為“一致性鎖定讀”。 使用鎖之后,就能在 RR 級(jí)別下,避免幻讀。當(dāng)然,默認(rèn)的 MVCC 讀,也能避免幻讀。 既然 RR 能夠防止幻讀,那么,SERIALIZABLE 有啥用呢? 防止丟失更新。例如下圖: 這個(gè)時(shí)候,我們必須使用 SERIALIZABLE 級(jí)別進(jìn)行串行讀取。 最后,行鎖的實(shí)現(xiàn)原理就是鎖住聚集索引,如果你查詢的時(shí)候,沒(méi)有正確地?fù)糁兴饕?,MySql 優(yōu)化器將會(huì)拋棄行鎖,使用表鎖。 3. 事務(wù)事務(wù)是數(shù)據(jù)庫(kù)永恒不變的話題, ACID:原子性,一致性,隔離性,持久性。 四個(gè)特性,最重要的就是一致性。而一致性由原子性,隔離性,持久性來(lái)保證。
然后再說(shuō)隔離性。 隔離級(jí)別:
每個(gè)級(jí)別都會(huì)解決不同的問(wèn)題,通常是3 個(gè)問(wèn)題:臟讀,不可重復(fù)讀,幻讀。一張經(jīng)典的圖: 這里有個(gè)注意點(diǎn),關(guān)于幻讀,在數(shù)據(jù)庫(kù)規(guī)范里,RR 級(jí)別會(huì)導(dǎo)致幻讀,但是,由于 Mysql 的優(yōu)化,MySql 的 RR 級(jí)別不會(huì)導(dǎo)致幻讀:在使用默認(rèn)的 select 時(shí),MySql 使用 MVCC 機(jī)制保證不會(huì)幻讀;你也可以使用鎖,在使用鎖時(shí),例如 for update(X 鎖),lock in share mode(S 鎖),MySql 會(huì)使用 Next-Key Lock 來(lái)保證不會(huì)發(fā)生幻讀。前者稱為快照讀,后者稱為當(dāng)前讀。 原理剖析:
那 RR 和 Serializble 有什么區(qū)別呢?答:丟失更新。本文關(guān)于鎖的部分已經(jīng)提到。 MVCC 介紹:全稱多版本并發(fā)控制。 innoDB 每個(gè)聚集索引都有 4 個(gè)隱藏字段,分別是主鍵(RowID),最近更改的事務(wù) ID(MVCC 核心),Undo Log 的指針(隔離核心),索引刪除標(biāo)記(當(dāng)刪除時(shí),不會(huì)立即刪除,而是打標(biāo)記,然后異步刪除); 本質(zhì)上,MVCC 就是用 Undo Log 鏈表實(shí)現(xiàn)。 MVCC 的實(shí)現(xiàn)方式:事務(wù)以排它鎖的方式修改原始數(shù)據(jù),把修改前的數(shù)據(jù)存放于 Undo Log,通過(guò)回滾指針與數(shù)據(jù)關(guān)聯(lián),如果修改成功,什么都不做,如果修改失敗,則恢復(fù) Undo Log 中的數(shù)據(jù)。 多說(shuō)一句,通常我們認(rèn)為 MVCC 是類似樂(lè)觀鎖的方式,即使用版本號(hào),而實(shí)際上,innoDB 不是這么實(shí)現(xiàn)的。當(dāng)然,這不影響我們使用 MySql。 |
|
來(lái)自: 鷹兔牛熊眼 > 《其他互聯(lián)網(wǎng)技術(shù)》