資料庫索引,是資料庫管理系統中一個排序的資料結構,以協助快速查詢、更新資料庫表中資料。索引的實作通常使用B樹及其變種B+樹。
在數據之外,資料庫系統還維護著滿足特定查找演算法的數據結構,這些數據結構以某種方式引用(指向)數據,這樣就可以在這些數據結構上實現高級查找演算法。這種資料結構,就是索引。
為表設定索引要付出代價的:一是增加了資料庫的儲存空間,二是在插入和修改資料時要花費較多的時間(因為索引也要隨之變動)。
圖展示了一種可能的索引方式。左邊是資料表,一共有兩列七筆記錄,最左邊的是資料記錄的實體位址(注意邏輯上相鄰的記錄在磁碟上也並不是一定物理相鄰的)。為了加快Col2的查找,可以維護一個右邊所示的二元查找樹,每個節點分別包含索引鍵值和一個指向對應資料記錄物理位址的指針,這樣就可以運用二叉查找在O(log2n)的複雜度內取得到對應資料。
創建索引可以大大提高系統的效能。
一,透過建立唯一性索引,可以保證資料庫表中每一行資料的唯一性。
二,可以大幅加快資料的檢索速度,這也是創建索引的最主要的原因。
三,可以加速表和表之間的連接,特別是在實現數據的參考完整性方面特別有意義。
四,在使用分組和排序子句進行資料檢索時,同樣可以顯著減少查詢中分組和排序的時間。
五,透過使用索引,可以在查詢的過程中,使用最佳化隱藏器,提高系統的效能。
增加索引有這麼多的優點,為什麼不對表中的每個欄位建立一個索引呢?因為,增加索引也有許多不利的面向。
一,建立索引和維護索引要耗費時間,這種時間隨著資料量的增加而增加。
二,索引需要佔實體空間,除了資料表佔資料空間之外,每一個索引還要佔一定的實體空間,如果要建立聚集索引,那麼需要的空間就會更大。
三,當對表中的資料進行增加、刪除和修改的時候,索引也要動態的維護,這樣就降低了資料的維護速度。
索引是建立在資料庫表中的某些欄位的上面。在建立索引的時候,應該考慮在哪些欄位上可以建立索引,在哪些欄位上不能建立索引。
一般來說,應該在這些列上建立索引:
一、在經常需要搜尋的列上,可以加快搜尋的速度;
二、在作為主鍵的列上,強制該列的唯一性和組織表中資料的排列結構;
三、在經常用在連接的列上,這些列主要是一些外鍵,可以加快連接的速度;
四、在經常需要根據範圍進行搜索的列上創建索引,因為索引已經排序,其指定的範圍是連續的;
五、在經常需要排序的列上創建索引,因為索引已經排序,這樣查詢可以利用索引的排序,加快排序查詢時間;
六、在經常使用在WHERE子句中的欄位上面建立索引,加快條件的判斷速度。
同樣,對於有些欄位不應該建立索引。一般來說,不應該建立索引的的這些欄位具有下列特點:
一,對於那些在查詢中很少使用或參考的欄位不應該建立索引。這是因為,既然這些列很少使用到,因此有索引或無索引,並不能提高查詢速度。相反,由於增加了索引,反而降低了系統的維護速度和增加了空間需求。
二,對於那些只有很少資料值的欄位也不應該增加索引。這是因為,由於這些列的值很少,例如人事表的性別列,在查詢的結果中,結果集的資料行佔了表中資料行的很大比例,即需要在表中搜尋的數據行的比例很大。增加索引,並不能明顯加快檢索速度。
三,對於那些定義為text, image和bit資料類型的欄位不應該增加索引。這是因為,這些列的資料量不是相當大,就是取值很少。
四,當修改效能遠大於檢索效能時,不應該建立索引。這是因為,修改效能和檢索效能是互相矛盾的。當增加索引時,會提高檢索效能,但是會降低修改效能。當減少索引時,會提高修改效能,降低檢索效能。因此,當修改效能遠大於檢索效能時,不應該建立索引。
根據資料庫的功能,可以在資料庫設計器中建立三種索引:唯一索引、主鍵索引和聚集索引。
唯一索引
唯一索引是不允許其中任何兩行具有相同索引值的索引。當現有資料中存在重複的鍵值時,大多數資料庫不允許將新建立的唯一索引與表格一起儲存。資料庫還可能防止新增將在表中建立重複鍵值的新資料。例如,如果在employee表中職員的姓(lname)上建立了唯一索引,則任何兩個員工都不能同姓。
主鍵索引
資料庫表常有一列或列組合,其值唯一標識表中的每一行。此列稱為表的主鍵。 在資料庫關係圖中為表定義主鍵將自動建立主鍵索引,主鍵索引是唯一索引的特定類型。此索引要求主鍵中的每個值都唯一。當在查詢中使用主鍵索引時,它還允許對資料的快速存取。
聚集索引
在聚集索引中,表中行的物理順序與鍵值的邏輯(索引)順序相同。一個表格只能包含一個聚集索引。如果某索引不是聚集索引,則表格中行的物理順序與鍵值的邏輯順序不符。與非聚集索引相比,聚集索引通常提供更快的資料存取速度。
以上就是MySql索引設計的內容,更多相關內容請關注PHP中文網(m.sbmmt.com)!