MongoDB中的索引其實類似於關系型數據庫,都是為了提高查詢和排序的效率的,並且實現原理也基本一致。由於集合中的鍵(字段)可以是普通數據 類型,也可以是子文檔。MongoDB可以在各種類型的鍵上創建索引。下面分別講解各種類型的索引的創建,查詢,以及索引的維護等。
一、創建索引
1. 默認索引
MongoDB有個默認的“_id”的鍵,他相當於“主鍵”的角色。集合創建後系統會自動創建一個索引在“_id”鍵上,它是默認索引,索引名叫“_id_”,是無法被刪除的。我們可以通過以下方式查看:
復制代碼 代碼如下:
var _idIndex = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_id_");
Console.WriteLine(_idIndex);
2. 單列索引
在單個鍵上創建的索引就是單列索引,例如我們要在“UserInfo”集合上給“UserName”鍵創建一個單列索引,語法如下:(1表示正序,-1逆序)
復制代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "UserName", 1 } }, false);
接著,我們用同樣方法查找名為“_UserName_”的索引
復制代碼 代碼如下:
var _UserName_Index = mongoCollection.Metadata.Indexes.Single(x => x.Key == "_UserName_");
Console.WriteLine(_UserName_Index);
3.組合索引
另外,我們還可以同時對多個鍵創建組合索引。如下代碼創建了按照“UserId”正序,“UserName”逆序的組合索引:
復制代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 }, { "UserName", -1 } }, false);
4.子文檔索引
我們可以對文檔類型的鍵創建各種索引,例如單列索引,如下創建用戶詳細信息“Detail”的單列索引:
復制代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "Detail", 1 } }, false);
對子文檔的鍵創建組合索引:例如在“Detail.Address”和“Detail.Age”上創建組合索引:
復制代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "Detail.Address", 1 }, { "Detail.Age", -1 } }, false);
5.唯一索引
唯一索引限制了對當前鍵添加值時,不能添加重復的信息。值得注意的是,當文檔不存在指定鍵時,會被認為鍵值是“null”,所以“null”也會被認為是重復的,所以一般被作為唯一索引的鍵,最好都要有鍵值對。
對“UserId”創建唯一索引(這時候最後一個參數為“true”):
復制代碼 代碼如下:
mongoCollection.Metadata.CreateIndex(new Document { { "UserId", 1 } }, true);
二、維護索引
1. 查詢索引
通過索引名查詢的方式已有介紹。但有時候,我們可能忘記了索引名,怎麼查詢呢?
下面提供一個遍歷全部索引的方法,打印全部索引信息:
復制代碼 代碼如下:
foreach (var index in mongoCollection.Metadata.Indexes)
{
Console.WriteLine(index.Value);
}
輸出結果示例:
復制代碼 代碼如下:
{ "name": "_id_", "ns": "myDatabase.UserInfo", "key": { "_id": 1 } }
{ "name": "_UserId_unique_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1 }, "unique": true, "_id": "4d8f406ab8a4730b78000005" }
{ "name": "_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserName": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000006" }
{ "name": "_Detail.Address_Detail.Age_", "ns": "myDatabase.UserInfo", "key": { "Detail.Address": 1, "Detail.Age": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000007" }
{ "name": "_UserId_UserName_", "ns": "myDatabase.UserInfo", "key": { "UserId": 1, "UserName": -1 }, "unique": false, "_id": "4d8f406ab8a4730b78000008" }
{ "name": "_Detail_", "ns": "myDatabase.UserInfo", "key": { "Detail": 1 }, "unique": false, "_id": "4d8f406ab8a4730b78000009" }
可見,集合的索引也是通過一個集合來維護的。name表示索引名,ns表示索引屬於哪個庫哪個集合,key表示索引在哪個鍵上,正序還是逆序,unique表示是否為唯一索引,等等...
2. 刪除索引
新手常陷入的誤區是,認為集合被刪除,索引就不存在了。關系型數據庫中,表被刪除了,索引也不會存在。在MongoDB中不存在刪除集合的說法,就算集合數據清空,索引都是還在的,要移除索引還需要手工刪除。
例如,刪除名為“_UserName_”的索引:
復制代碼 代碼如下:
mongoCollection.Metadata.DropIndex("_UserName_");
下面提供刪除除默認索引外其他全部索引的方法:
復制代碼 代碼如下:
public void DropAllIndex()
{
var listIndexes = mongoCollection.Metadata.Indexes.ToList();
for (int i = 0; i < listIndexes.Count; i++)
{
if (listIndexes[i].Key != "_id_")
{
mongoCollection.Metadata.DropIndex(listIndexes[i].Key);
}
}
}
三、索引的效率
MongoDB的索引到底能不能提高查詢效率呢?我們在這裡通過一個例子來測試。比較同樣的數據在無索引和有索引的情況下的查詢速度。
首先,我們通過這樣一個方法插入10W條數據:
復制代碼 代碼如下:
public void InsertBigData()
{
var random = new Random();
for (int i = 1; i < 100000; i++)
{
Document doc = new Document();
doc["ID"] = i;
doc["Data"] = "data" + random.Next(100000);
mongoCollection.Save(doc);
}
Console.WriteLine("當前有" + mongoCollection.FindAll().Documents.Count() + "條數據");
}
然後,實現一個方法用來創建索引:
復制代碼 代碼如下:
public void CreateIndexForData()
{
mongoCollection.Metadata.CreateIndex(new Document { { "Data", 1 } }, false);
}
還有排序的方法:
復制代碼 代碼如下:
public void SortForData()
{
mongoCollection.FindAll().Sort(new Document { { "Data", 1 } });
}
運行測試代碼如下:
復制代碼 代碼如下:
static void Main(string[] args)
{
IndexBLL indexBll = new IndexBLL();
indexBll.DropAllIndex();
indexBll.DeleteAll();
indexBll.InsertBigData();
Stopwatch watch1 = new Stopwatch();
watch1.Start();
for (int i = 0; i < 1; i++) indexBll.SortForData();
Console.WriteLine("無索引排序執行時間:" + watch1.Elapsed);
indexBll.CreateIndexForData();
Stopwatch watch2 = new Stopwatch();
watch2.Start();
for (int i = 0; i < 1; i++) indexBll.SortForData();
Console.WriteLine("有索引排序執行時間:" +