MongoDB是一個基於分布式文件存儲的數據庫。由C++語言編寫。旨在為WEB應用提供可擴展的高性能數據存儲解決方案。
MongoDB 是一個介於關系數據庫和非關系數據庫之間的產品,是非關系數據庫當中功能最豐富,最像關系數據庫的。他支持的數據結構非常松散,是類似json的bson 格式,因此可以存儲比較復雜的數據類型。Mongo最大的特點是他支持的查詢語言非常強大,其語法有點類似於面向對象的查詢語言,幾乎可以實現類似關系數 據庫單表查詢的絕大部分功能,而且還支持對數據建立索引。
先 ps 一下看看。
總共 760G 多的虛擬內存,但是物理內存就只有 12.6G 。這個機器可是有 64G 內存的哦,這看起來 MongoDB 完全沒用多少內存嘛。
再看看 free 的結果。
復制代碼 代碼如下:內存倒是占得差不多了,基本都是 cached ,也就是文件系統緩存。MongoDB 是通過 mmap 方式讓操作系統來處理持久化和緩存的。每個數據文件都直接映射到某個虛擬內存地址。訪問的時候如果這一頁不在內存中,系統就會嘗試把這一頁加載進來。這些 內存都是算進 cache 裡的。在 mongodb 的官方文檔裡有這樣一個說法,top 或 ps 裡的 RSIZE 段顯示的是機器的全部內存大小,因為 mongodb 會盡可能占用全部內存。但是事實上,這些緩存並沒有算在裡面。因此在 top 或 ps 中是看不出 MongoDB 的實際內存使用情況的。而 free 雖然可以看到系統的內存使用情況,但是沒法確定這些內存裡究竟有多少真的是 MongoDB 使用的。
還好有人做了 vmtouch 這個工具。可以檢查文件在緩存中的情況,另外也可以把文件直接加載進緩存或者踢出去。只需要對 MongoDB 的所有數據文件檢查一下緩存加載情況,就可以知道 MongoDB 到底緩存了多少數據了。
復制代碼 代碼如下:這裡 -m4G 是 vmtouch 檢查的文件大小限制。MongoDB 的數據文件比較大,通常會超過默認的 500M。這樣看來,緩存用了 58G,這還差不多。Resident Pages 左側的數字是頁的數量,頁的數量乘以文件系統頁大小才是內存使用量。頁的大小可以通過
復制代碼 代碼如下:查看,通常是 4096,也就是 4KB。
MongoDB 在 NUMA 的機器上運行,並且內存被固定到一個 node 的時候,會有一個警告
復制代碼 代碼如下:也許是認為,這種情況下只能用上一個節點的內存。但 MongoDB 的緩存是由操作系統管理的。NUMA 似乎對此並沒有影響。而內存不太小的時候 MongoDB 本身很難用掉一個節點的內存。這種情況下,是否開啟 numactl –interleave=all 作用已經不大了。能做的也許只能是加內存,sharding,或者換 ssd 了。