class="20989">
;
文件系統是用來管理和組織保存在磁盤驅動器上的數據的系統軟件,其實現了數據完整性的保證,也就是保證寫入磁盤的數據和隨後讀出的內容的一致性。除了保存以文件方式存儲的數據以外,一個文件系統同樣存儲和管理關於文件和文件系統自身的一些重要信息(例如:日期時間、屬主、訪問權限、文件大小和存儲位置等等)。這些信息通常被稱為元數據(metadata)。
由於為了避免磁盤訪問瓶頸效應,一般文件系統大都以異步方式工作,因此如果磁盤操作被突然中斷可能導致數據被丟失。例如如果出現這種情況:如果當你處理一個在linux的ext2文件系統上的文檔,突然機器崩潰會出現什麼情況?
有這幾種可能:
◆當你保存文件以後,系統崩潰。這是最好的情況,你不會丟失任何信息。只需要重新啟動計算機然後繼續工作。
◆在你保存文件之前系統崩潰。你會丟失你所有的工作內容,但是老版本的文檔還會存在。
◆當正在將保存的文檔寫入磁盤時系統崩潰。這是最糟的情況:新版文件覆蓋了舊版本的文件。這樣磁盤上只剩下一個部分新部分舊的文件。如果文件是二進制文件那麼就會出現不能打開文件的情況,因為其文件格式和應用所期待的不同。
在最後這種情況下,如果系統崩潰是發生在驅動器正在寫入元數據時,那麼情況可能更糟。這時候就是文件系統發生了損壞,你可能會丟失整個目錄或者整個磁盤分區的數據。
linux標准文件系統(ext2fs)在重新啟動時會通過調用文件掃描工具fsck試圖恢復損壞的元數據信息。由於ext2文件系統保存有冗余的關鍵元數據信息的備份,因此一般來說不大可能出現數據完全丟失。系統會計算出被損壞的數據的位置,然後或者是通過恢復冗余的元數據信息,或者是直接刪除被損壞或是元數據信息損毀的文件。
很明顯,要檢測的文件系統越大,檢測過程費時就越長。對於有幾十個G大小的分區,可能會花費很長時間來進行檢測。由於Linux開始用於大型服務器中越來越重要的應用,因此就越來越不能容忍長時間的當機時間。這就需要更復雜和精巧的文件系統來替代ext2。
因此就出現了日志式文件系統(journalling filesystems)來滿足這樣的需求。
什麼是日志式文件系統
這裡僅僅對日志式文件系統進行簡單的說明。如果需要更深入的信息請參考文章日志式文件系統,或者是日志式文件系統介紹。
大多數現代文件系統都使用了來自於數據庫系統中為了提高崩潰恢復能力而開發的日志技術。磁盤事務在被真正寫入到磁盤的最終位置以前首先按照順序方式寫入磁盤中日志區(或是log區)的特定位置。
根據日志文件系統實現技術的不同,寫入日志區的信息是不完全一樣的。某些實現技術僅僅寫文件系統元數據,而其他則會記錄所有的寫操作到日志中。
現在,如果崩潰發生在日志內容被寫入之前發生,那麼原始數據仍然在磁盤上,丟失的僅僅是最新的更新內容。如果當崩潰發生在真正的寫操作時(也就是日志內容已經更新),日志文件系統的日志內容則會顯示進行了哪些操作。因此當系統重啟時,它能輕易根據日志內容,很快地恢復被破壞的更新。
在任何一種情況下,都會得到完整的數據,不會出現損壞的分區的情況。由於恢復過程根據日志進行,因此整個過程會非常快只需要幾秒鐘時間。
應該注意的是使用日志文件系統並不意味著完全不需要使用文件掃描工具fsck了。隨機發生的文件系統的硬件和軟件錯誤是根據日志是無法恢復的,必須借助於fsck工具。
目前Linux環境下的日志文件系統
在下面的內容裡將討論三種日志文件系統:第一種是ext3,由Linux內核Stephen Tweedie開發。ext3是通過向ext2文件系統上添加日志功能來實現的,目前是redhat7.2的默認文件系統;Namesys開發的ReiserFs日志式文件系統,可以從www.namesys.com下載,目前Mandrake8.1采用該日志式文件系統。SGI在2001年三月發布了XFS日志式文件系統。可以在 oss.sgi.com/projects/xfs/下載。下面將對這三種日志文件系統采用不同的工具進行檢測和性能測試。
◆安裝ext3
關於ext3文件系統技術方面的問題請參考Dr. Stephen Tweedie的論文和訪談。ext3日志式文件系統直接來自於其祖先ext2文件系統。其具有完全向後兼容的關鍵特性,實際上其僅僅是在ext2日志式文件系統上添加了日志功能。其最大的缺點是沒有現代文件系統所具有的能提高文件數據處理速度和解壓的高性能。
ext3從 2.2.19開始是作為一個補丁方式存在的。如果希望對內核添加對ext3文件系統的支持,就需要使用補丁,可以從ftp.linux.org.uk/pub/linux/sct/fs/jfs或ftp.kernel.org/pub/linux/kernel/people/sct/ext3得到補丁程序,一共需要如下文件:
* ext3-0.0.7a.tar.bz2:內核補丁
* e2fsprogs-1.21-WIP-0601.tar.bz2 支持ext3的e2fsprogs程序套件
拷貝linux-2.2.19.tar.bz2和ext3-0.0.7a.tar.bz2到/usr/src目錄下,進行解壓:
mv linux linux-old
tar -Ixvf linux-2.2.19.tar.bz2
tar -Ixvf ext3-0.0.7a.tar.bz2
cd linux
cat ../ext3-0.0.7a/linux-2.2.19.kdb.diff | patch -sp1
cat ../ext3-0.0.7a/linux-2.2.19.ext3.diff | patch -sp1
首先對內核添加SGI的kdb內核調試器補丁,第二個是ext3文件系統補丁。下來就需要配置內核,對文件系統部分的"Enable Second extended fs development code"回答Yes。然後編譯。
內核編譯安裝以後,需要安裝e2fsprogs軟件套件:
tar -Ixvf e2fsprogs-1.21-WIP-0601.tar.bz2
cd e2fsprogs-1.21
./configure
make
make check
make install
下來要做的工作就是在分區上創建一個ext3文件系統,使用新內核重新啟動,這時候你有兩種選擇創建新的日志文件系統或者對一個已有的ext2文件系統升級到ext3日志文件系統。
對於需要創建新ext3文件系統的情況下,只需要使用安裝的e2fsprogs軟件包中的mke2fs命令加-f參數就可以創建新的ext3文件系統:
mke2fs -j /dev/xxx
這裡/dev/xxx是希望創建ext3文件系統的新分區。-j參數表示創建ext3而不是ext2文件系統。可以使用參數"-Jsize="來指定希望的日志區大小(n單位為M)。
升級一個已有的ext2,使用tune2fs就可以了:
tune2fs -j /dev/xxx
你可以對正在加載的文件系統和沒有加載的文件系統進行升級操作。如果當前文件系統正在被加載,則文件.journal會在文件系統加載點的所在目錄被創建。如果是升級一個當時沒有加載的文件系統,則使用隱含的系統inode來記錄日志,這時候文件系統的所有內容都會被保留不被破壞。
你可以使用下面的命令加載ext3文件系統:
mount -t ext3 /dev/xxx /mount_dir
由於ext3實際上是帶有日志功能的ext2文件系統 ,因此一個ext3文件系統可以以ext2的方式被加載。
◆安裝XFS文件系統
如果需要從技術方面了解XFS文件系統,請參考SGI的XFS文件系統和SGI信息頁面。也可以參考FAQ。
XFS是一個SGI開發的linux環境下的日志文件系統,它是一個成熟的技術,最初是使用在IRIX系統上的文件系統。XFS遵循GPL版權申明。目前xfs文件系統最新版本是1.02。可以http://linux-xfs.sgi.com/projects/xfs/102_release.html從下載得到對內核xfs文件系統支持補丁或者直接下載RPM包方式的內核,下面我們就以補丁方式說明如何對2.4.14內核使用xfs。首先下載如下內容
patch-2.4.14-xfs-1.0.2.bz2
patch-2.4.14-xfs-1.0.2-kdb.bz2
拷貝Linux內核linux-2.4.2.tar.bz2到 /usr/src目錄下,修改老的內核目錄名,然後解壓新內核:
mv linux linux-old
tar -Ixf inux-2.4.2.tar.bz2
拷貝每個每個補丁到內核源碼目錄下(例如:/usr/src/linux),並打補丁:
zcat patch-2.4.14-xfs-1.0.2.bz2 | patch -p1
zcat patch-2.4.14-xfs-1.0.2-kdb.bz2 | patch -p1
然後配置內核,打開文件系統部分的內核選項:"XFS filesystem support" (CONFIG_XFS_FS)和"Page Buffer support" (CONFIG_PAGE_BUF)。同時需要升級下面這些系統工具到下面或更高的版本:
modutils-2.4.0
autoconf-2.13
e2fsprogs-devel-1.18
安裝新內核並重啟服務器。
然後下載xfs工具。這個軟件包包括下面的命令來處理文件系統,使用下面的命令來安裝該軟件包::
tar -zxf xfsprogs-1.2.0.src.tar.gz
cd xfsprogs-1.2.0
make configure
make
make install
安裝這些命令以後,就可以創建新的XFS文件系統:
mkfs -t xfs /dev/xxx
如果xxx是一個已經存在的文件系統,那麼就需要使用"-f"參數來創建新分區,但是記得這將會破壞該分區的所有數據。
mkfs -t xfs -f /dev/xxx
創建以後就可以使用基於下面的命令加載新文件系統:
mount -t xfs /dev/xxx /mount_dir
◆安裝ReiserFS文件系統
如果希望更多地從技術方面了解reiserFS文件系統,請參考NAMESYS和FAQ。
ReiserFS文件系統從2.4.1-pre4開始就是Linux內核的正式支持的文件系統了。為了使用reiserFS文件系統那你首先需要在系統上安裝文件系統支持工具(如:創建ReiserFS文件系統的mkreiserfs工具)。最新的ReiserFS文件系統版本可以以補丁的方式添加到2.2.x或者2.4.x內核中。這裡我們以2.2.19為例:
第一步,首先下在內核源碼,並下在ReiserFS文件系統的2.2.19補丁 ,目前補丁最新版本是linux-2.2.19-reiserfs-3.5.34-patch.bz2。同時應該下載工具軟件包:reiserfsprogs-3.x.0j.tar.gz。
然後解壓內核源碼和補丁包到/usr/src中:
tar -Ixf linux-2.2.19.tar.bz2
bzcat linux-2.2.19-reiserfs-3.5.34-patch.bz2 | patch -p0
編譯內核支持reiserfs,安裝內核。然後安裝文件系統工具軟件:
cd /usr/src/linux/fs/reiserfs/utils
make
make install
安裝新內核並重新啟動。現在就可以創建新的reiserfs文件系統,並加載:
mkreiserfs /dev/xxxx
mount -t reiserfs /dev/xxx /mount_dir
◆文件系統性能測試
測試環境使用的計算機環境如下:Pentium III - 16 Mb RAM - 2 Gb HD,操作系統為RedHat6.