萬盛學電腦網

 萬盛學電腦網 >> Linux教程 >> Beowulf 中文HOWTO

Beowulf 中文HOWTO

class="22031"> Jacek;Radajewski;and;Douglas;Eadline;
v1.1.1,;22;November;1998;


--------------------------------------------------------------------------------
這份文件介紹Beowulf超級電腦架構和對撰寫平行程式提供一些背景知識,並包括一些有趣的文件和網站連接。;
--------------------------------------------------------------------------------

--------------------------------------------------------------------------------

1.;前言
1.1;聲明;
我們將不對本文件中不正確的資訊,或者當使用後造成的損失負責。;



1.2;版權;
這份文件的版權Copyright;©;1997;-;1998屬於Jacek;Radajewski和Couglas;Eadline。並在GNU;General;Public;Licence允許下散布和修改本文件。;


1.3;有關這份HOWTO;
Jacek;Radajewski在1997年十一月開始編寫這份文件,很快地Douglas;Eadline也加入行列,幾個月後Beowulf;HOWTO變成長篇的文件,並在1998年八月分成三份,Beowulf;HOWTO、Beowulf;架構設計HOWTO;和Beowulf安裝管理;HOWTO。1998年十一月十一日Beowulf;HOWTO;1.0.0版本在Linux;文件計畫上發布,我們希望這只是完整的Beowulf;文件計畫的第一步。;


1.4;有關這些作者;

Jacek;Radajewski;網管人員,現正在澳洲南昆士蘭大學攻讀電腦科學。;Jacek於1995年第一次接觸Linux就深受吸引,他在1997年建立他自己的第一套;Beowulf電腦群,從那時起開始研究,經常想找到更新和更好的方法架設系統。;□可以透過電子郵件與他聯系;[email protected]。;
Douglas;Eadline;博士,也是美國Paralogic公司的董事長和主要科學家。原主修物理及分析化學,1978年建立個人第一台電腦用在化學儀器上,這才開始進入電腦的領域,Eadline博士現在興趣包括Linux,Beowulf電腦群和平行algorithms,□可以透過電子郵件與他聯系;[email protected];

1.5;答謝;
經過長時期的撰寫,最後終於完成,特別感謝以下朋友對本文件的幫忙和貢獻。;


Becky;的愛、支持和諒解。;
Tom;Sterling,;Don;Becker,;和在NASA;參與Beowulf計畫的朋友。;
Thanh;Tran-Cong;和架設topcat;Beowulf;機器的機械量測的教職員。;
提供許多建議的指導老師Christopher;Vance。;
我的朋友;Russell;Waldron;提供程式方面的點子和他熱心的參與及支持。;
我的朋友;David;Smith;的校稿。;
許多在Beowulf;mailing;list上的朋友提供的反應及建議。;
所有負責Linux作業系統和在topcat及其他Beowulf機器上使用軟體套件的朋友。;


--------------------------------------------------------------------------------
--------------------------------------------------------------------------------

2.;簡介

當容易取得的電腦和網路硬體的效能提升,並且價格不斷滑落,利用這些市面販售的電腦組裝成平行電腦就變得非常可行,而不需要花錢在價格高昂的超級電腦上。事實上Beowulf電腦的價格效能比是傳統超級電腦的三倍到十倍,Beowulf架構在scale上也不錯,它很容易建置,你只需負擔硬體設備的費用,而不須負擔軟體的費用。;


2.1;誰需要閱讀這份HOWTO?;
這份HOWTO是設計給對Linux作業系統有些認識的人,對於Beowulf技術、作業系統有深入的認識和網路概念的了解都不是必需的,但是對平行計算有些經驗是絕對有好處的(畢竟你總需要些藉口閱讀這份文件)。這份HOWTO文件無法回答Beowulf相關的所有問題,但是希望能提供一些想法,並且領導你走向正確的方向,這份文件的目的是提供相關的背景知識,和一些更深入的參考文件。;


2.2;什麽是Beowulf?;
Famed;was;this;Beowulf:;far;flew;the;boast;of;him,;son;of;Scyld,;in;the;Scandian;lands.;So;becomes;it;a;youth;to;quit;him;well;with;his;father's;friends,;by;fee;and;gift,;that;to;aid;him,;aged,;in;after;days,;come;warriors;willing,;should;war;draw;nigh,;liegemen;loyal:;by;lauded;deeds;shall;an;earl;have;honor;in;every;clan.;Beowulf是用英文書寫的最早史詩,描述一個擁有神力和勇氣的英雄人物□北歐武夫,和他力戰怪獸Grendel的故事,;參見;History;可以找到更多有關北歐武夫的事跡。;

Beowulf的定義可能和建造者或Beowulf超級電腦使用者一樣多,有些宣稱唯有和NASA原型機相同才稱為Beowulf,也有人認為只要在一群工作站上執行平行程式就可以稱為Beowulf。我對Beowulf的定義是介於二者之間,主要根據Beowulf;mailing;list上的一些張貼郵件。;


Beowulf是一種用來作平行計算的電腦群架構,通常是由一台伺服端和一台以上用戶端透過乙太網路或其他網路連接的系統,它是用市面販售的硬體(像是裝有Linux的個人電腦)、標准乙太網路卡和交換式集線器,它不包含任何特殊的硬體設備,是可以重新制造。Beowulf並且使用容易取得的軟體,如Linux作業系統、PVM(Parallel;Virtual;Machine)和MPI(Message;Passing;Interface)。伺服端控制整個電腦群,提供用戶端檔案服務,它並且也是電腦群的控制台和通訊閘,提供對外連接的出口。大型的Beowulf電腦群可能不只一台伺服端,可能有些電腦有特定用途,例如控制台或監視站,用戶端在大多數情況下是不做額外的事情,額外事情做的越少越好。用戶端是由伺服端規劃和控制,只做它們被分派的工作。在一個無硬碟用戶端的架構,用戶端甚至不必知道各自的IP位址或名稱,一直到伺服端告知為止。Beowulf和工作站群最大的差異點在於Beowulf看起來比較像一台機器,而不是許多台工作站。在大部分情形用戶端不需要備有鍵盤和螢幕,只需要透過遠端登入或序列式終端螢幕登入,Beowulf的用戶端可視為處理器和記憶體的組合,嵌入一個電腦群內,就像處理器或記憶體模組被嵌入主機板上。;



Beowulf不屬於特定軟體套件、嶄新的網路拓撲或是最新的核心駭客,Beowulf是一套串連Linux電腦成超級虛擬平行電腦的技術,雖然有許多的相關軟體套件,如修改過的核心、PVM和MPI程式庫以及規劃工具(可以讓Beowulf架構更快速、便捷地規劃系統),任何人也都可以只靠Linux標准套件,不需要額外的輔助就可以建立一套標准的Beowulf機器。假如你有二台已經上網的Linux電腦,並且可以透過NFS共用/home;檔案系統和執行rsh(remote;shells)指令,這樣你可以算是擁有一台簡單的雙節點Beowulf機器。;



2.3;分類;
Beowulf系統已經由各種不同部份組成,為了效能的考量,一些非商品化周邊設備(只由一家制造商生產)已經問世,為了易於解說和討論各種不同類型的系統,我們提出下列簡單的分類方式:;

第一類BEOWULF:;

這類機器完全由商品化、直接從市面上販售的零件所組成,我們用電腦購買者(Computer;Shopper)認定標准來定義商品化、直接從市面上販售的零件(電腦購買者是一種每月出版的雜志,有一英□厚,內容介紹各種電腦系統和零件目錄),認定標准如下:;

A;第一類Beowulf是一種機器,它的組成零件至少必須在三種國際性或全球性商業目錄上找到。;

第一類系統的好處有:;

硬體設備有很多來源(價格低、容易維護);
不會依賴特定一家硬體供應商;
Linux支援的驅動程式;
通常有一標准基礎(如SCSI、Ethernet等);
第一類系統的缺點有:;

需要第二類系統的硬體才有較好的效能;
第二類BEOWULF;

任何沒有通過電腦購買者認定標准的機器稱之。這並不一定是件壞事,它只是分類的一種。;

第二類系統的好處有:;

效能相當地好;
第二類系統的缺點有;:;

驅動程式的供應經常更換;
依賴特定一家硬體供應商;
可能比第一類系統昂貴;
沒有一種類別比其他的優秀,全憑使用者的需求和預算,這種分類純粹希望讓接下來的討論更加簡明,後頭的系統設計章節將會幫助你決定哪一種系統最符合你的要求。;






--------------------------------------------------------------------------------


--------------------------------------------------------------------------------

3.;架構簡介


3.1;它長什麽樣?;
我認為描述Beowulf超級電腦架構最合適的方法是舉一個真實的□例,並且是大多數系統管理者所熟悉的。那就是一個UNIX主機實驗室,內有一台伺服端和一群用戶端,更精准地說,我會舉位在南昆士蘭大學理學院DEC;Alpha大學部計算機實驗室為例,伺服器被稱為;beldin;用戶端機器分別稱為;scilab01,;scilab02,;scilab03,;一直到;scilab20.;每台用戶端內部都安裝Digital;Unix;4.0作業系統,但是使用者檔案空間(/home)和;/usr/local;都是透過NFS(網路檔案系統)從伺服端上獲得,每個用戶端都可以進入伺服端,並且所有其他的用戶端都會記載在;/etc/hosts.equiv;檔案內,因此每個用戶端都可以用遠端操作殼(rsh)。伺服端也是整個實驗室的NIS伺服器,因此所有的機器都有相同的帳號資料,某人可以坐在scilab02的控制台前登入,就像他登入伺服端或scilab15.;一樣有相同的環境,所有的用戶端有相同環境的原因在於所有的機器都安裝和規劃相同的作業系統,並且使用者的/home;和;/usr/local;區域實體上都位在伺服端上,可以透過NFS進入。NIS和NFS更進一步的訊息請參閱;NIS;和;NFS;HOWTOs.;



3.2;如何有效利用其他節點?;

現在我們對系統架構有些概念,讓我們看看如何使用計算機實驗室內可供使用的CPU。任何人可以登入任何一台機器,並且在每個人自己的目錄下執行程式,他們也可以透過遠端操作殼在其他電腦上啟動(spawn)相同的程
copyright © 萬盛學電腦網 all rights reserved