1引言
隨著信息技術(shù)的發(fā)展,艦船設(shè)計(jì)開(kāi)發(fā)逐步采用數(shù)字化技術(shù),通過(guò)三維設(shè)計(jì)軟件建立艦船的數(shù)字模型,加載環(huán)境、力學(xué)、機(jī)、電等信息,建立具有物理、功能和性能特性的虛擬樣機(jī),結(jié)合大量模型試驗(yàn)和實(shí)船試驗(yàn)得到的參數(shù),進(jìn)行CAE數(shù)字仿真分析,對(duì)產(chǎn)品進(jìn)行虛擬測(cè)試,取代部分物理樣機(jī)的試驗(yàn),驗(yàn)證艦船產(chǎn)品的性能,在此基礎(chǔ)上,建立包含設(shè)計(jì)、制造、運(yùn)行和維護(hù)整個(gè)艦船產(chǎn)品生命周期信息的虛擬樣機(jī),實(shí)現(xiàn)全過(guò)程數(shù)字化,縮短開(kāi)發(fā)和試驗(yàn)周期,實(shí)現(xiàn)柔性設(shè)計(jì)和敏捷制造,保證艦船產(chǎn)品的安全可靠,提高自主創(chuàng)新能力具有重要意義。
CAE技術(shù)在艦船結(jié)構(gòu)設(shè)計(jì)中得到廣泛應(yīng)用,對(duì)工程和產(chǎn)品進(jìn)行性能與安全可靠性分析,對(duì)其未來(lái)的工作狀態(tài)和運(yùn)行行為進(jìn)行模擬,及早發(fā)現(xiàn)設(shè)計(jì)缺陷,并證實(shí)未來(lái)工程、產(chǎn)品功能和性能的可用性與可靠性。特別是測(cè)試驗(yàn)證船舶總體和局部結(jié)構(gòu)強(qiáng)度、船舶總體和局部結(jié)構(gòu)振動(dòng)特性、結(jié)構(gòu)主要節(jié)點(diǎn)疲勞性能等,模型試驗(yàn)、實(shí)物試驗(yàn)與計(jì)算結(jié)合的,經(jīng)驗(yàn)方法和計(jì)算方法的結(jié)合,更正確的把握測(cè)試結(jié)果和方法。
大型快速遠(yuǎn)洋水面艦船,產(chǎn)生極大的波浪載荷和靜水載荷,需進(jìn)行結(jié)構(gòu)疲勞和斷裂分析;大型載機(jī)艦船,其飛機(jī)起降載荷復(fù)雜,瞬間沖擊力特別大,且起降形式不同,會(huì)產(chǎn)生高溫?zé)釕?yīng)力,承擔(dān)沖灘登陸任務(wù)艦船,遭遇碰撞、觸礁和擱淺,對(duì)其破壞程度后評(píng)估也是高度非線性問(wèn)題,另外,軍事艦船其特殊的使命,本身攜帶爆炸物、也易受各種空中、水面和水下爆炸物攻擊,研究艦船遭遇爆炸各種形式(艙內(nèi)爆炸、空中、水面和水下接觸和非接觸爆炸),預(yù)報(bào)其遭遇破壞程度,更是瞬間高度非線性問(wèn)題,需要用具有顯式積分方法解決的瞬態(tài)非線性程序;而對(duì)艦船極限承載力和生命力預(yù)報(bào)和評(píng)估、艦船各種武備如導(dǎo)彈、火炮發(fā)射的沖擊力等分析,也需要采用各種算法好、運(yùn)算速度快的高級(jí)非線性分析軟件;對(duì)于大型水面艦船設(shè)計(jì)都具有聲隱聲要求,其艦船的振動(dòng)及響應(yīng)、噪聲預(yù)報(bào)是一項(xiàng)關(guān)鍵技術(shù),艦船噪聲覆蓋聲學(xué)分析的底頻、中頻和高頻率空氣噪聲和機(jī)械噪聲,需要有完善的解決低、中和高頻率噪聲分析的系統(tǒng)軟件,由于聲源除了空氣和機(jī)械外,船舶動(dòng)力設(shè)備引起的船舶振動(dòng)和響應(yīng),螺旋槳激勵(lì)等也是主要產(chǎn)生噪聲源,也需要先用CFD軟件預(yù)報(bào)激勵(lì);整艦船進(jìn)行精細(xì)強(qiáng)度分析。
本文的目標(biāo)是建設(shè)一個(gè)公用的高性能計(jì)算支持平臺(tái),用來(lái)進(jìn)行建模與結(jié)構(gòu)分析及計(jì)算流體力學(xué)等方面的數(shù)值模擬,以滿足目前計(jì)算需要,同時(shí)考慮計(jì)算規(guī)模增加、新應(yīng)用程序引進(jìn)所帶來(lái)的擴(kuò)展性問(wèn)題。
2高性能計(jì)算平臺(tái)的選型要求
2.1強(qiáng)大的計(jì)算能力
本文所搭建的高性能計(jì)算平臺(tái)應(yīng)是一個(gè)復(fù)雜的高性能計(jì)算環(huán)境,這種計(jì)算環(huán)境不僅涉及專用計(jì)算軟件的性能、而且要涉及計(jì)算機(jī)系統(tǒng)的綜合運(yùn)算性能。
目前64位環(huán)境下處理軟件和硬件都已經(jīng)成熟,為了提高現(xiàn)有設(shè)備的處理能力,應(yīng)采用64位高性能集群以提供更高的計(jì)算能力。處理能力應(yīng)能滿足大規(guī)模網(wǎng)格點(diǎn)模型的結(jié)構(gòu)與流體分析,要求單CPU及計(jì)算服務(wù)器整體具有強(qiáng)大的運(yùn)算能力。
由于整個(gè)環(huán)境涉及面比較廣,在此僅以中央處理器(CPU)和內(nèi)存的選擇為例稍作展開(kāi)。
2.1.1處理器性能最大化原則
在引言需求中所列出的應(yīng)用領(lǐng)域存在一個(gè)現(xiàn)象,即很多作業(yè)的運(yùn)行時(shí)間很難通過(guò)增加所使用的處理器數(shù)量來(lái)減少。下面分別列出了ABAQUS和ANSYS在典型高性能計(jì)算機(jī)上不同個(gè)數(shù)處理器上運(yùn)行標(biāo)準(zhǔn)測(cè)試所花費(fèi)的時(shí)間。
表1 ABAQUS和ANSYS測(cè)試多處理器并行對(duì)照表
ABAQUS是典型的非線性有限元分析程序,從上表可以看出,即使使用4個(gè)CPU,也無(wú)法將計(jì)算時(shí)間縮短至只使用一個(gè)CPU時(shí)的50%。而ANSYS多處理器并行的效率更差。
即使在計(jì)算流體動(dòng)力學(xué)應(yīng)用中(例如Fluent),作業(yè)運(yùn)行時(shí)間也嚴(yán)重受限于計(jì)算網(wǎng)格數(shù)的大小,下表選擇了三個(gè)不同規(guī)模的Fluent標(biāo)準(zhǔn)測(cè)試考察多處理器并行時(shí)的加速效果。
表2 Fluent測(cè)試多處理器并行對(duì)照表
分頁(yè)
可見(jiàn)在三個(gè)例題之中只有網(wǎng)格數(shù)達(dá)到847,000的戰(zhàn)斗機(jī)跨音速外流計(jì)算才能保證直到8個(gè)處理器都可以獲得比較理想的加速比。換句話說(shuō),如果解題規(guī);蛭矬w外形達(dá)不到上題的復(fù)雜程度,使用超過(guò)8個(gè)處理器進(jìn)行并行運(yùn)算是沒(méi)有必要的。
分析以上數(shù)據(jù)我們可以得出結(jié)論,若要提高工作效率,縮短作業(yè)的運(yùn)行時(shí)間或者在一定的時(shí)間內(nèi)運(yùn)行更多的作業(yè)或更復(fù)雜的作業(yè),首先應(yīng)該盡可能提高單處理器的性能。也就是說(shuō),由8個(gè)相對(duì)性能為l的處理器構(gòu)造的高性能計(jì)算系統(tǒng)不如使用由4個(gè)相對(duì)性能為2的處理器組成的高性能計(jì)算系統(tǒng)的使用效果好,理想狀態(tài)下對(duì)兩個(gè)4 CPU的作業(yè)它們的性能是一樣的,而對(duì)于一個(gè)4CPU作業(yè)來(lái)講后者只需前者一半的時(shí)間就可完成作業(yè)。
選擇性能盡可能高的處理器還有另一個(gè)好處,就是在得到同樣的運(yùn)行效率的前提下,在應(yīng)用軟件許可證上的花費(fèi)更少。
因此,我們?cè)谠O(shè)計(jì)本高性能計(jì)算平臺(tái)時(shí)首先確定的原則就是處理器性能最大化的原則。
2.1.2內(nèi)存的設(shè)計(jì)
在進(jìn)行了數(shù)項(xiàng)應(yīng)用的標(biāo)準(zhǔn)測(cè)試之后,我們得出,在系統(tǒng)中為每個(gè)處理器配置4GB以上內(nèi)存即可獲得滿意的效果,另外,需采用盡可能高速的內(nèi)存,以獲得盡可能大的內(nèi)存帶寬。
2.2高性能I/O
本文所搭建的高性能計(jì)算平臺(tái)應(yīng)是一個(gè)要求采用最新技術(shù)解決專業(yè)應(yīng)用的復(fù)雜的生產(chǎn)系統(tǒng),由于其本身應(yīng)用的特點(diǎn)要求整套計(jì)算機(jī)系統(tǒng)運(yùn)行必須穩(wěn)定、技術(shù)必須成熟。這種運(yùn)行穩(wěn)定性包括計(jì)算機(jī)系統(tǒng)與專業(yè)軟件系統(tǒng)之間的配合、I/O系統(tǒng)與存儲(chǔ)系統(tǒng)之間的穩(wěn)定性、計(jì)算機(jī)系統(tǒng)本身的技術(shù)成熟性等諸多內(nèi)容。在運(yùn)行過(guò)程中,每個(gè)作業(yè)需要約數(shù)十GB的存儲(chǔ)空間存放中間臨時(shí)文件,并對(duì)這些臨時(shí)文件進(jìn)行頻繁的讀寫操作,因而對(duì)系統(tǒng)的I/O性能提出要求較高。
實(shí)踐證明,以NASTRAN為代表的部分應(yīng)用的性能與系統(tǒng)的磁盤I/0性能有極大的關(guān)系,正確設(shè)計(jì)磁盤系統(tǒng)消除I/0瓶頸后,其性能甚至可有幾倍的提高。因此我們?cè)谠O(shè)計(jì)本系統(tǒng)中將保證磁盤I/O性能與系統(tǒng)計(jì)算性能相匹配,其設(shè)計(jì)手法為磁盤I/0的并行化(硬件)和采用并行文件系統(tǒng)(軟件)。
并行I/0的一個(gè)額外好處是透明的文件緩存機(jī)制可以消除交互用戶在后臺(tái)有大量批量作業(yè)I/0產(chǎn)生時(shí)出現(xiàn)的長(zhǎng)響應(yīng)時(shí)間,為交互客戶提供了更友善的使用和更高的服務(wù)質(zhì)量。
2.3強(qiáng)大的資源管理和作業(yè)調(diào)度功能
高性能計(jì)算機(jī)除了具有處理超大規(guī)模的計(jì)算任務(wù)外,還應(yīng)有支持多用戶、多作業(yè)的能力。這就要求系統(tǒng)具有強(qiáng)大的資源管理和作業(yè)調(diào)度功能,以充分、高效地使用計(jì)算機(jī)資源。系統(tǒng)管理員可以根據(jù)應(yīng)用的具體需求制定管理規(guī)則,實(shí)現(xiàn)作業(yè)的自動(dòng)調(diào)度、優(yōu)先級(jí)管理,用戶的資源分配等復(fù)雜的功能。
2.4作業(yè)的斷點(diǎn)/續(xù)算(Checkpoint/Restart)功能
當(dāng)運(yùn)行較大規(guī)模的計(jì)算作業(yè)時(shí),一個(gè)題目可能會(huì)運(yùn)行幾天甚至幾個(gè)星期。如果在此期間需要做系統(tǒng)維護(hù),或因有一個(gè)緊急的計(jì)算任務(wù)需要盡快完成,而必須停止其它正在運(yùn)行的題目,那么某些應(yīng)用程序就會(huì)被中斷。如果這些應(yīng)用程序本身沒(méi)有保存中間結(jié)果的功能,或保存中間結(jié)果的時(shí)間間隔較長(zhǎng),那么停機(jī)會(huì)給用戶造成不必要的時(shí)間浪費(fèi)。為此,要求系統(tǒng)具有完善的斷點(diǎn)/續(xù)算(Checkpoint/Restart)的功能,提供自動(dòng)或手工為應(yīng)用程序保存中間計(jì)算結(jié)果,在系統(tǒng)停機(jī)/重新啟動(dòng)后盡快恢復(fù)從斷點(diǎn)處繼續(xù)計(jì)算,減少了時(shí)間損失。同時(shí)應(yīng)該提供作業(yè)掛起功能,可以將不關(guān)鍵的作業(yè)掛起而并不殺掉進(jìn)程,為緊急的計(jì)算任務(wù)空出資源,待該任務(wù)完成后恢復(fù)計(jì)算。
2.5系統(tǒng)擴(kuò)展能力
隨著研究與業(yè)務(wù)的發(fā)展,原有應(yīng)用程序的計(jì)算規(guī)模會(huì)越來(lái)越犬,同時(shí)還會(huì)有新的應(yīng)用運(yùn)行在高性能計(jì)算系統(tǒng)上。當(dāng)現(xiàn)有的系統(tǒng)不能滿足計(jì)算要求時(shí),就涉及到系統(tǒng)擴(kuò)展問(wèn)題。系統(tǒng)擴(kuò)展不應(yīng)該僅僅是硬件或計(jì)算能力的增加,它要求新增系統(tǒng)能充分地融合到現(xiàn)有的系統(tǒng)中,并仍能充分利用老的計(jì)算系統(tǒng),以保護(hù)投資。
分頁(yè)
3平臺(tái)架構(gòu)的搭建
根據(jù)以上需求分析,核心設(shè)計(jì)系統(tǒng)架構(gòu)將如下圖所示:
圖1核心設(shè)計(jì)系統(tǒng)架構(gòu)圖
其中CAD系統(tǒng)將運(yùn)行在圖形服務(wù)器(或工作站)上,不同的設(shè)計(jì)人員將采用其獨(dú)自的系統(tǒng)。CAE系統(tǒng)同樣運(yùn)行在圖形服務(wù)器(或工作站)上,但由于CAE的計(jì)算量巨大,因此核心處理和計(jì)算將運(yùn)行在高性能計(jì)算集群平臺(tái)上。CAD和CAE的數(shù)據(jù)可存放在其系統(tǒng)存儲(chǔ)上,如果采用了PDM管理平臺(tái),CAD和CAE的數(shù)據(jù)將通過(guò)PDM系統(tǒng)存放在由PDM系統(tǒng)所管理的存儲(chǔ)服務(wù)器中,從而使數(shù)據(jù)得到更好的管理和應(yīng)用。
從系統(tǒng)平臺(tái)的選擇上來(lái)看,對(duì)于負(fù)責(zé)CAE系統(tǒng)核心處理和計(jì)算高性能計(jì)算的服務(wù)器集群,我們采用由4個(gè)高性能計(jì)算服務(wù)器節(jié)點(diǎn)組成的服務(wù)器集群,4個(gè)高性能節(jié)點(diǎn)將通過(guò)統(tǒng)一的高性能交換機(jī)進(jìn)行連接、數(shù)據(jù)交換和溝通。對(duì)于PDM應(yīng)用服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器,由于其重要性和對(duì)可靠性的要求,可采用不同的服務(wù)器來(lái)運(yùn)行,運(yùn)行應(yīng)用系統(tǒng)的服務(wù)器和運(yùn)行數(shù)據(jù)庫(kù)系統(tǒng)的服務(wù)器將組成HACMP高可靠性集群來(lái)保證服務(wù)器的高可靠性和可服務(wù)性。PDM系統(tǒng)的數(shù)據(jù)(包括CAD和CAE的數(shù)據(jù))將被存儲(chǔ)在集中的存儲(chǔ)服務(wù)器中,PDM數(shù)據(jù)庫(kù)將通過(guò)SAN網(wǎng)絡(luò)來(lái)將數(shù)據(jù)保存到SAN存儲(chǔ)服務(wù)器上。
SAN存儲(chǔ)服務(wù)器上將分配不同的存儲(chǔ)區(qū)域存儲(chǔ)不同應(yīng)用的數(shù)據(jù),如存放PDM數(shù)據(jù)的存儲(chǔ)空間和存放OA數(shù)據(jù)的存儲(chǔ)空間。當(dāng)然,如果CAB應(yīng)用和CAE應(yīng)用如果有數(shù)據(jù)需不通過(guò)PDM
而直接存放在本地的,則也可以通過(guò)加裝光纖卡來(lái)實(shí)現(xiàn)存放于SAC存儲(chǔ)服務(wù)器上。此外,由于對(duì)數(shù)據(jù)的可靠性要求很高,建議另外設(shè)置一個(gè)存儲(chǔ)服務(wù)器作為工作存儲(chǔ)服務(wù)器的備份。2個(gè)存儲(chǔ)服務(wù)器之間將通過(guò)鏡像方式實(shí)現(xiàn)數(shù)據(jù)的同步復(fù)制,即任何存放在工作存儲(chǔ)服務(wù)器上的重要數(shù)據(jù)將被同步拷貝到另外一個(gè)存儲(chǔ)服務(wù)器上。這樣的話,即使將來(lái)工作存儲(chǔ)服務(wù)器發(fā)生問(wèn)題時(shí),所有的數(shù)據(jù)在備份存儲(chǔ)服務(wù)器上都有備份。再加上磁帶庫(kù)備份,人大降低了數(shù)據(jù)丟失的風(fēng)險(xiǎn)。
圖2高性能計(jì)算平臺(tái)架構(gòu)圖
4結(jié)束語(yǔ)
作為高性能計(jì)算應(yīng)用的主要領(lǐng)域之一,艦船設(shè)計(jì)領(lǐng)域人量采用了CAE和CAD技術(shù),對(duì)計(jì)算機(jī)系統(tǒng)的達(dá)算性能、運(yùn)行穩(wěn)定性有著很高的要求。隨著新技術(shù)的不斷推出,如何升級(jí)完善高性能計(jì)算平臺(tái)的話題也會(huì)不斷地被提出。然而高性能計(jì)算平臺(tái)的構(gòu)建并沒(méi)有一個(gè)絕對(duì)的模式,評(píng)價(jià)它成功與否的標(biāo)準(zhǔn)還在于是否滿足自身的實(shí)際需求。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:高性能計(jì)算平臺(tái)架構(gòu)搭建之淺見(jiàn)
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112154353.html