一、容錯(cuò)技術(shù)的意義
容錯(cuò)的含義比較寬泛,這種不確定性容易引發(fā)歧義,增加理解上的難度。從概念上來(lái)說(shuō),容錯(cuò)是指服務(wù)器對(duì)于錯(cuò)誤的容納能力,是應(yīng)用過(guò)程中對(duì)于服務(wù)器穩(wěn)定性追求的一個(gè)目標(biāo)。服務(wù)器的容錯(cuò)技術(shù)一般是指由于種種原因在系統(tǒng)中出現(xiàn)了數(shù)據(jù)、文件損壞或丟失時(shí),系統(tǒng)能夠自動(dòng)將這些損壞或丟失的文件和數(shù)據(jù)恢復(fù)到發(fā)生事故以前的狀態(tài),服務(wù)器還具備繼續(xù)工作的能力,使系統(tǒng)能夠連續(xù)正常運(yùn)行的一種技術(shù)。容錯(cuò)系統(tǒng)一般有兩種,既有因具備熱備份方案而允許出錯(cuò)的系統(tǒng),也有對(duì)出錯(cuò)非常敏感的系統(tǒng)。這里的“出錯(cuò)”既有人為因素,也有非人為原因。
雖然在一般情況下,信息系統(tǒng)的故障不會(huì)給企業(yè)運(yùn)作帶來(lái)什么影響,但在某些關(guān)鍵時(shí)刻,系統(tǒng)的故障就會(huì)給企業(yè)帶來(lái)不可挽回的影響和損失,這對(duì)醫(yī)院、報(bào)社、工廠、金融機(jī)構(gòu)等而言,尤其重要。容錯(cuò)技術(shù)的產(chǎn)生和應(yīng)用正是在這種客觀需求下應(yīng)運(yùn)而生的。容錯(cuò)技術(shù)的逐步成熟,使得具備容錯(cuò)功能的服務(wù)器具備了更高的可用性和可維護(hù)性,而且容錯(cuò)服務(wù)器還可以降低用戶(hù)的總體擁有成本,更多的企業(yè)開(kāi)始把目光從雙機(jī)熱備轉(zhuǎn)向了具有容錯(cuò)技術(shù)的服務(wù)器平臺(tái)。
具備容錯(cuò)技術(shù)的服務(wù)器是通過(guò)對(duì)服務(wù)器的關(guān)鍵部件采用冗余配置的模式,當(dāng)出現(xiàn)操作失誤或系統(tǒng)故障時(shí),服務(wù)器的容錯(cuò)機(jī)構(gòu)可以及時(shí)發(fā)現(xiàn)、及時(shí)補(bǔ)救所出現(xiàn)的系統(tǒng)故障,以保護(hù)文件、恢復(fù)并保持系統(tǒng)的正常運(yùn)行。而專(zhuān)業(yè)的容錯(cuò)服務(wù)器則能夠自動(dòng)分離故障模塊,在不中斷運(yùn)行的情況下,進(jìn)行模塊調(diào)換,對(duì)損壞的部件進(jìn)行維護(hù),并且在一切物理故障消除后,系統(tǒng)會(huì)自動(dòng)恢復(fù)同步運(yùn)行。容錯(cuò)服務(wù)器在“可靠性、可用性、可管理性、可維護(hù)性、可兼容性、可擴(kuò)展性”等設(shè)計(jì)方面得到了更好的保障。
二、如何保護(hù)服務(wù)器
在容錯(cuò)服務(wù)器領(lǐng)域,通常采用以下三種方式保護(hù)服務(wù)器,一是把兩臺(tái)服務(wù)器共享磁盤(pán)陣列柜做成集群,二是在兩臺(tái)服務(wù)器間安裝雙機(jī)容錯(cuò)軟件,三是單機(jī)容錯(cuò)。它們各自所對(duì)應(yīng)的容錯(cuò)級(jí)別也是從低到高的,也就是說(shuō),服務(wù)器群集技術(shù)容錯(cuò)級(jí)別最低,而單機(jī)容錯(cuò)技術(shù)級(jí)別最高。
(一)雙機(jī)熱備份技術(shù)所采用的是兩臺(tái)配置完全一樣的服務(wù)器系統(tǒng),操作系統(tǒng)的應(yīng)用程序安裝在兩臺(tái)服務(wù)器的本地系統(tǒng)盤(pán)上,整個(gè)網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)是通過(guò)磁盤(pán)整理集中管理和備份數(shù)據(jù)的。數(shù)據(jù)集中管理是通過(guò)雙機(jī)熱備份系統(tǒng),將所有站點(diǎn)的數(shù)據(jù)直接從中央存儲(chǔ)設(shè)備讀取和存儲(chǔ),并由專(zhuān)業(yè)人員進(jìn)行管理,保護(hù)了數(shù)據(jù)的安全性和保密性。
(二)單機(jī)容錯(cuò)服務(wù)器則是通過(guò)CPU時(shí)鐘鎖頻,通過(guò)對(duì)系統(tǒng)中所有硬件的備份,包括CPU、內(nèi)存和I/O總線等的冗余備份,通過(guò)系統(tǒng)內(nèi)所有冗余部件的同步運(yùn)行,實(shí)現(xiàn)真正意義上的容錯(cuò)。任何系統(tǒng)部件的故障都不會(huì)造成系統(tǒng)停頓和數(shù)據(jù)丟失。
(三)雙機(jī)熱備的容錯(cuò)模式和單機(jī)容錯(cuò)服務(wù)器的定位稍有不同,雙機(jī)熱備一般可以實(shí)現(xiàn)99.9%的可用性,單機(jī)容錯(cuò)卻可以實(shí)現(xiàn)99.999%的可用性。這樣,雙機(jī)熱備份大多應(yīng)用在業(yè)務(wù)連續(xù)性不是很?chē)?yán)格的行業(yè),比如公安系統(tǒng)或者個(gè)別的制造企業(yè),這些行業(yè)的應(yīng)用允許數(shù)據(jù)有一小段時(shí)間的中斷。而如電信、金融、證券和醫(yī)療等要求高的行業(yè)則是容錯(cuò)服務(wù)器的天下。
另外,雙機(jī)熱備容錯(cuò)方式由于至少需要2臺(tái)服務(wù)器,導(dǎo)致在軟件采購(gòu)(操作軟件、中間件、雙機(jī)備份軟件等)、系統(tǒng)維護(hù)升級(jí)、系統(tǒng)硬件升級(jí)都需要比單機(jī)容錯(cuò)方式多1倍的額外投入,而且在雙機(jī)熱備份軟件出現(xiàn)故障時(shí),其維修的難度較高,會(huì)給客戶(hù)帶來(lái)較大的困難。因此,雖然單機(jī)容錯(cuò)服務(wù)器的硬件成本高于雙機(jī)備份方式的硬件投入,而其總成本卻遠(yuǎn)遠(yuǎn)低于雙機(jī)備份方式的成本。
三、容錯(cuò)系統(tǒng)應(yīng)用
進(jìn)入21世紀(jì)以來(lái),制造、中小企業(yè)、能源、交通等領(lǐng)域?qū)Ψ⻊?wù)器,特別是中低端IA服務(wù)器的需求激增,過(guò)去僅僅可以應(yīng)用在RISC平臺(tái)、HP-UX環(huán)境下的容錯(cuò)產(chǎn)品也面臨著新的挑戰(zhàn)。另一方面,企業(yè)越來(lái)越依賴(lài)信息系統(tǒng)來(lái)完成關(guān)鍵業(yè)務(wù)的應(yīng)用,同時(shí)他們不可能配備更多的專(zhuān)業(yè)人員來(lái)進(jìn)行專(zhuān)職維護(hù)。雙機(jī)熱備、集群服務(wù)器遇到難題。尤其對(duì)24小時(shí)不間斷,長(zhǎng)期工作負(fù)責(zé)核心的服務(wù)系統(tǒng),需要具備容錯(cuò)服務(wù)。
在煉鋼的L2控制層當(dāng)中,采用的是四臺(tái)Stratus容錯(cuò)ftServer4300服務(wù)器,分別作為預(yù)處理、電路/轉(zhuǎn)爐、煉爐及連鑄數(shù)據(jù)庫(kù)服務(wù)器,容錯(cuò)服務(wù)器的二級(jí)PCS系統(tǒng)具備如下特征:
系統(tǒng)開(kāi)放性:容許哦服務(wù)器一般應(yīng)用的是工業(yè)行業(yè)標(biāo)準(zhǔn)設(shè)計(jì),系統(tǒng)具備良好的開(kāi)放性,采用的是RedHat Linux操作系統(tǒng),數(shù)據(jù)庫(kù)應(yīng)用的是oracle,今后軟件的移植、系統(tǒng)的升級(jí)均很方便。
系統(tǒng)的可靠性:容錯(cuò)服務(wù)器應(yīng)用部件級(jí)冗余,因此關(guān)鍵的核心組件都是冗余的,采用美國(guó)容錯(cuò)公司的專(zhuān)有的硬件時(shí)鐘同步技術(shù),冗余的容錯(cuò)硬件的部件在同一時(shí)鐘周期下執(zhí)行相同的運(yùn)算,在一個(gè)部件出現(xiàn)故障的情況下,其冗余部件就像激活了備份一樣,繼續(xù)正常工作;服務(wù)器系統(tǒng)的零切換時(shí)間保證了實(shí)時(shí)數(shù)據(jù)的完整性和可靠性,結(jié)合容錯(cuò)的故障安全軟件及主動(dòng)服務(wù)體系結(jié)構(gòu),從而保證了系統(tǒng)的99.999%的可用性。
經(jīng)過(guò)對(duì)于現(xiàn)有硬件平臺(tái)的分析,鋼鐵廠熱軋生產(chǎn)線二級(jí)過(guò)程控制系統(tǒng)與數(shù)據(jù)庫(kù)系統(tǒng)選用了Stratus ftServer容錯(cuò)系統(tǒng)。此系統(tǒng)應(yīng)用的是緊密封裝的機(jī)架或機(jī)柜配置,且第三代容錯(cuò)系統(tǒng)繼承了ftServer技術(shù)的可靠性,再加上精細(xì)的行業(yè)標(biāo)準(zhǔn)模塊化部件設(shè)計(jì),結(jié)合相關(guān)操作系統(tǒng)的可用性、高性能、安全特點(diǎn),這樣完全能夠滿足生產(chǎn)的需要。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:容錯(cuò)系統(tǒng)意義及其在鋼鐵廠的應(yīng)用分析
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083935704.html