ISO22301認證好處
ISO22301管理體系認證是指根據(jù)國際標準組織(InternationalOrganizationforStandardization)制定的ISO22301:2019標準,由第三方認證機構(gòu)對組織的業(yè)務(wù)連續(xù)性管理體系進行審核和認證的過程。
這一體系是為了確保組織在面臨各種內(nèi)外部風險和威脅時能夠持續(xù)提供產(chǎn)品和服務(wù),并在緊急情況下迅速恢復(fù)正常運營。
進行ISO22301管理體系認證可以帶來以下幾個方面的益處:1.提高組織的競爭力:通過ISO22301認證,組織能夠向客戶和合作伙伴展示其業(yè)務(wù)連續(xù)性管理能力的可靠性和有效性,增強其市場競爭力。
2.保護組織的聲譽:一旦面臨重大突發(fā)事件,組織能夠更好地應(yīng)對并減少潛在的負面影響,保障組織的聲譽和形象。
3.確保業(yè)務(wù)連續(xù)性:ISO22301要求組織制定和實施業(yè)務(wù)連續(xù)性計劃,以確保在緊急情況下能夠持續(xù)提供產(chǎn)品和服務(wù)。
通過認證,組織可以評估和提升自身的業(yè)務(wù)連續(xù)性能力,有效減少生產(chǎn)中斷風險。
4.提高員工的意識和準備度:ISO22301管理體系認證要求組織進行員工培訓和演練,以提高員工對突發(fā)事件的應(yīng)對能力和緊急情況下的行動準備度。
5.減少損失和風險:認證能夠使組織更加關(guān)注風險管理和業(yè)務(wù)連續(xù)性規(guī)劃,降低突發(fā)事件對組織造成的損失,減少因災(zāi)害而導(dǎo)致的業(yè)務(wù)中斷和經(jīng)濟損失。
6.符合法律法規(guī)和合同要求:通過ISO22301認證,組織能夠滿足相關(guān)法律法規(guī)和合同對業(yè)務(wù)連續(xù)性的要求,避免違規(guī)行為帶來的法律風險。
ISO22301管理體系認證是當前企業(yè)不可忽視的重要認證之一。
認證不僅能夠提升組織的競爭力和聲譽,還能夠保障業(yè)務(wù)連續(xù)性,減少損失和風險,同時也能夠使組織更好地符合法律法規(guī)和合同要求。
對于企業(yè)來說,獲得ISO22301認證將是一項長期而持續(xù)的努力,但也將帶來深遠的積極影響。
業(yè)務(wù)連續(xù)性管理包含主要工作階段
業(yè)務(wù)連續(xù)性管理大家并不陌生,聽的很多,但真正落地的時候發(fā)現(xiàn)很多規(guī)范、標準中都涉及業(yè)務(wù)連續(xù)性,無論是ITIL4、ISO22301-2019、GBT30146-2013、ISO27001等標準中都是專門或者有獨立的模塊講解業(yè)務(wù)連續(xù)性的。因此,只有真正理解了業(yè)務(wù)連續(xù)性的核心目標或期望解決的問題后才能夠撥開迷霧,真正理解或落地業(yè)務(wù)連續(xù)性。這篇文章期望能夠?qū)I(yè)務(wù)連續(xù)性的概念、定義和不同標準/規(guī)范中的區(qū)別做一個整理,以幫助業(yè)務(wù)連續(xù)性能夠更好的落地。
一、業(yè)務(wù)連續(xù)性的本質(zhì)
業(yè)務(wù)連續(xù)性管理(BCM)是一個框架,它包括風險識別和控制的過程,以確保一個組織在面對潛在的威脅時能夠持續(xù)運作。這些威脅可以是自然災(zāi)害、技術(shù)故障、恐怖主義行為、電力故障等。BCM的目標是減少這些威脅對業(yè)務(wù)運營的影響,并確保關(guān)鍵業(yè)務(wù)功能在危機發(fā)生后能夠迅速恢復(fù)。
從這個定義我們可以看出,業(yè)務(wù)連續(xù)性不僅針對IT業(yè)務(wù),其實企業(yè)多有業(yè)務(wù)都可能面臨不連續(xù)的情況。因此,業(yè)務(wù)連續(xù)性其實分為針對IT業(yè)務(wù)的和針對企業(yè)運營的。本文我們僅介紹針對IT業(yè)務(wù)的業(yè)務(wù)連續(xù)性管理。
二、與業(yè)務(wù)連續(xù)性相關(guān)標準與規(guī)范
服務(wù)連續(xù)性管理(ITIL4)
服務(wù)連續(xù)性管理(ITIL4):服務(wù)連續(xù)性管理實踐的目的是確保在出現(xiàn)災(zāi)難時保持服務(wù)可用性并維持足夠性能。該實踐提供了一個 建立組織彈性的框架和產(chǎn)生有效反應(yīng)的能力,可保障關(guān)鍵利益相關(guān)者的利益,以及組織的聲譽、品牌和價值創(chuàng)造活動。
概念:服務(wù)連續(xù)性(ITIL4)
是指在災(zāi)難事態(tài)或破壞性事件發(fā)生后,服務(wù)提供者以可接受的預(yù)定義級別繼續(xù)服務(wù)運營的能力。
服務(wù)連續(xù)性管理通過確保 IT 和服務(wù)可以在災(zāi)難或危機后所需的商定業(yè)務(wù)時間范圍內(nèi)恢復(fù),從而支持整體業(yè)務(wù)連續(xù)性管理 (BCM) 和規(guī)劃能力。當服務(wù)中斷或組織風險發(fā)生的規(guī)模大于組織通過正常響應(yīng)和恢復(fù)實踐(如事件和重大事件管理)處理它們的能力時,就會觸發(fā)該實踐。這種大規(guī)模的組織事態(tài)通常稱為災(zāi)難。
每個組織都需要了解在自身的環(huán)境中什么是災(zāi)難。在觸發(fā)事件之前,必須使用業(yè)務(wù)影響分析,在組織層面和 每個服務(wù)級別上考慮和定義災(zāi)難的含義。
業(yè)務(wù)連續(xù)性(BCM:ISO22301-2019)
業(yè)務(wù)連續(xù)性管理ISO標準的描述相對比較晦澀,但是在2011年發(fā)布過一個《商業(yè)銀行業(yè)務(wù)連續(xù)性監(jiān)管指引》中對業(yè)務(wù)連續(xù)性的要求基本符合ISO的要求,但理解和落地性比較好,本文我們引用了其中的內(nèi)容:
業(yè)務(wù)連續(xù)性管理:是指商業(yè)銀行為有效應(yīng)對重要業(yè)務(wù)運營中斷事件,建設(shè)應(yīng)急響應(yīng)、恢復(fù)機制和管理能力框架,保障重要業(yè)務(wù)持續(xù)運營的一整套管理過程,包括策略、組織架構(gòu)、方法、標準和程序。
重要業(yè)務(wù):是指面向客戶、涉及賬務(wù)處理、時效性要求較高的銀行業(yè)務(wù),其運營服務(wù)中斷會對商業(yè)銀行產(chǎn)生較大經(jīng)濟損失或聲譽影響,或?qū)?、法人和其他組織的權(quán)益、社會秩序和公共利益、國家安全造成嚴重影響的業(yè)務(wù)。
重要業(yè)務(wù)運營中斷事件(以下簡稱運營中斷事件)是指因下述原因?qū)е滦畔⑾到y(tǒng)服務(wù)異常、重要業(yè)務(wù)停止運營的事件。主要包括:
(一)信息技術(shù)故障:信息系統(tǒng)技術(shù)故障、配套設(shè)施故障;
(二)外部服務(wù)中斷:第三方無法合作或提供服務(wù)等;
(三)人為破壞:黑客攻擊、恐怖襲擊等;
(四)自然災(zāi)害:火災(zāi)、雷擊、海嘯、地震、重大疫情等。
業(yè)務(wù)連續(xù)性管理需要做的事情:
確定重要業(yè)務(wù)及其恢復(fù)目標,
制定業(yè)務(wù)連續(xù)性計劃,
配置必要的資源,
有效處置運營中斷事件,
積極開展演練
業(yè)務(wù)連續(xù)性管理的評估改進。
三、業(yè)務(wù)連續(xù)性的核心概念定義
災(zāi)難
ISO將災(zāi)難定義為“一種具有高度不確定性的情況,這種情況會破壞核心業(yè)務(wù)和/或組織的信譽,并需要緊急行動??梢酝ㄋ桌斫鉃橐环N突發(fā)的計劃外事態(tài),可給組織造成巨大損害或重大損失。災(zāi)難會導(dǎo)致組織在某些預(yù)定最短時間段內(nèi)無法履行重要的業(yè)務(wù)功能. 如:供應(yīng)鏈故障、恐怖主義、天氣、網(wǎng)絡(luò)攻擊、衛(wèi)生緊急情況、政治或經(jīng)濟事件、技術(shù)故障、公共危機。
RTO (Recovery Time Objective)
定義:RTO 是指從業(yè)務(wù)流程中斷到恢復(fù)到可接受的服務(wù)水平所需的最大時間。
示例:假設(shè)一個在線零售商店的網(wǎng)站發(fā)生了故障。如果他們確定RTO為4小時,這意味著他們需要在4小時內(nèi)恢復(fù)網(wǎng)站的正常運行,以避免更大的業(yè)務(wù)損失。如何定義:RTO的定義通常基于以下因素:
業(yè)務(wù)對停機時間的容忍度。
潛在的經(jīng)濟損失。
客戶和合同方面的義務(wù)。
法規(guī)和合規(guī)要求。
RPO (Recovery Point Objective)
定義:RPO 是指在發(fā)生中斷事件后,可以接受數(shù)據(jù)丟失的最大時間段。
示例:繼續(xù)上面的在線零售商店的例子,如果他們確定RPO為30分鐘,這意味著他們可以接受最近30分鐘內(nèi)的數(shù)據(jù)丟失(例如,最近30分鐘的訂單)。因此,他們的備份策略可能需要每30分鐘備份一次數(shù)據(jù)。如何定義:RPO的定義通?;谝韵乱蛩兀?/p>
業(yè)務(wù)對數(shù)據(jù)丟失的容忍度。
數(shù)據(jù)的價值和重要性。
法規(guī)和合規(guī)要求。
在確定RTO和RPO時,關(guān)鍵是進行全面的業(yè)務(wù)影響分析(BIA),了解各個業(yè)務(wù)流程和系統(tǒng)的重要性,并與相關(guān)的利益相關(guān)者進行溝通。這樣可以確保這兩個指標與業(yè)務(wù)的實際需求和風險承受能力相匹配。
最大容忍中斷時間/最大可接受中斷(MAO:Maximum Acceptable Outage)
ISO22301-2012定義如下(2019版已經(jīng)刪除):
MAO指在中斷威脅到組織實現(xiàn)其業(yè)務(wù)目標和/或生存能力之前必須進行有效恢復(fù)的時間。
RTO事件之后的時間段,在此期間生產(chǎn)或業(yè)務(wù)活動必須重新開始,或者資源必須恢復(fù)
按照此邏輯, RTO應(yīng)當比MAO在數(shù)量上少一些,這足以說明組織的風險偏好.MAO應(yīng)該在業(yè)務(wù)影響分析中確定。
RTO 應(yīng)該在服務(wù)連續(xù)性計劃的開發(fā)中定義。
業(yè)務(wù)影響分析 (BIA)
服務(wù)連續(xù)性管理實踐中的一個關(guān)鍵活動,用于識別重要的業(yè)務(wù)功能 (VBF) 及它們的依賴關(guān)系。這些依賴關(guān)系可能包括供應(yīng)商、人員、其他業(yè)務(wù)流程和 IT 服務(wù)。BIA 定義 IT 服務(wù)的恢復(fù)需求。這些需求包括每個 IT 服務(wù)的 RTO、RPO 和最小目標服務(wù)級別。
災(zāi)難恢復(fù)計劃
一系列定義清晰的計劃,涉及組織如何從災(zāi)難中復(fù)原并恢復(fù)到災(zāi)難前狀態(tài),這些計劃應(yīng)考慮服務(wù)管理的四個維度。通常包括的內(nèi)容:
響應(yīng)計劃: 明確了服務(wù)提供者最初如何對破壞性的事態(tài)做出反應(yīng),以防止損壞,例如火災(zāi)或網(wǎng)絡(luò)攻擊。
恢復(fù)計劃:明確了服務(wù)提供者如何恢復(fù)服務(wù)以實現(xiàn) RTO 和 RPO。
返回正常運營的計劃:
定義了服務(wù)提供商在恢復(fù)后如何恢復(fù)正常運營。
例如,如果已經(jīng)使用了備用數(shù)據(jù)中心,那么這個階段將使主數(shù)據(jù)中心重新投入運營,并恢復(fù)再次調(diào)用IT服務(wù)連續(xù)性計劃的能力。
應(yīng)急預(yù)案
應(yīng)急預(yù)案是組織應(yīng)對運營中斷事件的總體方案,包括總體組織架構(gòu)、各層級預(yù)案的定位和銜接關(guān)系及對運營中斷事件的預(yù)警、報告、分析、決策、處理、恢復(fù)等處置程序。
總體預(yù)案通常用于處置導(dǎo)致大范圍業(yè)務(wù)運營中斷的事件。
應(yīng)當制定重要業(yè)務(wù)專項應(yīng)急預(yù)案,專項應(yīng)急預(yù)案應(yīng)當注重災(zāi)難場景的設(shè)計,明確在不同場景下的應(yīng)急流程和措施。
業(yè)務(wù)條線的專項應(yīng)急預(yù)案,應(yīng)當注重調(diào)動內(nèi)部資源、采取業(yè)務(wù)應(yīng)急手段盡快恢復(fù)業(yè)務(wù),并和信息科技部門、保障部門的應(yīng)急預(yù)案有效銜接。
專項應(yīng)急預(yù)案的主要內(nèi)容應(yīng)當包括:
(一)應(yīng)急組織架構(gòu)及各部門、人員在預(yù)案中的角色、權(quán)限、職責分工;
(二)信息傳遞路徑和方式;
(三)運營中斷事件處置程序,包括預(yù)警、報告、決策、指揮、響應(yīng)、回退等;
(四)運營中斷事件處置過程中的風險控制措施;
(五)運營中斷事件的危機處理機制;
(六)運營中斷事件的內(nèi)部溝通機制和聯(lián)系方式;
(七)運營中斷事件的外部溝通機制和聯(lián)系方式;
(八)應(yīng)急完成后的還原機制。
四、業(yè)務(wù)連續(xù)性在各規(guī)范/標準中的區(qū)別
可用性管理與服務(wù)連續(xù)性管理的區(qū)別
服務(wù)的連續(xù)性和可用性管理的實踐之間的界限是不明顯的。兩種做法都涉及風險的概念,并致力于識別和準備應(yīng)對可能威脅并導(dǎo)致服務(wù)不能運轉(zhuǎn)的事件。對于這兩種實踐,都需要了解VBF和風險評估或服務(wù)故障的BIA。最終,兩種做法都確保了組織的抗故障能力。但兩個實踐在設(shè)計上是有不同的考慮,具體表現(xiàn)在:
| 緯度 | 可用性管理 | 服務(wù)連續(xù)性管理 |
| 關(guān)注點 | 高概率風險 | 高影響風險(緊急情況、災(zāi)難) |
| 方法 | 更加主動 | 更加被動 |
| 目的 | 減少不期望事件的可能性 | 減少不期望事件的影響 |
| 解決方案的重點 | 技術(shù)解決方案 | 組織措施 |
| 策略 | 優(yōu)化 | 創(chuàng)建冗余 |
| 是否為公司功能的一部分 | 不是 | 通常是 |
| 情境 | 業(yè)務(wù)照常 | 特殊情況 |
| 相關(guān)指標 | MTRS、MTBF、MTBSI | RTO、RPO |
在實際落地和執(zhí)行可用性管理和服務(wù)連續(xù)性管理時,我們需要關(guān)注以下幾個不同點:
服務(wù)連續(xù)性管理實踐不包含那些不會嚴重影響組織的輕度或短期故障。
它關(guān)注與重大損害相關(guān)的風險,無論它們發(fā)生的可能性或不可能性有多大。
通常,這些是緊急情況:火災(zāi),洪水,斷電,數(shù)據(jù)中心故障等。
雖然可用性管理實踐并未忽略故障對服務(wù)提供者和消費者造成的負面影響但是單個組件的輕度中斷也在流程中有所考慮。
二者目標不同。
可用性管理實踐處理統(tǒng)計數(shù)據(jù)并分析趨勢;
連續(xù)性管理關(guān)心如何應(yīng)對破壞性事件。
可用性規(guī)劃致力于滿足當前和將來的商定要求,并避免出現(xiàn)偏差。
可用性管理實踐發(fā)現(xiàn)并消除單點失效;
所采取的對策通常是積極主動的,以減少意外事態(tài)發(fā)生的可能性。
服務(wù)連續(xù)性管理實踐專注于規(guī)劃,以管理破壞性事件的嚴重后果。
備份站點,服務(wù)提供的替代方案的過渡,還有恢復(fù)程序,都可以減少損壞,但是通常不影響事件發(fā)生的可能性。
業(yè)務(wù)連續(xù)性在各個標準規(guī)范中的對比
| 特點/標準 | ISO 22301-2019 (業(yè)務(wù)連續(xù)性管理) | ISO 27001 (安全管理) | 應(yīng)急管理 | 可用性管理 |
| 主要焦點 | 業(yè)務(wù)連續(xù)性和恢復(fù) | 信息安全 | 災(zāi)難和緊急響應(yīng) | 系統(tǒng)和服務(wù)的持續(xù)可用性 |
| 目的 | 確保關(guān)鍵業(yè)務(wù)功能在中斷后能迅速恢復(fù) | 保護信息資產(chǎn)的完整性、機密性和可用性 | 減少緊急事件的影響,保護生命和財產(chǎn) | 優(yōu)化和確保關(guān)鍵服務(wù)和應(yīng)用的高可用性 |
| 方法 | 風險評估、業(yè)務(wù)影響分析、恢復(fù)策略 | 風險評估、選擇和實施控制措施 | 預(yù)防、準備、響應(yīng)、恢復(fù) | 監(jiān)控、維護和恢復(fù)服務(wù) |
| 業(yè)務(wù)連續(xù)性的角色 | 核心組成部分 | 一個控制目標,確保信息安全在業(yè)務(wù)連續(xù)性事件中得到維護 | 在災(zāi)難后迅速恢復(fù)正常運營 | 通過技術(shù)手段確保服務(wù)不間斷 |
| 與其他標準/概念的關(guān)系 | 可與 ISO 27001 整合 | 可與 ISO 22301 整合 | 與業(yè)務(wù)連續(xù)性和安全管理有交集 | 與業(yè)務(wù)連續(xù)性有交集,但更偏重技術(shù)層面 |
| 適用場景 | 任何可能面臨業(yè)務(wù)中斷風險的組織 | 任何需要保護其信息資產(chǎn)的組織 | 面臨自然災(zāi)害、技術(shù)事故或人為事件的組織 | 依賴關(guān)鍵IT系統(tǒng)和服務(wù)的組織 |
五、業(yè)務(wù)連續(xù)性與災(zāi)難恢復(fù)(DR)
業(yè)務(wù)連續(xù)性管理(BCM)是一個全面的管理過程,預(yù)先定義了各種對組織運作能力有干擾的潛在影響,使組織能夠容忍部分或全部業(yè)務(wù)能力的喪失所帶來的影響。
災(zāi)難恢復(fù)DR
災(zāi)難恢復(fù)(DR)是在發(fā)生自然或人為災(zāi)害后,重新啟用信息系統(tǒng)的數(shù)據(jù)、硬件及軟件設(shè)備,恢復(fù)正常商業(yè)運作的過程。災(zāi)難恢復(fù)是的業(yè)務(wù)連續(xù)性管理的一部分,其核心是對企業(yè)的災(zāi)難性風險做出評估、防范,特別是對關(guān)鍵性業(yè)務(wù)數(shù)據(jù)、流程予以及時記錄、備份和保護。
業(yè)務(wù)連續(xù)性管理(BCM)與災(zāi)難恢復(fù)(DR)是兩個密切相關(guān)的做法,是指企業(yè)為了保持業(yè)務(wù)持續(xù)運行,為防范不可預(yù)見的風險所做的準備。
業(yè)務(wù)連續(xù)性管理更加寬泛,關(guān)注企業(yè)的戰(zhàn)略,以保障業(yè)務(wù)運營為目標,解決全生命周期的問題,而災(zāi)難恢復(fù)更加注重具體操作,以系統(tǒng)為目標,著重解決事中的問題,同步處理事后的問題。
災(zāi)難恢復(fù)(DR)與業(yè)務(wù)連續(xù)性管理(BCM)的區(qū)別和聯(lián)系
| 特點/標準 | 業(yè)務(wù)連續(xù)性管理 (BCM) | 災(zāi)難恢復(fù) (DR) |
| 主要焦點 | 整體業(yè)務(wù)流程和功能 | IT系統(tǒng)和數(shù)據(jù) |
| 目的 | 確保關(guān)鍵業(yè)務(wù)功能在中斷后能迅速恢復(fù) | 在IT系統(tǒng)出現(xiàn)故障后迅速恢復(fù)數(shù)據(jù)和應(yīng)用 |
| 方法 | 風險評估、業(yè)務(wù)影響分析、恢復(fù)策略 | 數(shù)據(jù)備份、系統(tǒng)恢復(fù)、備用站點 |
| 涵蓋范圍 | 整個組織的所有關(guān)鍵業(yè)務(wù)流程 | 主要是IT系統(tǒng)和數(shù)據(jù) |
| 實施時間 | 在中斷事件發(fā)生前、中、后 | 在中斷事件發(fā)生后 |
| 與其他標準/概念的關(guān)系 | BCM通常包括DR作為其組成部分 | DR是BCM的一個子集 |
| 適用場景 | 任何可能面臨業(yè)務(wù)中斷風險的組織 | 依賴關(guān)鍵IT系統(tǒng)和數(shù)據(jù)的組織 |
聯(lián)系:
互補性:業(yè)務(wù)連續(xù)性管理和災(zāi)難恢復(fù)是互補的。
BCM關(guān)注整個組織的連續(xù)性,而DR專注于IT系統(tǒng)和數(shù)據(jù)的恢復(fù)。
層次:DR通常被視為BCM的一個關(guān)鍵組成部分。
當組織制定BCM策略和計劃時,它們通常會包括一個專門的DR計劃來處理IT相關(guān)的中斷。
目標:兩者的最終目標都是確保組織能夠在中斷事件后迅速恢復(fù)正常運營。
六、災(zāi)備、容災(zāi)和業(yè)務(wù)連續(xù)性
常說的容災(zāi)系統(tǒng)就屬于災(zāi)難恢復(fù)管理的技術(shù)范疇,這是一個完整的業(yè)務(wù)連續(xù)性大框架內(nèi)的一個極為重要的部分。一般而言,建設(shè)災(zāi)備系統(tǒng),需要根據(jù)業(yè)務(wù)的要求和投入規(guī)模,確定業(yè)務(wù)連續(xù)性管理的范圍和程度,然后,針對IT容災(zāi)和恢復(fù)提出切實可行的方案。缺少任何一個環(huán)節(jié),整個災(zāi)備體系的建設(shè)都是不完整的。沒有IT容災(zāi)和恢復(fù)的技術(shù)實現(xiàn),整個災(zāi)備體系的規(guī)劃和計劃就是無源之水和空中樓閣,根本沒有根基。而沒有一個完善的業(yè)務(wù)連續(xù)性體系,則使得整個業(yè)務(wù)的災(zāi)難后的連續(xù)運行無法有效進行,整個組織無法形成聯(lián)動機制,做到危機響應(yīng)和危機應(yīng)急。
業(yè)務(wù)連續(xù)性計劃是基于企業(yè)戰(zhàn)略的、處理長期的、面向中斷后維持業(yè)務(wù)連續(xù)性的規(guī)劃,核心是業(yè)務(wù)連續(xù);災(zāi)難恢復(fù)計劃是面向重大的、災(zāi)難性的系統(tǒng)故障,在異地恢復(fù)業(yè)務(wù)暫時性正常運轉(zhuǎn)的計劃。
當業(yè)務(wù)連續(xù)性管理和災(zāi)難恢復(fù)結(jié)合到一個單一的項目中時,不能孤立地制訂業(yè)務(wù)連續(xù)性計劃或災(zāi)難恢復(fù)計劃,要求企業(yè)管理人員和技術(shù)人員密切協(xié)作,制定切實可行的業(yè)務(wù)連續(xù)性和災(zāi)難恢復(fù)的計劃和策略,保證業(yè)務(wù)連續(xù)性管理和災(zāi)難恢復(fù)有效聯(lián)動。
根據(jù)監(jiān)管要求,每年需對企業(yè)的業(yè)務(wù)連續(xù)性管理做持續(xù)更新,包括風險分析、業(yè)務(wù)影響分析、業(yè)務(wù)連續(xù)性管理策略或災(zāi)難恢復(fù)策略等。其次,隨著企業(yè)業(yè)務(wù)需求不斷增加,IT系統(tǒng)也需要經(jīng)常更新升級。
災(zāi)備和備份的區(qū)別
容災(zāi)(Disaster Tolerance):就是在上述的災(zāi)難發(fā)生時,在保證生產(chǎn)系統(tǒng)的數(shù)據(jù)盡量少丟失的情況下,保持生存系統(tǒng)的業(yè)務(wù)不間斷地運行。
容錯(Fault Tolerance):指在計算機系統(tǒng)的軟件、硬件發(fā)生故障時,保證計算機系統(tǒng)中仍能工作的能力。
區(qū)別:容錯可以通過硬件冗余、錯誤檢查和熱交換 再加上特殊的軟件來實現(xiàn),而容災(zāi)必須通過系統(tǒng)冗余、災(zāi)難檢測和系統(tǒng)遷移等技術(shù)來實現(xiàn)。當設(shè)備故障不能通過容錯機制解決而導(dǎo)致系統(tǒng)宕機時,這種故障的解決就屬于容災(zāi)的范疇。
什么是災(zāi)難恢復(fù)(Disaster Recovery):指的是在災(zāi)難發(fā)生后,將系統(tǒng)恢復(fù)到正常運作的能力。
區(qū)別:容災(zāi)強調(diào)的是在災(zāi)難發(fā)生時,保證系統(tǒng)業(yè)務(wù)持續(xù)不間斷地運行的能力,而災(zāi)難恢復(fù)強調(diào)的災(zāi)難之后,系統(tǒng)的恢復(fù)能力?,F(xiàn)在的容災(zāi)系統(tǒng)都包含著災(zāi)難恢復(fù)的功能,所以本文的討論除了包括容災(zāi)方面的內(nèi)容,還包括了 災(zāi)難恢復(fù)的部分內(nèi)容。
容災(zāi)系統(tǒng)在企業(yè)中給與數(shù)據(jù)安全系數(shù)相當高的保障,但是容災(zāi)系統(tǒng)倒是是什么,他們是什么意思?恐怕連正在使用容災(zāi)備份的網(wǎng)絡(luò)管理人員都不能解釋。本文用最淺顯的語言給大家解釋容災(zāi)備份到底是什么。
容災(zāi)和備份的目的不同
容災(zāi)系統(tǒng)的目的在于保證系統(tǒng)數(shù)據(jù)和服務(wù)的“在線性”,即當系統(tǒng)發(fā)生故障時,仍然能夠正常地向網(wǎng)絡(luò)系統(tǒng)提供數(shù)據(jù)和服務(wù),以使系統(tǒng)不致停頓。
而容災(zāi)備份技術(shù)的目的與此并不相同,備份是“將在線數(shù)據(jù)轉(zhuǎn)移成離線數(shù)據(jù)的過程”,其目的在于應(yīng)付系統(tǒng)數(shù)據(jù)中的邏輯錯誤和歷史數(shù)據(jù)保存。
所以,在各種容錯技術(shù)非常豐富的今天,備份系統(tǒng)仍然是不可替代的。
備份是基石
備份是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,而將全系統(tǒng)或部分數(shù)據(jù)集合從應(yīng)用主機的硬盤或陣列復(fù)制到其它的存儲介質(zhì)的過程。
備份是數(shù)據(jù)高可用的最后一道防線,其目的是為了系統(tǒng)數(shù)據(jù)崩潰時能夠恢復(fù)數(shù)據(jù)。
容災(zāi)不可少
那么建設(shè)了備份系統(tǒng),是否就不需要容災(zāi)備份系統(tǒng)?這還要看業(yè)務(wù)部門對RTO(恢復(fù)所需的時間指標)/RPO(能夠恢復(fù)到的最新狀態(tài))指標的 期望值,如果允許1TB的數(shù)據(jù)庫RTO=8小時,RPO=1天,那備份系統(tǒng)就能滿足要求。同時,備份的目的在于應(yīng)付系統(tǒng)數(shù)據(jù)中的邏輯錯誤和歷史數(shù)據(jù)保存。只能夠滿足數(shù)據(jù)丟失、數(shù)據(jù)破壞時的數(shù)據(jù)恢復(fù)目的,而不能提供實時的業(yè)務(wù)接管功能。
因此,容災(zāi)系統(tǒng)對于某些關(guān)鍵業(yè)務(wù)而言也是必不可少的。人們談及容災(zāi)備份往往是針對當生產(chǎn)系統(tǒng),不能正常工作時,其業(yè)務(wù)可由容災(zāi)系統(tǒng)接替這些業(yè)務(wù),繼續(xù)進行正常的工作。
能夠提供很好的RTO和RPO指標。同時遠程容災(zāi)系統(tǒng)具備應(yīng)付各種災(zāi)難,特別是區(qū)域性與毀滅性災(zāi)難的能力,具備較為完善的數(shù)據(jù)保護與災(zāi)難恢復(fù)功能,保證災(zāi)難降臨時數(shù)據(jù)的完整性及業(yè)務(wù)的連續(xù)性,并在最短時間內(nèi)恢復(fù)業(yè)務(wù)系統(tǒng)的正常運行,將損失降到最小。
容災(zāi)不能替換備份
容災(zāi)系統(tǒng)會完整地把生產(chǎn)系統(tǒng)的任何變化復(fù)制到容災(zāi)端去,包括不想讓它復(fù)制的工作,比如不小心把計費系統(tǒng)內(nèi)的用戶信息表刪除了,同時容災(zāi)端的 用戶信息表也會被完整地刪除。如果是同步容災(zāi),那容災(zāi)端同時就刪除了;如果是異步容災(zāi),那容災(zāi)端在數(shù)據(jù)異步復(fù)制的間隔內(nèi)就會被刪除。這時就需要從備份系統(tǒng) 中取出最新備份,來恢復(fù)被錯誤刪除的信息。因此容災(zāi)系統(tǒng)的建設(shè)不能替代備份系統(tǒng)的建設(shè)。
七、業(yè)務(wù)連續(xù)性與高可用
高可用(High availability,即 HA)的主要目的是為了保障「業(yè)務(wù)的連續(xù)性」,即在用戶眼里,業(yè)務(wù)永遠是正常(或者說基本正常)對外提供服務(wù)的。通常,高可用主要是針對架構(gòu)而言,但其實高可用系統(tǒng)設(shè)計有一套比較科學的工程管理套路,要從產(chǎn)品、開發(fā)、運維、基建等全方位去考量和設(shè)計,高可用系統(tǒng)的設(shè)計思想包括但不限于:
做好研發(fā)規(guī)范,系統(tǒng)都是研發(fā)人員設(shè)計和編碼寫出來的,因此首先要對研發(fā)層面有一個規(guī)范和標準
做好容量規(guī)劃和評估,主要是讓開發(fā)人員對系統(tǒng)要抗住的量級有一個基本認知,方便進行合理的架構(gòu)設(shè)計和演進。
做好服務(wù)層面的高可用,主要是負載均衡、彈性擴縮容、異步解耦、故障容錯、過載保護等。
做好存儲層面的高可用,主要是冗余備份(熱備、冷備)、失效轉(zhuǎn)移(確認,轉(zhuǎn)移,恢復(fù))等。
做好運維層面的高可用,主要是發(fā)布測試、監(jiān)控告警、容災(zāi)、故障演練等。
做好產(chǎn)品層面的高可用,主要是兜底策略。
做好應(yīng)急預(yù)案,主要是在出現(xiàn)問題后怎么快速恢復(fù),不至于讓我們的異常事態(tài)擴大。
可以使用一張圖來表示高可用的設(shè)計思路。


BCM、容災(zāi)、災(zāi)備、高可用在數(shù)據(jù)中心的應(yīng)用,BCM主要用于解決數(shù)據(jù)中心業(yè)務(wù)連續(xù)性兩個方面的問題:
(1) 高可用性
是指提供在數(shù)據(jù)中心部分故障的情況下,仍能提供繼續(xù)訪問應(yīng)用的能力。不論這個故障是業(yè)務(wù)流程、物理設(shè)施、IT軟/硬件的故障。
(2) 災(zāi)難恢復(fù)
是指當災(zāi)難破壞數(shù)據(jù)中心時在不同地點、不同硬件設(shè)備上恢復(fù)數(shù)據(jù)的能力。上述兩個方面不是相互孤立的,而是相互關(guān)聯(lián)、有交叉的。為保證數(shù)據(jù)中心的業(yè)務(wù)連續(xù)性,高可用性和災(zāi)難恢復(fù)要映射到數(shù)據(jù)中心的各個層面,從用戶終端到服務(wù)器、 存儲器、甚至包括機房環(huán)境。國際標準ISO20000和ISO27001建立了規(guī)范的IT服務(wù)和信息安全的管理體系,在ISO20000的框架內(nèi),就包含了可持續(xù)性管理流程的內(nèi)容。
八、總結(jié):業(yè)務(wù)連續(xù)性、災(zāi)備、容災(zāi)、高可用
業(yè)務(wù)連續(xù)性是一套完整的管理體系核心目的是保障業(yè)務(wù)永遠正常。在這樣的目標之下需要一系列的管理方法、流程、制度、人員、技術(shù)去配套實現(xiàn)。因此,為企業(yè)重要應(yīng)用和流程提供業(yè)務(wù)連續(xù)性應(yīng)該包括以下三個方面:
業(yè)務(wù)連續(xù)性管理(BCM):
建立一套保障業(yè)務(wù)永遠正常的保障管理體系;
災(zāi)難恢復(fù)(Disaster Recovery):
指當災(zāi)難破壞生產(chǎn)中心時,在不同的地點恢復(fù)數(shù)據(jù)的能力。
高可用性(High availability) :指提供在本地故障情況下,能繼續(xù)訪問應(yīng)用的能力。
無論這個故障是業(yè)務(wù)流程、物理設(shè)施,還是IT軟硬件故障。
同時,上述三個部分不是相互孤立的,是相互關(guān)聯(lián),而且有交叉的,可以總結(jié)如下圖:


實施業(yè)務(wù)連續(xù)性的關(guān)鍵動作


業(yè)務(wù)連續(xù)性行業(yè)生態(tài),有哪些細分市場領(lǐng)域
與業(yè)務(wù)連續(xù)性相關(guān)的廠商可以稱之為一個細分的行業(yè)市場,這個市場中可以大致的分為以下幾種
中企檢測認證網(wǎng)提供iso體系認證機構(gòu)查詢,檢驗檢測、認證認可、資質(zhì)資格、計量校準、知識產(chǎn)權(quán)貫標一站式行業(yè)企業(yè)服務(wù)平臺。中企檢測認證網(wǎng)為檢測行業(yè)相關(guān)檢驗、檢測、認證、計量、校準機構(gòu),儀器設(shè)備、耗材、配件、試劑、標準品供應(yīng)商,法規(guī)咨詢、標準服務(wù)、實驗室軟件提供商提供包括品牌宣傳、產(chǎn)品展示、技術(shù)交流、新品推薦等全方位推廣服務(wù)。這個問題就給大家解答到這里了,如還需要了解更多專業(yè)性問題可以撥打中企檢測認證網(wǎng)在線客服13550333441。為您提供全面檢測、認證、商標、專利、知識產(chǎn)權(quán)、版權(quán)法律法規(guī)知識資訊,包括商標注冊、食品檢測、第三方檢測機構(gòu)、網(wǎng)絡(luò)信息技術(shù)檢測、環(huán)境檢測、管理體系認證、服務(wù)體系認證、產(chǎn)品認證、版權(quán)登記、專利申請、知識產(chǎn)權(quán)、檢測法、認證標準等信息,中企檢測認證網(wǎng)為檢測認證商標專利從業(yè)者提供多種檢測、認證、知識產(chǎn)權(quán)、版權(quán)、商標、專利的轉(zhuǎn)讓代理查詢法律法規(guī),咨詢輔導(dǎo)等知識。
本文內(nèi)容整合網(wǎng)站:百度百科、搜狗百科、360百科、知乎、市場監(jiān)督總局 、國家認證認可監(jiān)督管理委員會、質(zhì)量認證中心
免責聲明:本文部分內(nèi)容根據(jù)網(wǎng)絡(luò)信息整理,文章版權(quán)歸原作者所有。向原作者致敬!發(fā)布旨在積善利他,如涉及作品內(nèi)容、版權(quán)和其它問題,請跟我們聯(lián)系刪除并致歉!






