- PostgreSQL高可用實戰
- 胡輝等
- 764字
- 2022-08-16 17:40:44
1.1.2 相關指標
1.RTO指標
恢復時間目標(Recovery Time Objective,RTO)指在故障或災難發生后,硬件設備或軟件服務停止工作的最大可承受時間。RTO 定義了最大容忍時限,必須在此時限內恢復數據。如果說系統需要在災難發生后的24h內恢復,那么RTO就是24h。RTO也是從故障發生后,系統宕機導致業務中斷的那一刻開始,到系統恢復至可以支持各業務正常運作的時間間隔。RTO 是反映系統業務恢復時間的指標,RTO 數值越小,代表容災系統的數據恢復能力越強。
2.RPO指標
恢復點目標(Recovery Point Object,RPO)是一個過去的時間點,即當災難或緊急事件發生時,數據可以恢復到的時間點。例如,每天03:00進行數據備份,如果今天發生了宕機,那么數據可以恢復到的時間點(RPO)就是今天 03:00;如果 05:00 發生了災難或宕機事件,那么損失的就是 2h 內所產生的數據。RPO 指的是用戶允許損失的最大數據量。RPO指標主要反映了業務連續性管理體系下備用數據的有效性,即RPO取值越小,表示系統對數據完整性的保證能力越強。
3.SLA服務等級
服務等級協議(Service Level Agreement,SLA)指提供服務的企業與客戶之間就服務的品質、水準、性能等方面達成的雙方共同認可的協議。
不同公司的不同業務類型對服務等級的要求也不一樣,金融類型和互聯網類型業務對服務等級的要求較高,其他類型業務,比如統計分析、離線分析等非實時業務系統,對服務等級的要求比金融類型和互聯網類型業務低。
服務可用性越低,停機時間越長,可能造成的損失也越大。在IT系統建設過程中,要盡可能地提升SLA服務等級,如表1-1所示。
表1-1 SLA服務等級

續表

4.MTTF、MTTR和MTBF指標
1)MTTF指標
平均無故障時間(Mean Time To Failure,MTTF)指系統無故障運行的平均時間,取所有從系統開始正常運行到發生故障之間的時間段的平均值。
2)MTTR指標
平均修復時間(Mean Time To Repair,MTTR)指系統從發生故障到維修結束之間的時間段的平均值。
3)MTBF指標
平均失效間隔(Mean Time Between Failure,MTBF)指系統發生兩次故障時間之間的時間段的平均值。
- 數據分析實戰:基于EXCEL和SPSS系列工具的實踐
- 企業大數據系統構建實戰:技術、架構、實施與應用
- PySpark大數據分析與應用
- Neural Network Programming with TensorFlow
- Apache Kylin權威指南
- 數據庫原理與應用
- Power BI智能數據分析與可視化從入門到精通
- 貫通SQL Server 2008數據庫系統開發
- 智慧城市中的大數據分析技術
- Access數據庫開發從入門到精通
- Delphi High Performance
- MySQL性能調優與架構設計
- 數據分析方法及應用:基于SPSS和EXCEL環境
- Hadoop大數據技術開發實戰
- Working with OpenERP