書名: 系統與服務監控技術實踐作者名: 王淑江主編本章字數: 728字更新時間: 2019-03-01 22:21:51
3.2 可靠性監視器
可靠性監視器,是Windows Server 2008操作系統內置的監視功能,通過該功能管理員可以了解服務器的系統運行狀況。從Windows Server 2008操作系統安裝成功時起,每過24個小時,系統就會對統計出來的數據內容進行統計,并自動生成一個系統穩定性系數,通常該系數數值位于0~10之間,數值越高說明系統的可靠性越高,該系數數值將自動顯示在可靠性圖表中。Windows Server 2008操作系統自動對Windows故障、硬件故障、應用程序故障、軟件安裝(卸載)以及其他故障進行可靠性統計。當可靠性監視器連續收集28天的數據后,可靠性監視器圖表將顯示一條使用黑色方塊節點串連起來的實線,顯示計算機在一段時間區域內的運行狀況。
3.2.1 可靠性監視器概述
“可靠性監視器”窗口包含兩個顯示區域,上面區域是系統穩定性圖表,下面區域為“系統穩定性報告”,顯示系統自動統計的關聯數據。
1. 系統穩定性圖表
系統穩定性圖表的上半部分顯示穩定性系數圖表。在該圖表的下半部分,顯示跟蹤的可靠性事件,該事件將有助于系統的穩定性測量,或者提供有關軟件安裝和刪除的相關信息。當檢測到每種類型的一個或多個可靠性事件時,在該日期的列中會顯示一個圖標,如圖3-24所示。圖標代表以下意思:

圖3-24 系統穩定性圖表之一
● “”信息圖標,圖表中該圖標所在的位置表示Windows Server 2008操作系統在那一刻有操作成功的提示信息存在。
● “”警告圖標,圖表中該圖標所在的位置表示Windows Server 2008操作系統在那一刻有安全隱患操作存在。
● “”錯誤圖標,圖表中該圖標所在的位置表示Windows Server 2008操作系統在那一刻有錯誤操作存在。
● “” 黑色方塊圖標,圖表中該圖標所在的位置表示Windows Server 2008操作系統每一天的事件采集點,每一個事件采集點包含5個方面的信息,分別是:Windows故障信息、硬件故障信息、應用程序故障信息、軟件安裝卸載信息和其他故障信息。
Windows Server 2008操作系統自動對每一個事件采集點收集來的5個方面的信息進行綜合評估,并對系統的運行穩定性進行量化評估,其中最穩定的系統狀態,其可靠性的評估分為10分。隨著系統運行時間的推移,系統運行的可靠性將逐步下降。
默認情況下,可靠性監視器顯示最近日期的數據。若要查看特定日期的數據,選擇系統穩定性圖表中的“日期”,或者單擊日期下拉列表選擇“選擇日期”選項,在日期列表中選擇目標日期,如圖3-25所示。

圖3-25 系統穩定性圖表之二
若要查看所有可用的歷史數據,單擊日期下拉列表選擇“全部”選項,即可顯示所有日期可靠性監視結果。如果采集的數據超過30天,則使用系統穩定性圖表底部的滾動欄,瀏覽可見范圍以外的日期,如圖3-26所示。

圖3-26 系統穩定性圖表之三
2. 系統穩定性報告
系統穩定性報告,能夠幫助管理員通過識別產生的事件確定造成系統穩定性降低的原因。單擊每個可靠性事件類別右側的“+”圖標,可以查看事件列表。如果選擇系統穩定性圖表中的日期列,則系統穩定性報告將顯示該日期的事件。若要查看系統穩定性圖表中的所有事件或選擇可見范圍以外的日期,選擇日期下拉列表并使用日歷,或選擇“所有日期”,查看選擇的時間區間產生的與可靠性相關的事件。系統穩定性報告包括以下5種類型的事件,分別是:軟件安裝(卸載)、應用程序故障、硬件故障、Windows故障以及其他故障。
(1)軟件安裝(卸載)
在此類別中跟蹤軟件安裝和刪除執行的結果,包括操作系統組件、Windows Update、驅動程序和應用程序。監視的數據信息如表3-2所示。
表3-2 軟件安裝參數

(2)應用程序故障
在此類別中跟蹤應用程序故障,包括已經終止或已停止工作的應用程序。監視的數據信息如表3-3所示。
表3-3 應用程序故障參數

(3)硬件故障
在此類別中跟蹤磁盤和內存故障。監視的數據信息如表3-4所示。
表3-4 硬件故障參數

(4)Windows故障
在此類別中跟蹤操作系統和啟動故障。監視的數據信息如表3-5所示。
表3-5 Windows故障參數

(5)其他故障
在此類別中跟蹤影響穩定性且未歸入上述類別的故障,包括操作系統意外關閉。監視的數據信息如表3-6所示。
表3-6 其他故障參數

(6)故障處理模式
可靠性監視器報告應用程序故障、Windows故障,或者軟件安裝或刪除故障,可以跟蹤中發生故障的應用程序或操作系統組件。使用“Windows Update ”以及“問題報告和解決方案”組件,從微軟知識庫中搜索可能解決問題更新或者補丁。如果存在故障的應用程序不是微軟公司的產品,且“問題報告和解決方案”中沒有解決方案,可以嘗試搜索應用程序提供商的網站以獲取軟件更新。
3.2.2 啟動可靠性監視器
管理員可以通過命令行模式或者圖形界面模式啟動可靠性監視器。
1. 命令行模式
第1步,選擇“開始”→“運行”命令,顯示“運行”對話框,在“打開”文本框中鍵入“perfmon”,單擊“確定”按鈕,如圖3-27所示。

圖3-27 命令行啟動可靠性監視器之一
第2步,單擊“確定”按鈕,顯示如圖3-28所示的“可靠性和性能監視器”窗口,選擇“可靠性和性能”→“監視工具”→“可靠性監視器”選項。

圖3-28 命令行啟動可靠性監視器之二
2. 圖形模式
選擇“開始”→“管理工具”→“服務器管理器”選項,打開“服務器管理器”窗口。選擇“服務器管理器”→“診斷”→“可靠性和性能”→“監視工具”→“可靠性監視器”選項,顯示如圖3-29所示的窗口。

圖3-29 圖形模式啟動可靠性監視器
3.2.3 監控系統數據
Windows Server 2008的可靠性監視器,自動監控Windows故障、硬件故障、應用程序故障、軟件安裝(卸載)以及其他故障類別的錯誤,當錯誤發生后,管理員通過可靠性圖表即可發現并捕捉產生的錯誤,了解錯誤產生的原因。
1. 監控指定日期數據
在“可靠性監視器”窗口中選擇某一天的可靠性系數后,在“系統可靠性報告”區域看到對應這一天的詳細統計數據,如圖3-30所示。管理員可以監控選擇的計算機是否出現Windows故障、是否存在硬件故障、應用程序在使用過程中是否發生過意外、有沒有進行過軟件安裝操作或者卸載操作等,依照統計結果,管理員可以在第一時間采取措施保護服務器操作系統安全。例如升級硬件驅動程序,及時更新Windows系統補丁程序,或者將存在穩定性隱患的軟件及時從系統中卸載等。

圖3-30 監控系統數據之一
2. 監控軟件安裝(卸載)
在“系統穩定性報告”區域,選擇“查看軟件安裝(卸載)”選項,單擊該選項右側的“+”圖標,顯示指定日期發生的軟件安裝(卸載)行為,如圖3-31所示。

圖3-31 監控系統數據之二
3. 監控應用程序故障
在“系統穩定性報告”區域,選擇“查看應用程序故障”選項,單擊該選項右側的“+”圖標,顯示指定日期應用程序出現的故障,如圖3-32所示。

圖3-32 監控系統數據之三
4. 監控硬件故障
在“系統穩定性報告”區域,選擇“硬件故障”選項,單擊該選項右側的“+”圖標,顯示指定日期計算機硬件出現的故障,如圖3-33所示。

圖3-33 監控系統數據之四
5. 監控Windows故障
在“系統穩定性報告”區域,選擇“Windows故障”選項,單擊該選項右側的“+”圖標,顯示指定日期Windows操作系統出現的故障,如圖3-34所示。

圖3-34 監控系統數據之五
6. 監控其他故障
在“系統穩定性報告”區域,選擇“其他故障”選項,單擊該選項右側的“+”圖標,顯示指定日期系統中出現的其他故障,如圖3-35所示。

圖3-35 監控系統數據之六