熱搜關(guān)鍵詞: 動環(huán)監(jiān)控 , 機房動環(huán) , 機房監(jiān)控 ,
數(shù)據(jù)中心機房監(jiān)控體系主要是對機房內(nèi)設(shè)備和環(huán)境進行集中監(jiān)控和管理,經(jīng)過采集機房運行中的各種數(shù)據(jù)參數(shù),來判斷是否出現(xiàn)異常,對數(shù)據(jù)中心機房具有重要意義。機房監(jiān)控體系包含多個方面,而不只是簡單的視頻監(jiān)控,理論上,機房任何區(qū)域都有出現(xiàn)問題的可能,監(jiān)控體系的覆蓋性一定程度上決議機房運行的穩(wěn)定性。下面就來詳細介紹一下數(shù)據(jù)中心機房的三大監(jiān)控體系,以及它們各自具有的功能。
(一)數(shù)據(jù)中心機房之“設(shè)備監(jiān)控體系”
數(shù)據(jù)中心機房里的設(shè)備不計其數(shù),對這些設(shè)備的運行狀況進行監(jiān)控非常必要,比如服務(wù)器運行的CPU內(nèi)存參數(shù),網(wǎng)絡(luò)設(shè)備的端口流量,業(yè)務(wù)層面的監(jiān)控等等,設(shè)備層面的監(jiān)控就更為雜亂了,需要對設(shè)備的各種運行參數(shù)比較清楚,因此一般設(shè)備的監(jiān)控體系都采用設(shè)備廠家提供的監(jiān)控軟件或許規(guī)范的第三方軟件來進行管理。
(1)經(jīng)過這些監(jiān)控軟件,7*24小時對設(shè)備運行的各種參數(shù)進行監(jiān)控,一旦發(fā)現(xiàn)有異常就發(fā)出告警。
(2)告警的方式也比較多,能夠打印到日志主機上,能夠經(jīng)過短信發(fā)送到運維人員的手機上,也能夠經(jīng)過軟件體系自行嘗試修復。
(3)監(jiān)控的軟件做的是否完善將決議故障出現(xiàn)時,能否給出告警,所以觸及設(shè)備的監(jiān)控往往是在不斷完善的進程,許多監(jiān)控參數(shù)都是經(jīng)驗之道,甚至是前史的經(jīng)驗,只要經(jīng)過不斷地改進、優(yōu)化,才能將發(fā)生的風險及時發(fā)現(xiàn),當然要做到所有的故障都可能提前預知、發(fā)現(xiàn),是非常困難的。
(4)有時的故障可能無任何預兆,尤其是硬件故障,會突然出現(xiàn),而往往監(jiān)控體系是無法監(jiān)測到硬件級別的、元器件的故障。
(二)數(shù)據(jù)中心機房之“視頻監(jiān)控體系”
和其它的商務(wù)建筑一樣,數(shù)據(jù)中心機房也需要部署視頻監(jiān)控體系。視頻監(jiān)控主要是對進出數(shù)據(jù)中心機房的人員進行監(jiān)控,在數(shù)據(jù)中心機房的出入口要部署攝像頭,在數(shù)據(jù)中心機房內(nèi)部樓道,重要的機房入口都要部署。
在有的非常重要業(yè)務(wù)的機房內(nèi),有時也要部署攝像頭,以便防止一些人員的惡意操作或許誤操作,發(fā)現(xiàn)這些異常時及時制止,以防止給數(shù)據(jù)中心機房業(yè)務(wù)帶來影響。數(shù)據(jù)中心機房里的許多設(shè)備、儀器都是非常貴重的,因為人為的原因?qū)е聯(lián)p壞的狀況是非常多見的,還有便是防止一些偷盜行為。比如數(shù)據(jù)中心機房里的光模塊,一個光模塊,尤其是40G/100G光模塊,一個都要數(shù)千元,順手拿出去幾個,轉(zhuǎn)手能夠獲利上萬元。
有了視頻監(jiān)控體系,就能最大限度地防止這些行為出現(xiàn),或許在出現(xiàn)后能夠經(jīng)過這些監(jiān)控錄像進行分析、追責,這些視頻錄像是重要的證據(jù),所以視頻監(jiān)控體系是數(shù)據(jù)中心機房不可缺少的一部分,有的數(shù)據(jù)中心機房除了視頻的監(jiān)控,還要在數(shù)據(jù)中心機房出入做好人員訪問掛號作業(yè),對外來人員進行管理,防止放入一些惡意分子。
(三)數(shù)據(jù)中心機房之“煙霧溫濕監(jiān)控體系”
數(shù)據(jù)中心機房一樣怕火,一旦發(fā)生火災(zāi)對于數(shù)據(jù)中心機房來說便是毀滅性的打擊。以往也出現(xiàn)過一些慘痛的經(jīng)驗,所以對于放火,數(shù)據(jù)中心機房且不可大意。數(shù)據(jù)中心機房和其它的建筑不同,內(nèi)部有太多的電子設(shè)備,并不適用于噴淋體系,只能采用干粉救活或許惰性氣體救活。
當機房內(nèi)的煙霧濃度超過了報警器設(shè)定的門限,即觸發(fā)監(jiān)控體系,及時將火滅除,除了煙霧,機房內(nèi)的溫度和濕度也是需要監(jiān)控的重要部署。數(shù)據(jù)中心機房內(nèi)部要盡量保持恒溫恒濕,但實際上在數(shù)據(jù)中心機房內(nèi)部會有局部的溫度死角,長期以往會大大下降電子設(shè)備的使用壽命,經(jīng)過在數(shù)據(jù)中心機房內(nèi)多個區(qū)域部署溫濕度傳感器,建立起溫濕度的監(jiān)控網(wǎng)絡(luò),就能夠及時地發(fā)現(xiàn)局部區(qū)域過溫過濕的狀況,在一些空氣污染較為嚴重的地方,還能夠部署空氣清潔度監(jiān)測的設(shè)備,數(shù)據(jù)中心機房設(shè)備運行在污染嚴重的環(huán)境里,容易造成靜電、電容擊穿器件等故障,為何我們要求數(shù)據(jù)中心機房設(shè)備要周期性地進行除塵便是這個道理,本身灰塵中就含有不少的污染物。
數(shù)據(jù)中心機房在高速的發(fā)展,各種新技術(shù)層出不窮,也讓數(shù)據(jù)中心機房運行變得愈加雜亂,這給監(jiān)控體系也帶來了不小的挑戰(zhàn),如何經(jīng)過監(jiān)控體系及時發(fā)現(xiàn)運行風險,是監(jiān)控體系關(guān)心的永久話題。
雖然數(shù)據(jù)中心機房有各種各樣的監(jiān)控體系,但是能夠確定的是監(jiān)控體系無法提前發(fā)現(xiàn)所有的故障,尤其是設(shè)備級別的故障,但是經(jīng)過完善的監(jiān)控體系的確能夠大大防止許多故障。就算監(jiān)控體系沒有在發(fā)生故障時,給出告警,但是在事后故障分析中,監(jiān)控體系的各種技術(shù)參數(shù)和記錄依然是可供分析的重要資料,經(jīng)過對這些監(jiān)控記錄很可能能夠找出故障的原因。 監(jiān)控體系的作用便是將前史經(jīng)驗、經(jīng)驗轉(zhuǎn)化為一些數(shù)據(jù)參數(shù),然后采集數(shù)據(jù)中心機房里的各種數(shù)據(jù)信息進行對比,假如發(fā)現(xiàn)異常,就及時給出告警。數(shù)據(jù)越豐富,監(jiān)控體系的功能就越強大。
總結(jié):
不要以為一個數(shù)據(jù)中心機房不是部署了監(jiān)控體系就能夠高枕無憂了,任何的體系都有漏洞,何況是監(jiān)控體系,所以數(shù)據(jù)中心機房運維人員還要在日常的作業(yè)中,多檢查,多分析,及時發(fā)現(xiàn)隱患,假如監(jiān)控體系未能發(fā)現(xiàn),那么想辦法將這些隱患的判斷加到監(jiān)控體系中,使監(jiān)控體系越來越完善,決不能允許相同的錯誤,連續(xù)犯兩次。
關(guān)注我們