數(shù)據(jù)中心機(jī)房是企業(yè)信息數(shù)據(jù)匯集、轉(zhuǎn)發(fā)的重要場所。企業(yè)的協(xié)同辦公系統(tǒng)、財(cái)務(wù)系統(tǒng)、營銷系統(tǒng)、等重要系統(tǒng)的服務(wù)器都集中在機(jī)房,所以企業(yè)對計(jì)算機(jī)機(jī)房的穩(wěn)定性、可靠性、安全性要求較高。一但電力系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、服務(wù)器等出了故障,造成業(yè)務(wù)終端,造成的經(jīng)濟(jì)損失是不可估計(jì)的。
part 1:維護(hù)機(jī)房的目的
保障機(jī)房設(shè)備正常運(yùn)行,對機(jī)房環(huán)境支撐系統(tǒng)、電力系統(tǒng)、監(jiān)控設(shè)備、計(jì)算機(jī)主機(jī)設(shè)備定期檢測、維護(hù)和保養(yǎng),保障機(jī)房設(shè)備運(yùn)行穩(wěn)定,降低故障率。確保機(jī)房在突發(fā)事故導(dǎo)致硬件設(shè)備故障,影響機(jī)房正常運(yùn)作情況下,可及時(shí)得到設(shè)備供應(yīng)商或機(jī)房服務(wù)維護(hù)人員的產(chǎn)品維修和技術(shù)支持,并快速解決故障。保障機(jī)房設(shè)備穩(wěn)定運(yùn)行,并通過保養(yǎng)延長設(shè)備生命周期,降低故障率,下面將服務(wù)器機(jī)房的維護(hù)方法與大家分享。
part 2:維護(hù)內(nèi)容
1. 機(jī)房主機(jī)設(shè)備維護(hù)管理:計(jì)算機(jī)服務(wù)器(包括PC服務(wù)器及存儲服務(wù)器);網(wǎng)絡(luò)設(shè)備(交換路由設(shè)備等)。
2. 機(jī)房監(jiān)控設(shè)備維護(hù)管理:供配電監(jiān)測系統(tǒng)、溫度環(huán)境檢測系統(tǒng)、門禁設(shè)備系統(tǒng)、保安監(jiān)控設(shè)備。
3. 機(jī)房空調(diào)與配電設(shè)備維護(hù)管理:空調(diào)設(shè)備、新風(fēng)設(shè)備、UPS電池、主配電箱。
4. 機(jī)房消防設(shè)備維護(hù)管理:煙感熱感探測器、手動報(bào)警按鈕和報(bào)警控制器、滅火器的控制裝置。
5. 機(jī)房供水水路、電路及照明維護(hù)管理:水電路管線及接口的檢查維護(hù)。
6. 機(jī)房基礎(chǔ)維護(hù)管理:機(jī)柜線路的整理、標(biāo)簽檢查更換、機(jī)房除塵清潔、防火地板、墻面、吊頂、門窗及相關(guān)配套的維護(hù)管理。
part 3:數(shù)據(jù)中心機(jī)房的維護(hù)方法
1. 機(jī)房除塵及環(huán)境要求:定期對設(shè)備進(jìn)行除塵處理,清理,調(diào)整安保攝像頭清晰度,防止由于機(jī)器運(yùn)轉(zhuǎn)、靜電等因素將塵土吸入監(jiān)控設(shè)備內(nèi)部。同時(shí)檢查機(jī)房通風(fēng)、散熱、凈塵、供電、架空防靜電地板等設(shè)施。機(jī)房室內(nèi)溫度應(yīng)控制在 5℃~ 35℃,相對濕度應(yīng)控制在30%~85%。
2. 機(jī)房空調(diào)及新風(fēng)維護(hù):檢查空調(diào)運(yùn)行是否正常,換風(fēng)設(shè)備運(yùn)轉(zhuǎn)是否正常。從視鏡觀察制冷劑液面,看是否缺少制冷劑。檢查空調(diào)壓縮機(jī)高、低壓保護(hù)開關(guān)、干燥過濾器及其他附件。
3. UPS及電池維護(hù):根據(jù)實(shí)際情況進(jìn)行電池核對性容量測試;進(jìn)行電池組充放電維護(hù)及調(diào)整充電電流,確保電池組正常工作;檢查記錄輸出波形、諧波含量、零地電壓;查清各參數(shù)是否配置正確;定期進(jìn)行UPS功能測試,如UPS同市電的切換試驗(yàn)。
4. 消防設(shè)備維護(hù):檢查火警探測器、手動報(bào)警按鈕、火災(zāi)警報(bào)裝置外觀及試驗(yàn)報(bào)警功能;檢查火災(zāi)警報(bào)控制器的自檢、消音、復(fù)位功能及主備用電源切換功能。
5. 電路及照明電路維護(hù):鎮(zhèn)流器、燈管及時(shí)更換,開關(guān)更換;線頭氧化處理,標(biāo)簽巡查更換;供電線路絕緣檢查,防止意外短路。
6. 機(jī)房基礎(chǔ)維護(hù):靜電地板清洗清潔,地面除塵;縫隙調(diào)整,損壞更換;接地電阻測試;主接地點(diǎn)除銹、接頭緊固;防雷器檢查;接地線觸點(diǎn)防氧化加固。
7. 機(jī)房運(yùn)維管理體系:完善機(jī)房運(yùn)維規(guī)范,優(yōu)化機(jī)房運(yùn)維管理體系。維護(hù)人員24小時(shí)及時(shí)響應(yīng)。
part 4:機(jī)房服務(wù)器日常維護(hù)步驟
1. 開機(jī)順序
一般地說,系統(tǒng)開關(guān)機(jī)應(yīng)嚴(yán)格遵循以下步驟:打開總電源-> 打開計(jì)算機(jī)機(jī)柜電源-> 打開外部設(shè)備電源(如磁盤陣列,磁帶庫等)-> 待外部設(shè)備自檢完成后,最后打開主機(jī)電源.
2. 關(guān)機(jī)順序
進(jìn)行操作系統(tǒng)的關(guān)閉(shutdown -h -y 0)-> 關(guān)閉主機(jī)電源.-> 關(guān)閉外設(shè)電源.(如磁盤陣列,磁帶庫等)-> 關(guān)閉其他設(shè)備電源和機(jī)柜電源;-> 最后關(guān)閉總電源。
3. 電纜連接注意事項(xiàng)
在進(jìn)行電纜連接(插拔)時(shí),最重要的一點(diǎn)是,通過該電纜連接(或?qū)⒁B接)的設(shè)備應(yīng)當(dāng)是沒有加電的,即應(yīng)當(dāng)先將設(shè)備的電源關(guān)掉,然后再進(jìn)行電纜連接(插拔)操作。否則,如果帶電進(jìn)行電纜連接,會造成對設(shè)備無法預(yù)料的損壞。
4. 硬件故障診斷
(1)電纜連接
注意計(jì)算機(jī)及各外設(shè)之間連線接觸良好,不要無故拔插電纜;如果發(fā)生計(jì)算機(jī)不能識別某個(gè)設(shè)備,有可能是電纜的接觸問題。
(2)硬件狀態(tài)指示燈
如果發(fā)現(xiàn)系統(tǒng)工作不正常,可以觀察硬件狀態(tài)指示燈的情況。開機(jī)后系統(tǒng)將自動完成自測試,診斷及引導(dǎo)啟動代碼。
檢測順序大致為:高速緩存,中央處理器,總線,內(nèi)存,I/O設(shè)備。當(dāng)檢測到相關(guān)的硬件時(shí),對應(yīng)的顯示燈會亮。
硬盤,軟盤,磁帶機(jī)及光盤驅(qū)動器自檢時(shí),能從前面板上看到相應(yīng)的燈亮一下,表明系統(tǒng)已經(jīng)識別到上述設(shè)備。相反,如果某驅(qū)動器的自檢燈沒亮,很可能是該設(shè)備有問題。
另外,主機(jī)背后的SCSI接口卡及網(wǎng)絡(luò)接口卡上的自檢指示燈亮為正常狀態(tài)。否則,可能該接口卡有問題。如果發(fā)現(xiàn)這種問題,請馬上與HP聯(lián)系,考慮更換備件。
(3)錯(cuò)誤代碼
每次開機(jī)后,系統(tǒng)都會進(jìn)行硬件自檢及初始化,假如系統(tǒng)出現(xiàn)硬件故障,一般都不能正常啟動,并在液晶顯示屏及控制臺上相應(yīng)的顯示出錯(cuò)誤代碼及出錯(cuò)信息。
若屏幕上出現(xiàn)ERROR且液晶顯示上出現(xiàn)FLT,表明有故障發(fā)生,應(yīng)根據(jù)上述提示確定故障點(diǎn)。
絕大部分硬件錯(cuò)誤都能在自檢時(shí)暴露出來,在液晶顯示及控制臺的左下角都有四位錯(cuò)誤代碼:FLT xxxx。
分析這四位代碼可以進(jìn)一步檢測出故障。發(fā)現(xiàn)這種問題,請馬上與HP聯(lián)系,分析相應(yīng)的故障原因。
part 5:機(jī)房維護(hù)需要注意的內(nèi)容
數(shù)據(jù)中心是全球性的特定網(wǎng)絡(luò),主要作用是傳遞、加速、展示、計(jì)算和存儲Internet上的數(shù)據(jù)信息的。數(shù)據(jù)中心的服務(wù)器數(shù)量可以有很多,但是它又不僅僅只是包含了很多的服務(wù)器,它還包含了各種各樣的數(shù)據(jù)通信存儲、各種監(jiān)控和安全設(shè)備等,內(nèi)部是比較復(fù)雜的。
數(shù)據(jù)中心后期的維護(hù)是很重要的,對環(huán)境的要求也是很嚴(yán)格的,當(dāng)然這些設(shè)備需要適應(yīng)相同的環(huán)境,這樣維護(hù)起來會更方便。
(1)首先是一定要遠(yuǎn)離腐蝕性氣體和易燃易爆物體,因?yàn)檫@些氣體會隨著機(jī)房的通風(fēng)口進(jìn)入,不管是對工作人員還是對機(jī)器設(shè)備都很不利,還會造成一些濾網(wǎng)的污染。
(2)其次就是溫度和濕度一定要控制好,嚴(yán)格控制在規(guī)定的標(biāo)準(zhǔn)范圍內(nèi)。干球溫度計(jì)要在20℃到25℃(68F~77F)之間,相對濕度要在40%到50%之間。
(3)另外一個(gè)因素是噪聲和照度。主機(jī)房中心的噪聲保持在65dB(A)以下是正常的一個(gè)范圍,照度是距地0.8米處應(yīng)該高于300lx,輔助房間的要大于200lx。
(4)還有一個(gè)因素是需要我們注意的,那就是無線電和磁場的干擾場強(qiáng),這個(gè)在設(shè)置的時(shí)候要根據(jù)規(guī)定的大小。
數(shù)據(jù)中心的機(jī)器比較多,散熱問題需要注意,要有制冷系統(tǒng)來穩(wěn)定機(jī)房內(nèi)的溫度。當(dāng)然,要想維護(hù)好數(shù)據(jù)中心,還有很多的小細(xì)節(jié)需要我們注意,以上幾點(diǎn)是我們比較常見的,我們在工作過程中可以根據(jù)自己的情況,做好其他的小細(xì)節(jié)。
part 6:數(shù)據(jù)中心機(jī)房維護(hù)計(jì)劃
1. 周維護(hù)主要內(nèi)容:
- 清潔機(jī)架內(nèi)外、設(shè)備面板和監(jiān)視器、顯示器屏幕;
- 檢查個(gè)切換開關(guān)功能鍵、監(jiān)測報(bào)警系統(tǒng)的功能及各設(shè)備指示狀態(tài);
- 檢查機(jī)房供配電系統(tǒng);
- 檢查機(jī)房空調(diào)和照明設(shè)備。
2. 月維護(hù)主要內(nèi)容:
- 周維護(hù)所有內(nèi)容;
- 整理各機(jī)架設(shè)備連接線;
- 檢查服務(wù)器配置情況;
- 檢查交換機(jī)各個(gè)端口工作狀態(tài);
- 檢查服務(wù)器運(yùn)行狀態(tài)并記錄;
- 檢查各光發(fā)射、接收設(shè)備的工作狀態(tài)。
3. 季維護(hù)主要內(nèi)容:
- 周、月維護(hù)所有內(nèi)容;
- 清潔機(jī)房空調(diào)的過濾網(wǎng),檢查空調(diào)運(yùn)行情況,必要時(shí)補(bǔ)充制冷劑;
- 按操作規(guī)程對蓄電池進(jìn)行完全的充放電維護(hù);
- 對接收天線進(jìn)行全面性能檢查和維護(hù)。
4. 年維護(hù)主要內(nèi)容:
- 周、月、季維護(hù)所有內(nèi)容;
- 清潔各設(shè)備的電路板和接插件;
- 清潔各監(jiān)視器和計(jì)算機(jī)內(nèi)部;
- 檢查調(diào)整信號源和設(shè)備測試口的電平及性能指標(biāo);
- 檢查調(diào)整各監(jiān)測、報(bào)警系統(tǒng)的門限閥值。