Tommy 碎碎念

Tommy Wu's blog

« 上一篇 | 下一篇 »

天氣太熱, 老機器掛了...
post by tommy @ 18 七月, 2013 14:35

台北在六月下旬的天氣還真是很熱, 白天如果在外頭被太陽直射沒幾分鐘人就快受不了. 室內一樣是熱的要命, 尤其是我放電腦的那個房間, 雖然有台電風扇在吹, 不過一靠近還是可以明顯的感受到熱度.... 結果就是, 有機器罷工了.

其中一台用來當 standby firewall 的機器, 在 6/22 突然在運作時出現一堆與 SATA 有關的錯誤訊息. 回家重開發現 SATA 上頭接的硬碟, 常常在開機時就抓不到, 不過關機一陣子後, 開機就可能可以正常看到, 不過一到載入 kernel 的時候, 還是一樣會找不到硬碟.

原本以為是硬碟壞了, 拔來拔去, 發現似乎都正常. 後來就開始懷疑是 SATA 排線出問題, 結果, 換了新的線, 還真的可以正常偵測到硬碟, 不過一載入 kernel, 一樣會找不到硬碟. 弄了半天, 發現似乎所有的 SATA 都不正常, 後來改用 IDE 的硬碟來 boot 就正常.... 看起來是 SATA 有問題吧.

換一片幾年前舊的主機板來用, 結果... 一開始似乎也正常, 不過.... 進系統沒多久一樣 kernel panic...

原本打算就直接關了它, 反正現在不是在國外上班了, 就算 firewall 當了 (也很久沒碰到了) 的話, 頂多晚上下班回來就可以修, 似乎也沒什麼必要弄兩台機器做 HA 來預防一當就要等上幾星期才會回家處理的情形了.

後來在網路上看到有人賣一組主機板加上 X2 5000+ CPU 只要 800, 就下訂買回來試看看. 拿到了那天晚上裝上後似乎正常, 不過... 系統還原過程, 又碰到幾次 panic 的情形, 且似乎某個 PCI 的插槽有問題, 不使用似乎就正常了. 結果, 跑了一天之後, 更新 kernel 似乎又有問題.... 結果, 弄來弄去.... 機器拆來拆去的, 不小心碰到電源供應器被燙了一下, 才發現原來上頭的風扇不能動了, 看來不知道是多久之前就這樣了, 不過.... 居然電源供應器還能動 (看來 Zippy 的電源供應器真的不錯用), 還好還有以前留下的另一個備品可以用, 就接上去試看看, 似乎就正常多了.

上線跑了近一個星期, 發現上頭的磁帶機不能正常運作, 只好又拆下來檢查, 似乎是在之前拆拆裝裝時不小心碰到了, 有個零件掉了出來, 就不能用了.... 由於目前每台主機都會把備份的資料相互備份, 也幾乎用不到磁帶機, 就不打算裝了, 因為沒裝就把 SCSI 卡也拔了, 結果, 居然開機會找不到 root (真是奇怪), 接回去就可以找到 (想不通為什麼).... 就只好把卡裝上去了. 

反正, 動來動去, 用了將近一個月, 目前看起來都正常了.... 總計損失了一個電源供應器的風扇, 兩張主機板, 兩個 8" 的系統風扇, 兩個 IDE 的硬碟.

另外, 這期間發現另一台 firewall 主機, 似乎也有點怪怪的, 碰到約兩次 panic, 目前偶爾會在 log 出現 CPU溫度過高的警告, 看起來也許 CPU 的風扇快掛了吧.... 又要找個時間拆開來看看了.

Del.icio.us Furl HEMiDEMi Technorati MyShare
迴響
暱稱:
標題:
個人網頁:
電子郵件:
迴響

  

Bad Behavior 已經阻擋了 160 個過去 7 天試圖闖關的垃圾迴響與引用。
Power by LifeType. Template design by JamesHuang. Valid XHTML and CSS