最近發現每天使用 LVM snapshot 備份的時候, 總會有些 snapshot 無法被移除, 找了一下, 應該是 LVM 與 udisks 搭配時發生的問題.
解決方法也很簡單, 就是一直試到可以移除為止. (上頭連結有人說用 lvchange 先改狀態再移除就可以, 不過我試的結果, 也是有無法移除的時候, 所以.... 弄個 loop 來移除, 試到可以移除為止, 這是目前比較可行的方法)
我把原本移除的動作改用 for loop 處理, 目前看起來多試在試了兩三次後就會被移除了.
我用 heartbeat 應該有好幾年了, 好像有 0.x 版開始就用到現在的 3.x 版. 記得剛開始的時候, 功能不多, 不過也沒什麼問題... 現在用的 3.x 版, 最近常常碰到 standby 的機器重新開機 (應該說 heartbeat 的程式停掉再跑), 讓原本正在運作的機器的 heartbeat 突然佔用所有的 CPU, 然後一堆 log 在 ha-log 或 ha-debug 裡頭, 接著... 原本應該正常運作的 heartbeat 就停了.
由於 heartbeat 的 maillist 中看到不少人有類似的情形, 不過... 看起來似乎沒有什麼解決方法. 由於次數越來越多, 所以就想把 heartbeat 換掉. (閱讀全文)
最近在還原 xfsdump 所做的備份時, 碰到幾次無法由原本的備份檔中把所有的檔案還原. 還原的過程會出現
xfsrestore: WARNING: corrupt extent header
xfsrestore: WARNING: unable to resync media file: some portion of dump
這樣的訊息. 在這訊息之後就會中斷還原 (不過最後還是回報成功). (閱讀全文)
這個問題好像也不是只有 e1000e 會出現, 我好像也有在 e1000 上頭看過. 不過... 在網路上頭看到別人出現這問題之後的結果, 那網卡似乎真的無法正常運作. 不過... 在我碰的案例中, 並沒有出現過網卡無法運作的問題, 都只是單純在 log 中出現這個錯誤訊息, 而該段時間的其他 log, 看起來並沒有任何連線或傳輸中段的情形出現. (閱讀全文)
過年前弄了三張 intel E1G42ET 回來, 趁著過年假期在家就試看看 teaming 的效果. 記得以前在 kernel 2.2/2.4 的年代, intel 的網卡是用自己的 iANS 軟體來在處理 teaming, 不過... 看起來該軟體很久沒更新了, 且在目前 intel 的 e1000/e1000e/igb 等 driver 中, 也說明 teaming 的功能在 driver 已經不存在, 要使用 linux 的 kernel 的 bonding 模組來處理. (閱讀全文)
最近在備份時發現常常出現類似下面的訊息:
/usr/sbin/xfsdump: WARNING: could not get list of non-root attributes for nondir ino 234123: Cannot allocate memory (12)
然後在 syslog 裡頭可以看到 kernel 有 page allocation failure 的錯誤訊息.
看起來是與這個問題類似. 通常在剛開機沒多久的時候都很正常, 但是運作久了之後, 就容易出現這個問題. 依據該討論串的說明, 應該是 kmalloc() 在運作一陣子之後, 可能會沒有那麼大的連續可用空間可以使用, 所以 xfs code 裡頭用到這個的時候會發生錯誤. (我沒有把這個 dump 還原來比較, 所以不確定是不是備份會不完整)
systemrescuecd 實在是一個好東西, 對於出問題的 Linux 來說, 有了這東西, 要修起來就變的方便許多. 一般的使用, 除了燒成光碟來使用外, 也可以放到 usb 隨身碟上頭使用.... 當然, 對於已經存在的系統來說, 更可以直接把 .iso 檔案丟到 /boot 或 / 下頭 (看你的 grub 能找到那一個), 讓 grub 直接載入該光碟來開機. (閱讀全文)
這兩天上 pchome 買東西時, 發現要結帳時會無法連線, 查了半天, 查不出有什麼問題, 後來不小心發現, 只要把 proxy 關閉就可以直接連線. 後來進一步測試, 發現所有的 https 連線, 只要透過家裡的 squid proxy 就會無法使用. 看起來像是 squid 所造成的問題. 看一下 squid 的 log, 發現有下面的訊息:
comm_open: socket failure: (97) Address family not supported by protocol
用 google 查了一下, 這個應該與 IPv6 有關.
上個月我把 IPv6 在 kernel 裡頭編譯成模組, 但因為還未打算使用, 所以並沒有任何的設定, 也沒有載入這個模組. 因為這樣, 反而造成 squid 無法使用 https.
目前的解決方法只有:
- 完全不使用 IPv6, 也就是 kernel 或 squid 本身不要加入 IPv6 的支援, 就不會有這個問題.
- 不要把 kernel 的 IPv6 關閉 (如 alias net-pf-10 off), 如果怕 IPv6 的異常連線, 可以先用 ip6tables 把預設的 policy 改成 drop.
我目前是先用第二種方式.
雖然 Darwin Streaming Server 官方對於 Linux 的支援說法, 是建議使用 5.5.5 或更早以前的版本, 不過, 加上適當的 patch 之後, 要在 Linux 上頭使用 6.0.3 版本也是可以.
網路上可以找到在 unbuntu 上頭安裝的說明, 基本上照著這篇文章的步驟, 就可以讓 DSS 6.0.3 在 Debian 下正常的運作. 所以有需要的就照著做就可以了.
不過這個安裝的說明, 並沒有新增任何開機時執行的指令, 所以如果你需要每次開機時都自動去執行的話, 就自己寫一個 script 去執行 /usr/local/sbin/streamingadminserver.pl 就可以了.
我自己是用下面這個 script 來處理:
#! /bin/sh
#
# dss darwin streaming server
#
NAME=dss
DESC="DSS"
set -e
case "$1" in
start)
echo -n "Starting $DESC: $NAME"
/usr/local/sbin/streamingadminserver.pl
echo "."
;;
stop)
echo -n "Stopping $DESC: $NAME "
killall streamingadminserver.pl
killall DarwinStreamingServer
echo "."
;;
restart|force-reload)
$0 stop
sleep 1s
$0 start
;;
*)
N=/etc/init.d/$NAME
echo "Usage: $N {start|stop|restart|force-reload}" >&2
exit 1
;;
esac
exit 0
家裡的伺服器上頭都有裝上 VMWare Server 2.0, 主要就是跑一個 XP 的 VM, 用來讓我可以由遠端使用家裡那台 HP 3050z 的印表機, 除了每個月把小朋友學費轉帳的結果印出來外, 另一個主要的功能就是用來讓我傳真給 etrade (沒辦法, 公司配股是這家管的, 且我們公司不能由電腦直接傳真, 只能印出來再傳, 不過... etrade 轉帳指令要求附上護照影本, 每次印出來再傳都說不清楚, 只好透過家裡的機器直接傳真). (閱讀全文)
其實這似乎沒什麼好寫的, 因為相關的文章應該可以找到很多. 不過, 上星期我自己在裝上 3TB 的硬碟時, 有碰到一些小小的問題, 似乎沒有人提到, 所以就記錄下來. (閱讀全文)
前不久把家裡一台 firewall 的機器由 Debian stable (Lenny) 升級到 testing (squeeze), 結果, 上個月回台灣時, 在準備出國的前一年重開機發現無法正常開機了. 不過... 要處理時, 發現 KVM 掛了, 畫面與鍵盤的運作都不正常, 當下並沒有時間處理, 就決定關機, 等這個月回台時再處理吧. (運氣不好, 這段時間碰到一次家裡的網路連不上.... 只剩一台 firewall, 所以沒辦法判斷是中華電信的問題還是我自己的 firewall 掛了, 造成幾天連不上, 後來網路報修, 還好是中華電信的問題, 他們那邊處理後就可以連線了) (閱讀全文)
這星期把兩個硬碟弄成一個 RAID0 的設備, 用來備份另一台主機上頭的檔案. 原本就有使用 mdadm 來管理另一台主機的 RAID, 所以用起來並不會很困難, 跑一下 mdadm 的指令就產生新的 RAID 了. (閱讀全文)
最近公司的 VPN 改用 Cisco 的設備來處理, 所以目前都使用 Cisco VPN Client 來連線. 之前在公司的宿舍中, 使用 Linksys 的 Wireless Router 時, 發現無法正常使用, 結果居然是要把 Router 上頭的 VPN Passthrough 的功能關閉才能使用 (firmware 寫錯了嗎? 怎麼與我的認知剛好相反?). 而這星期回台灣後, 發現在家裡透過 Linux Netfilter 的 firewall 連線時, 可以登入, 但是登入後沒有任何的回應. (閱讀全文)
前幾天突然發現家裡的伺服器時間不對, 快了約半天左右. 因為上頭有跑 ntpd, 照理應該會自動對時, 機器也跑了一年, 之前的時間都很正常, 至少我可以確定在上星期的時候還是正常的. 試著把時間用 ntpdate 對時一次, 隔了不久, 發現時間又不對了, 仔細檢查一下, 發現每分鐘會快六秒, 有 10% 的誤差. 而用 hwclock 看一下 CMOS 上頭的時間, 並沒有相同的問題, 也就是硬體上頭的時間是正常的, 但是 Linux 所計算的時間會愈來愈快. (閱讀全文)
MySPAM v0.0.5 推出. 其實也沒改到什麼, 這些修正好像都至少有半年了. 與前一版本的差異如下:
- + 新增對同一主機多網域帳號的支援. 登入時請使用 user@domain 的方式登入即可.
- ! 檢查信件第一行是否為 'From [email protected]' 這個非 header 的內容 (某些 postfix 有這行?), 如有就略過.
- ! 如果沒有 SIZE 環境變數, 就自行計算信件大小.
或由這兒抓取最後一個版本: http://www.teatime.com.tw/~tommy/myspam/myspam.tgz
0.0.4a to 0.0.5 的 patch: http://www.teatime.com.tw/~tommy/myspam/myspam_004a_to_005.patch
更新 MyTV 為 0.0.2 版. 修正如下:
- 加入 check_session.sh, 把超過一段時間沒有連線的 producer 結束運作
- 加入預約錄影的功能
主要就是加上預約錄影的功能. 並可以直接用 web 介面抓取或刪除錄影的檔案.
可以由這兒抓取: http://www.teatime.com.tw/~tommy/files/mytv-0.0.2.7z
這幾天在家裡的伺服器弄了 subversion 上去, 要把目前 laptop 上頭一些程式放到上頭去. 結果, 每次一執行 TortoiseSVN 要連線時, 就會出現一個 TortoisePlink 的 Unable to write to Standard output 的錯誤訊息. (閱讀全文)
上星期回台時, 順便更新了機器用的 kernel 到 2.6.26, 結果, 今天要出國前, 特地試了一下上頭的網路電視有沒有問題, 結果... 發現看到的就像斷訊一般的畫面與雜音. 原本以為是第四台的線沒接好, 結果, 交換測試了一下, 發現不管那一條線, 只要接到主機上頭的 Compro VideoMate M355 的卡上, 就是看不到電視的內容. (閱讀全文)
上個月弄了張 Compro M355 來裝在家裡的一台 Linux 主機使用, 不過這張卡雖然仍使用 SAA7134 的晶片, 不過 tuner 與我之前使用的 M300 並不相同, 如果直接載入 saa7134 這個模組, 使用自動偵測的方式, 會得到與 M300 相同的 card 與 tuner 型號, 結果... 當然就是看不到畫面了. (閱讀全文)