以前、XenServer6.0.2のバージョンで構築した事があるのですが、構築時はトラブルが続いて順調に進まなかった記憶があります。


例えば、WEB管理画面からパッチを適用したらXenServerが起動しなくなったとか、仮想マシンが突然壊れるとか。当時は、XenDesktopのライセンスで無料で使う事ができたので、利用しましたが、ハイパーバイザーはやはりVMwareを使うのが推奨みたいです。XenServerは怖いですよね。


しかも、最近はXenServer構築してくれるベンダも減っている気がします。


そして、XenServer 6.2以前のバージョンでシステム起動から248日経過後にホストが壊れるという恐怖のバグがあるようです。どの環境でも発生する訳ではないのですが、環境がマッチする場合には注意が必要です。

>>CTX209025 システム起動から248日経過後に XenServer ホストがクラッシュする


まず、問題の原因は以下になります。
XenServer 6.2 以前のバージョン(dom-0 が 32 bit OS) + QLogic 社製のストレージ環境で、XenServer のHA(High Availability) 機能を利用している場合に発生する問題です。
下記バージョンの qla2xxx ドライバでは、システム起動から248日経過時に内部変数のカウンタがリセットされることを契機にストレージがビジー状態と判断される為、ストレージへのアクセスができなくなります。
対象のストレージに HA のステートファイルを格納している場合、Self-Fence によってXenServer ホストが終了される動きが連動して発生してしまいます。

XenServerのバージョンが6.2以前で、且つ、ストレージが限定され、HA機能を利用している環境なので、かなり限定されますが、マジで怖いバグですね。。。運用中に壊れた運用者は死亡フラグですよ。


バージョンをアップデートすればいいですが、すぐに対応できない場合は、暫定対処でXenServerの再起動を行えばいいみたいです。
現象またはエラー
システム起動から248日経過後にXenServer ホストがクラッシュする

解決策
[暫定回避策]
システム起動から 248日以内にXenServer ホストの再起動を行う運用が必要となります。

[恒久対応]
XenServer ホストの kernel version に合わせて次の3種類の Hotfix が作成されています。
お使いの環境に合わせていずれかの Hotfix を入手し適用してください。適用手順についてはCTX212974 を参考にして下さい。(共通の手順となります)

1) XenServer 6.2.0 環境用
Driver Disk for QLogic qla2xxx-8.07.00.16.55.6-k1 - For XenServer 6.2.0

2) XS62ESP1024 環境用
Driver Disks for XenServer 6.2.0 Service Pack 1 with Hotfix XS62ESP1024


3) XS62ESP1038 環境用
Driver Disks for XenServer 6.2.0 Service Pack 1 with Hotfix XS62ESP1038

XenServer構成なら複数ホストがいると思いますので、メンテナンス時間などを設けてとりあえずは、順次再起動をしていけばいいですね。


後は、バージョンアップか、パッチの適用ですね。しかし、このバグ本当に怖いですね。。。構成が近い方は注意してください。