IAサーバの内蔵ファンの寿命について

サーバの内蔵ファンの寿命について検討したいと思います。

 

皆さんもそうだと思いますが、私もIAサーバの内蔵ファンの寿命まではこれまでIAサーバにOSを入れるだけで利用している範囲では気にしたこともありませんでした。ではなぜVMwareの仮想環境ではそのようなことを気にしなければならないのでしょうか?

VMware KB2032716:プロセッサの電力管理の設定が原因で、仮想マシンのアプリケーションのパフォーマンスが低下する場合がある
https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2032716

上記KB2032716にあるようにESXの電源管理とBIOSの電源管理機能が食い合ってしまい、低負荷状態では性能が正しく出ないため、BIOSをハイパフォーマンスモードにする必要があります。なお、通常の仮想サーバではそこまで変化を感じない可能性がありますが、VDIの場合はキー入力がモッサリする原因となります。


本題に入りますが、なぜこのPostと内蔵ファンの寿命が関係するのでしょうか?
BIOSでハイパフォーマンスモードにすると内蔵ファンも高いエアフローを得るために高回転になるようです(これは体感)。実際に、勤務先の環境ではIBMのx3550のVDI用ESX環境15台とIBMのx3650の仮想サーバ用ESX環境約35台(詳細忘れました)があります。

x3550内部(lenovopress.comより引用)

https://lenovopress.com/assets/images/tips0851/6.4A6A.jpg

x3650内部(lenovopress.comより引用)

https://lenovopress.com/assets/images/tips0805/9.3008.jpg



VDIは私が初期チューニングをしたため、ハイパフォーマンスモードになっているが、仮想サーバ用はノーマルの設定になっています。これらのサーバを3年間運用すると1Uサーバであるx3550は内蔵ファン故障が3年を経過すると頻発(半年で5回程度)するようになり、2Uでノーマルのサーバでは一切発生していません。

結論としてはパフォーマンスモードで高回転稼働させると
1Uサーバに搭載された小型ファンでは3年経過すると故障率が非常に高くなり
管理者のメンテナンス工数が上がることを示唆しています。このようなことになるには理由があります。同CPUを搭載している場合、CPUを冷却するのに必要なエアフロー(流量)は1U、2U共に同じですが、ファンのサイズが1Uと2Uでは異なるため冷却効率が異なります。つまり、小さい1Uのサーバではファンを2Uと比較しても高回転化する必要があり、その分寿命が短くなるだけでなく、さらにファンの数が2Uと比較し2倍以上あるため故障率が上がりやすいということになります。

つまり、管理者視点で見た場合、例えハード保守契約がありCEコールをするだけとはいえどメンテナンス前にESXをメンテナンスモードに変更してシャットダウン後にCEに引き渡して物理作業完了後にログインサポートをするだけとはいえど、回数が増えるとその分だけハードメンテナンス工数が上がることを考慮するとIAサーバで1Uを選択する理由がスペースだけだということが分かります。

次回は1Uサーバで10Gスイッチ以外を利用するとこうなる、ということについて触れたいと思います。