サーバトラブル事例(1)の続き。
問題が起きたときは、まず慌てずに問題の切り分けを行います。切り分けとは、何が原因で問題が起きているかを把握することです。
まず、ハードウェアの問題なのか、ソフトウェアの問題なのかを探ります。
OS は長時間安定して動いていても、なんらかのきっかけで reboot すると、突如調子がおかしくなることがあります。
弊社の場合、全てのサーバを FreeBSD で動作させており、多様な機種を同じ kernel で動作させています。この時も、まったく同じ kernel は他の機種で問題なく動作していたため、kernel の問題ではなさそうだ、という結論になりました。(これだけでは 100% 違うとは断定できません)
次に、ラックを疑います。ラックはサーバの動作に一見関係なさそうですが、ラックの搭載位置が変われば、対地電位なども変わってきますし、空調の具合も違いますから、冷却関係に影響することもあります。
まずは、一旦古いラックにマシンを戻し、そこで動作させてみることにしました。
すると、古いラックに移動させたマシンは、reset、reboot が起きず、問題なく動き続けます。これで、問題はラックに起因することだろう、という検討が付きました。
次に、ラック移動と同時に変わったものを疑います。ラックが移動すれば、当然、電源も違うタップから供給することになります。
そこで、古いラックに入れたまま、新しいラックから給電します。すると、また、reset、reboot 現象が起きることが確認できました。これで原因は、電源関係だ、という可能性が濃厚になります。
データセンターの担当者に確認すると、ラックには A系統、B系統の電源系統から給電されていて、古いラック、新しいラックとも、同じ電源系統だということでした。
テスターで電圧を測ってみましたが、A系統、B系統、それぞれ古いラック、新しいラックとも、電圧はほぼ100V弱で同じでした。しかし、テスターの電圧表示というのは実効値であり、給電装置が実効値を見て電圧を調整してるので、同じになって当たり前です。実際の波形は、現場におっしろスコープが無かったので確認できませんでしたが、違った可能性があります。
とりあえず原因は電源関係と分かったので、解決することにしました。
続きは後日。
※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。
ネットワーク型産業構造への衣替え?
iPhonista Nightの事後報告
"嵐"のように消えたキャメロンディアス
スパム
アフィリエイトの仕組みを知らない?技術者のITリテラシー
OSC2008Tokyo/Fallで勉強会大集合開催
月5000円を得るための代償
iPhone2.2では、絵文字に対応?
すでに土砂降りのIT業界みんなのお題では、ブロガー同士で質問を出し合いそれに対する回答や意見を集めています。今日はどんな話題が盛り上がっているでしょう?
CNET Japan ブログネットワークは、元はCNET Japanの一読者であった読者ブロガーと、編集部の依頼により執筆されているアルファブロガーたちが、ブログを通じてオンタイムに批評や意見を発信する場である「オピニオンプレイス」、また、オピニオンを交換するブロガーたちが集うソサエティです。
広い視野と鋭い目を持ったブロガーたちが、今日のIT業界や製品に対するビジョンや見解について日々熱く語っています。
CNET Japanやその他サイトが提供するITニュースやコンテンツへの意見や分析、 ビジネスやテクノロジーに対するビジョンや見解について語っていただける方を 募集しています。ご応募はこちらから
ブログの投稿はこちらから(※ブロガー専用)
今年最も活躍したブロガーを表彰します。詳細はこちらから
これは、CNET Japan 編集部の依頼に基づいて執筆されているCNET Japan アルファブロガーによるブログの印です。
CNET Japan ブログネットワーク内で拍手の代わりに使用する機能です。ブログを読んで、感激した・役に立ったなど、うれしいと思ったときにクリックしてください。多くGood!を獲得した記事は、より多くの人に読まれるように表示されます。
[レビュー]2011年画質を備えた高画質、多機能Blu-ray--ソニー「BDZ-X95」
今週の新製品総チェック:よりモバイルPCとして進化した「Let's note」が登場
今週の新製品総チェック:フルサイズCMOS搭載のキヤノン「EOS 5D Mark II」が登場
今週の新製品総チェック:第4世代iPod nano登場、ソニー「α」、松下「LUMIX」に新機種も