Research In Motion(RIM)は、同社の人気端末「BlackBerry」で米国時間4月17日の夕刻に発生し、18日早朝まで続いた大規模な電子メール障害について、19日遅くになってようやく原因の詳細を発表した。
RIMの声明によると、電子メール障害の原因は、セキュリティの問題や処理能力の問題ではないという。また、ハードウェア障害やコアソフトウェアの問題によって引き起こされたトラブルでもないと述べている。今回の障害では、多くのBlackBerryの熱狂的愛好者(「クラックベリー」と呼ばれる)が、数時間にわたって電子メールを利用できなくなる事態を招いた。
このような原因を否定した上で、RIMは「今回のトラブルは、システムの基幹以外の部分に新たなルーチンを導入したために発生したと断定した。これはシステムのキャッシュをより最適化する目的で導入されたものだった」と述べている。キャッシュとは、データの読み出しを高速化するために一時的に保存する場所を指すコンピュータ用語だ。
RIMによると、この「システムルーチン」が現用のBlackBerryのサーバやインフラの運用に影響を与えることは想定していなかったという。しかし、事前にテストを実施していたにもかかわらず、この新しいシステムルーチンにより予想外の影響が発生し、これがきっかけとなった連鎖反応が、システムの運用データベースとキャッシュとの間に干渉エラーを引き起こした。
RIMは、データベースのうち、問題が起こっている部分を切り離して問題の修復を試みたが、これに失敗したため、バックアップシステムへの迂回処理を開始した。しかし、この処理もうまくいかなかった。
「バックアップシステムと迂回処理は、これまでの度重なるテストでは問題なく動作していた。しかし、今回の状況では期待していたほど迂回処理がうまく行われず、その結果、サービスの復旧と、トラブルによって送信待ち状態となっていたメッセージの配信がさらに遅れてしまった」と、RIMは声明の中で述べている。
RIMはまた、今回の障害を受けて、テスト、監視、修復の各プロセスで強化の必要がある部分をすでに特定したことを明らかにした。
17日の午後5時(太平洋夏時間)ごろに障害が発生して以来、RIMはその原因について何も発表していなかった。しかし、障害の間も音声通話やショートメッセージの送受信は可能だったことから、専門家たちは、問題があったのはRIMのネットワークに関係する部分だと確信していたと述べている。
RIMではBlackBerryが送受信するすべての電子メールについて、2カ所にある主要ネットワークオペレーションセンターのどちらかを経由させる仕組みを取り、サービスを集中管理している。この2つのセンターは、簡単に説明すると、非常に大規模なデータセンターだ。1カ所はカナダのウォータールーにあり、おもに全世界のうち西半球地域と一部のアジア地域のサービスを担っている。もう1カ所はイギリスにあり、ヨーロッパ、アフリカ、中東地域の電子メールトラフィックを処理している。サービス障害の影響を受けたユーザーの大半が北米在住だったことから、アナリストたちはカナダのセンターに問題が発生したのではないかと推測していた。
RIMによると、18日午前には北米ユーザーの電子メールの配信が徐々に再開し、19日にはサービスは正常に戻ったという。
RIMは信頼性の高い通信サービスプロバイダーとして定評を確立しており、契約ユーザーには銀行や法律事務所、さらには連邦議会の議員までが名を連ねる。最近になって、同社はさらに顧客層を拡大しようと、「BlackBerry Pearl」や「BlackBerry 8800 Series」といった新製品を発表したところだった。
この新戦略が功を奏し、RIMは加入者を急速に増やしている。同社の発表によると、2007年3月3日に終わった直近の四半期では102万人の新規加入者を獲得し、合計加入者数は800万人に達したという。NTPとの特許侵害訴訟が和解に至った約1年前の時点では加入者数が200万人だったことを考えると、これは急激な伸びだ。同社はさらに、6月2日までの今四半期中に112万5000人から115万人の加入者増を見込んでいる。
この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス