Amazonの「Dynamo」、Facebookの「memcached」、LinkedInの「Voldemort」といったシステムでは、データはキーと値のペアとして格納される。Googleの「MapReduce」テクノロジやYahooの「Hadoop」ベースのテクノロジでは、検索エンジンデータの処理などのタスクにキーと値のペアが使われる。
FAWNクラスタのプログラミングは難しいだろうが、FAWNクラスタをキーと値のペアに適合させれば、特殊用途のサーバアプライアンスとしてパッケージ化できる。顧客は内部の仕組みを詳しく知る必要はない、とAndersen氏は言う。
このような大規模システムは安くない。ハードウェア、ソフトウェア、メンテナンスのコストに加えて、電力のコストがある。そして、企業はエネルギーコストを実質的に2度支払わなければならないことが多い。サーバが熱を排出するため、データセンターを冷やさなければならないからだ。
研究者たちが、エネルギー1単位当たり何件のデータ格納クエリを完了できるかを比較した結果、FAWNは顕著な成績を示した。Intelの「Q6700」クアッドコアプロセッサ、2Gバイトのメモリ、MtronのSSD「MOBI」を搭載した従来型のサーバでは1ジュール当たり52クエリであったのに対し、FAWNクラスタでは346クエリだった。新しい設計でのテストでは、さらに良くなる兆候が示されている。同論文には「SATAベースのフラッシュドライブと組み合わせたAtomベースのシステムを使用した予備実験では、1ジュール当たり1000クエリ以上になる可能性があることが示された」と書かれている。
このアプローチは、多様な作業に適合させることができる。それほど頻繁にアクセスする必要がない大きなデータ要素の場合、FAWNクラスタを従来のハードドライブと組み合わせて構築できるかもしれない。極めて頻繁に必要とされる小さなデータ要素の場合、FAWNクラスタで従来のメモリを多く使用できるかもしれない。
サーバにはこれまで、一時的な流行がいくつかあった。主にローエンドのプロセッサをぎっしりと押し込めたブレードサーバの初期世代は、商業的には失敗だった。しかし、インターネットに向き合っているデータセンターは、最近の大きなビジネスであり、クラウドコンピューティングが盛んになるにつれて、さらに大きなビジネスとなる。FAWNのアプローチは、少なくともこの分野では受け入れられるかもしれない。
しかし、商品化しようとするなら、名前を変えることを考えた方がよい。
「弱小ノードと名付けられたデバイスを生産したいメーカーなどないのではないかと悩んでいる。それでも、われわれはこの名前が気に入っている」(Andersen氏)
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。原文へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)