###
はじめに
今回からは、2022年に公開された論文「CacheSack: Admission Optimization for Datacenter Flash Caches」を元にして、Googleのデータセンターで使用されている、フラッシュディスクによるファイルキャッシュシステムを紹介します。この論文では、数理最適化を用いてキャッシングポリシーを選択するアルゴリズムが紹介されており、ITシステムにおける数理最適化の応用例としても興味深い内容です。今回は、最適化の対象となるファイルキャッシュシステムのアーキテクチャーを説明します。
「Colossus Flash Cache」のアーキテクチャー
Googleのデータセンターでは、Colossusと呼ばれる分散ファイルシステムが標準的に利用されています。冒頭の論文によると、近年のColossusの利用状況において、読み込み性能を保つために必要なコストの増大が課題となっていたそうです。技術の発達によりハードディスク1本あたりの保存容量が急速に増加する一方、IO性能、とりわけ、読み込み速度はそれに見合うだけの性能の向上が得られていません。高速にデータを読み出すには、複数のディスクにデータを分散保存して、読み込みの並列度を上げるという工夫が必要になります。その結果として、ハードディスクの空き容量に関わらず、読み込み速度を確保するために多数のハードディスクが必要になるという状況が生まれます。
この続きは以下をご覧ください
リンク
御社のプレスリリース・イベント情報を登録するには、ZDNet Japan企業情報センターサービスへのお申し込みをいただく必要がございます。詳しくは以下のページをご覧ください。