グーグルのクラウドを支えるテクノロジー > 第165回 Googleの分散トレーシングツールDapper(パート2)

CTC教育サービスはコラム「グーグルのクラウドを支えるテクノロジー > 第165回 Googleの分散トレーシングツールDapper(パート2)」を公開しました。

###


はじめに
 前回に続いて、2010年に公開された論文「Dapper, a Large-Scale Distributed Systems Tracing Infrastructure」に基づいて、Google社内で使用されている分散トレーシングツールDapperを紹介していきます。今回は、Dapperの性能に関する情報と、Dapperを利用したデータ分析ツールを紹介します。

Dapperのオーバーヘッド
 前回の記事で説明した様に、トレーシングツールの導入に伴う性能上のオーバーヘッドを低減することは、Dapperのデザインゴールの1つです。Dapperによるログ収集の機能は、社内標準のRPCフレームワークに組み込まれていますが、軽量で安定した機能を実現するためにコードの実装はシンプルに保たれており、追加されたコードは、Annotation機能を除くと、C++で1000行以下、Javaで800行以下ということです。Annotation機能による追加は、500行程度です。

 そして実際のコードの平均実行時間は、2.2GHzのx86サーバーで計測したところ、ツリーの起点となるRoot spanで204ナノ秒、その他のSpanで176ナノ秒、そして、Annotationを追加した場合のオーバーヘッドは70ナノ秒ということです。これをすべてのリクエスト呼び出しに適用した場合、Web検索のように高い性能が要求されるシステムでは、そのオーバーヘッドは無視できない可能性があります。そのため、ログを収集するツリーをランダムにサンプリングすることで、オーバーヘッドを低減しています。

この続きは以下をご覧ください
リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]