Google Cloudは11月17日、8月にHarvard Global Health Instituteとのパートナーシップをベースに公開した新型コロナウイルス感染症予測「COVID-19 Public Forecasts」の日本版を提供開始した。
米国で提供している予測サービスはAIと膨大な疫学的データを組み合わせ、時系列の予測を扱う機械学習のアプローチを採用することで実現。米国向けの初期モデルは8月に初公開され、現在も無償で予測情報を提供している。これは、ジョンズホプキンス大学、Descartes Lab、米国国勢調査局などの一般公開データを基にしており、Harvard Global Health Institute監修のもとで更新を続けている。
日本版では、新たに95%予測区間やデータセットの追加に加え、予測対象期間の拡張、モデルの強化による予測精度の改善などを実施。予測開始日から28日間のあいだ予測される陽性者数や死亡者数などの予測を表示する。データは、ダッシュボードの「Data Studio dashboard」、予測結果をデータセットとして呼び出せるデータ分析用のGCP製品「BigQuery」、「CSVファイル」の3つを公開先としている。
感染の態様や広がり方(ダイナミクス)の基本条件は、米国版モデルでも日本版モデルでも同様だが、日本版モデルでは、厚生労働省が発表している新型コロナウイルス感染症陽性者数および死亡者数等のオープンデータ、Googleのコミュニティモビリティレポート、平成27年国勢調査結果など日本のデータセットのみを利用してトレーニングしている。陽性者数や入院・療養等患者数、死亡者数、また人々の移動状況について国内のデータを使用しているため、予測結果には国内の感染状況やそれに対する人々の反応、さらに生活環境といった日本独自の状況が反映されているという。
このモデルは、医療機関や公的機関をはじめとした新型コロナウイルスの影響を受ける組織が、今後より適切な対処を検討・準備する上での参考情報の一つとして利用されることを目的に公開しているもの。同社では、予測の限界を踏まえたうえで、ユーザーガイドの参照や複数のデータソースと組み合わせて、あくまでトレンドとして利用してほしいとしている。
予測結果は学習に使用されるデータに依存する。例えば、一部のデータソースでは、最新情報の繁栄に1~3日程度要することから、予測出力時の入力データのすべての最新情報が含まれていない可能性があるという。また、検査の報告方針の変更など特定の要因で陽性者数が突然変化したような場合、この変化がデータソースや予測結果にタイムリーに反映されない場合があるとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力