Googleが米国時間9月5日、「Dataset Search」を立ち上げたと発表した。
学術的な資料の検索サービス「Google Scholar」と同じように、パブリッシャーサイトやデジタル図書館、執筆者の個人的なウェブページなど、あらゆるホスト先のデータセットを対象とし、科学者やデータジャーナリストらがウェブ上の膨大な情報の中から必要なデータセットを容易に見つけ出すのを支援する。
たとえば、日々の天候の記録を分析したい場合、「daily weather」と入力すると、米航空宇宙局(NASA)や米海洋大気庁(NOAA)のほか、Hardvard大学の「Dataverse」などの学術機関のレポジトリのデータが情報提供者や更新日などの情報とともに表示される。
Dataset Searchの開発にあたり、Googleはデータセットの提供者に向けたガイドラインを作成し、作成者や公開日、データ収集方法などの情報を提供するよう促している。情報はオープンスタンダードのschema.orgに準拠して整理されている。この情報をGoogleが分析し、同じデータセットの異なるバージョンを特定したり、そのデータセットについて論じている可能性のあるものを抽出したりしている。
現在も複数の言語に対応しており、今後も対応する言語を増やしていく予定だ。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力