これからの情報検索は“捨てる”技術--国会図書館の長尾氏が講演

  • このエントリーをはてなブックマークに追加

 ウェブの分野で世界的に影響力のある研究やビジネスを生み出すためにはどうすればよいかを議論することを目的に、12月7日に東京大学の安田講堂で「第1回ウェブ学会シンポジウム」が開催された。国立国会図書館館長の長尾真氏が「ウェブ研究に求められるもの−課題と期待−」と題した基調講演を行った。

 長尾氏は国立国会図書館の館長、さらに工学博士としても出版物の電子化やウェブサイトのアーカイブ化に取り組んでいる。従来はサイトごとに許諾を取る必要があったネット情報のアーカイブ化は、2009年7月に成立した改正国立国会図書館法により、国や行政法人、国立大学のサイトに限っては、許諾不要で情報の収集が可能になった。

国立国会図書館館長の長尾真氏国立国会図書館館長の長尾真氏

 今後は「この対象をどこまで広げていくか。短期間に消えてなくなることがあるネット上の情報に対処する技術も必要」と長尾氏は語った。

 国立国会図書館は現在、すべての紙の出版物に対して献本を義務付けているが、今後は電子納本の検討もしていると話す。だが、その一方で「出版社が出すものだけが出版物とは限らず、その定義づけが難しい」と現状の問題点を説明する。

 「現在は数十部から100部以上の不特定多数を対象とした出版物を仮の定義としているが、自費出版も含めて納本の対象にしていきたい」と将来的な意向が明かされた。

 さらに長尾氏は、ネット上の情報における重要な課題の1つとして、正確さや信頼性の確保を挙げた。「いまやインターネットの情報は図書館と同じようなもの。信頼性こそが図書館にとっての最後の砦」と述べ、図書館が主体となって行うアーカイブ化の意義を主張した。その上で「だれもが安心して情報を集めたり、アクセスしたりするために、ネット社会においては法律のようなある程度規制するものも必要ではないか」と提言した。

 また、情報検索における重要な課題について長尾氏は、「ロングテールの情報をどう見るか。検索結果の上にある情報がいちばん重要というわけではない」と語った。「Googleで10万件ヒットした検索結果は、検索していないのと同じこと。今後は“集めない情報”や“捨てる情報”をどうするかが課題。Googleでさえも10年後に今と同じ方法で情報を集めているかは疑問」と予測した。

 現在のGoogle型の検索の時代から新たな技術への転換の必要性を訴えたうえで、独立行政法人情報通信研究機構(NICT)が開発中の情報の信頼性を解析するシステム「WISDOM」や、京都大学が研究している自然文検索システムを紹介した。

 一方、英語圏以外の書物を対象から外すことで決着した、Googleの全文検索和解案についても言及した。「反対を表明していた権利者にとってはハッピーな結果かもしれない。しかし、これは逆に言うと、世界のすべての人から日本の著作物が無視されるという危険性にもつながっている」と指摘した。「世界から取り残されないためにも、日本独自で書物をスキャンをするとか、独自の方法で世界に発信する努力をしなければ、日本の著作物が世界から阻害されてしまう可能性がある」と危惧を訴えた。

 また、「ほかの国では、ネット上の意見を収集し、マーケットのストラテジーを立てたりもっと活用している」と語り、国家としての日本の検索能力の低さも指摘した。

 最後に、今後のウェブ研究に求められるものとして、「言語処理、画像処理、人工知能、知識工学、情報通信、ソフトウェア科学などの技術分野だけでなく、法学、社会学、心理学、認知科学などあらゆる分野にまたがる研究のが必要。さらに、実の世界の学問と同様に、虚の世界の有り様についての多面的な研究が大切」と主張した。

 また、「ウェブ世界の発展に向けて民間の人にも期待したい。すべての人が情報知識の利用者でもあり、クリエーターであるというのは望ましいこと」と続け、ウェブの世界ならではの発展性への期待を語った。

  • このエントリーをはてなブックマークに追加