ウェブコンテンツの新しい流通手段としてRSS/RDFを使ったヘッドライン配信に対する関心が高まっている。米国では多くのニュースサイトがRSSを使ったヘッドライン配信を行う一方、Blog(ブログ)でもRSSがヘッドライン配信の標準的な手法として利用されている。また、CNET Japanでも3月にRSSでのヘッドライン配信を開始している。
今回はRSSの利用に積極的に取り組んでいるデータセクションの橋本大也氏にRSSの魅力や活用法について聞いた。
―― RSSとはどのようなものですか?
RSSとは、Webページのメタデータの標準形式のひとつで、XMLの形式で記述されています。ニュースの見出しや要約を小さなXMLファイルとしてまとめたものです。
例えばこんな感じですね。
XMLのお決まりの定義の後、channnelという要素としてコンテンツの名前やサイトの名前などが置かれます。DublinCoreというメタデータの名前空間の定義を使って、コンテンツの言語や権利関係、発行日などが続きます。
そして各記事のメタデータとして、以下のような項目がメイン部分として配信される記事の数だけ並んでいます。
|
| |||||||||||
itemタグで囲まれた内部がひとつの記事に関するメタデータとなっています。
このメタデータは、ニュースサイトの見出しを表示するWebアプリケーション(いわゆるCGIを含む)、やデスクトップアプリケーションが読んで解析することで、さまざまな応用ができます。エンドユーザがニュースチェックに使うだけではなく、サーバ間の情報共有のための通信にも使われます。
現在注目されているインターネットのキーワードとして、セマンティックWebという構想があります。Webページのメタデータを集約し、そのデータベース内の知識を抽出して構造化することで、Webを今より情報の次元として一段階高次化された形にしよう、というものです。RSS・RDFメタデータはセマンティックWebを実現する上でキーとなる技術です。
【参考情報】
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」