最終更新時刻:2009年7月10日(金) 11時13分

セマンティックWeb技術・RSSを解説する

橋本大也(データセクション 代表取締役CEO)

2003/04/22 10:06  

 ウェブコンテンツの新しい流通手段としてRSS/RDFを使ったヘッドライン配信に対する関心が高まっている。米国では多くのニュースサイトがRSSを使ったヘッドライン配信を行う一方、Blog(ブログ)でもRSSがヘッドライン配信の標準的な手法として利用されている。また、CNET Japanでも3月にRSSでのヘッドライン配信を開始している。

 今回はRSSの利用に積極的に取り組んでいるデータセクションの橋本大也氏にRSSの魅力や活用法について聞いた。

―― RSSとはどのようなものですか?

 RSSとは、Webページのメタデータの標準形式のひとつで、XMLの形式で記述されています。ニュースの見出しや要約を小さなXMLファイルとしてまとめたものです。

 例えばこんな感じですね。

 XMLのお決まりの定義の後、channnelという要素としてコンテンツの名前やサイトの名前などが置かれます。DublinCoreというメタデータの名前空間の定義を使って、コンテンツの言語や権利関係、発行日などが続きます。

 そして各記事のメタデータとして、以下のような項目がメイン部分として配信される記事の数だけ並んでいます。

<item rdf:about="http://japan.cnet.com/svc/rss?id=1261.47623.52827">
 <title>MS、サーバソフトのライセンス規定を変更へ</title>
 <link>http://japan.cnet.com/svc/rss?id=1261.47623.52827</link>
 <description>米マイクロソフトは使用するプロセッサ数に応じてライセンス料を請求するよう、サーバソフトのライセンス規定を変更する見通しだ。</description>
 <dc:date>2003-03-14T11:22+09:00</dc:date>
</item>

各要素の名前と意味
title ページのタイトル
link ページの存在するURL
description ページの説明や要約
dc:date ページが公開された日時

 itemタグで囲まれた内部がひとつの記事に関するメタデータとなっています。

 このメタデータは、ニュースサイトの見出しを表示するWebアプリケーション(いわゆるCGIを含む)、やデスクトップアプリケーションが読んで解析することで、さまざまな応用ができます。エンドユーザがニュースチェックに使うだけではなく、サーバ間の情報共有のための通信にも使われます。

 現在注目されているインターネットのキーワードとして、セマンティックWebという構想があります。Webページのメタデータを集約し、そのデータベース内の知識を抽出して構造化することで、Webを今より情報の次元として一段階高次化された形にしよう、というものです。RSS・RDFメタデータはセマンティックWebを実現する上でキーとなる技術です。

【参考情報】

CNET_ID

メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。