XMLの真価を問う

 7年前、新しいウェブ技術標準の策定に着手したとき、Tim Brayとウェブ技術標準団体W3C(World Wide Web Consortium)のメンバーには非常に明確な使命があった。インターネットに接続したシステムがデータ交換をするための新しいフォーマットが必要だったのだ。HTML(HyperText Markup Language)でのデータ交換が一層困難になってきていたためだっだ。

 Brayが開発に参加したソリューションは、XML(Extensible Markup Language)。XMLはその後、ITの礎石のひとつとなり、今日では複数の異なるコンピュータシステムがデータを交換するための基本言語となっている。MicrosoftはXMLベースの技術に大きく賭けており、新しいバージョンのOfficeはXMLを利用することで、バックエンドのシステムからデータを閲覧したり交換するための「導管」へと変わろうとしている。IT業界の大手ベンダーもXMLベースのWebサービスに投資している。また、Wal-Martのような大企業も、XMLを使い社内の業務プロセスの合理化を進めようとしている。

 Brayは現在、新たな課題として、データを視覚的に表示することに挑戦している。彼の会社であるAntarticaはウェブ検索や企業ポータルなどから得た情報を直感的な地図ベースのフォーマットで表示するツールを販売している。

 BrayはCNET.News.comのインタビューに答え、XMLの普及について、そして検索技術の課題やその他の懸念事項について語った。

---XML開発の目的は何だったのですか。

 1996年のことですが、ウェブは既に皆の想像を超えるほど広く普及していました。ウェブのアーキテクチャには良い点も多くありましたが、一方でウェブが情報提供ツール以上のものに発展するのを妨げるような深刻な障害が存在していたのも事実です。

 電子商取引でのマイクロペイメント(少額決済)や、様々な種類のコラボレーションについて、既に議論がなされていました。私たちがマシン間のコミュニケーションを実現する必要があったのはそのためです。また、ウェブオーサリングの産業化が進み、従来からある出版業と変わらなくなっていました。再度目的を持たせたり、シンジケートを作ったりすることが必要でした。

---そこで、HTMLは十分ではないと考えたのですね。

 HTMLが、これらの目的を果たすのに向いていないことは明らかでした。HTMLは情報配布の手段としては素晴らしいものです。しかし、マシン同士のコミュニケーション手段としては問題があります。HTMLは元来あいまいなものだからです。また、HTMLはタグがあらかじめ決まっており、独自のタグを作ることができないという問題もありました。一方で、SGML(Standard Generalized Markup Language)という言語は数十年前からありましたが、ウェブ上で行いたいことを実現するには欠点が多いと思われていました。

 SGMLに関係していた人で、ウェブ上に登場する人はほとんどいませんでした。ですから必然的にその関係者全員が集まって、(W3Cリーダーの)Jon Bosakを中心としたワーキンググループを形成しました。目的はただ、産業ベースでの情報発信、つまり現在私たちがBtoBと呼んでいるものに役立つものを提供することでした。

---初めの頃はWebサービスを中心にXMLへの関心が集まりましたね。しかし今では、異種のシステム間でのデータ交換を可能にする、潤滑剤の一種として考えられているようです。このような状況を予想していましたか。

 現在、XMLが実際に使用されている環境で、おっしゃったようなことが起きているのは疑いの余地がありません。簡単かつ迅速に、大変なアプリケーション統合が起きています。様々なシステムが混在する世界ですから、企業買収や合併が速いスピードで進み、また社内での中央集権化が求められるなか、大規模かつ困難で複雑な統合問題に誰もが直面しています。そして突然、新旧を問わずほとんど全てのアプリケーションにはWebサーバが必要だと気づくのです。しかし、XMLメッセージを送受信すれば、それだけでエンタープライズアプリケーションの統合において素晴らしく十分な結果を得ることができます。このようなケースは現在、非常に多く見られます。

---Webサービスについてはどうでしょうか。現在のところ、話題先行で実体が伴わないように見えます。

 話のレベルによります。ウェブを利用して非常に大規模なアプリケーションを展開したい場合、もしくはあるネットワーク内で展開したいアプリケーションがある場合、システム間のコミュニケーションを可能にする方法は色々あります。CORBA(Common Object Request Broker Architecture)やJava RMI(Remote Method Invocation)などです。XMLフォーマットのメッセージを使ってこれらを統合するという考えは非常に成功しており、既に数多く実行されています。ただし多くの場合、その場限りです。つまり何人かが集まって、これが必要だと決めた場合だけです。ですからこれを形式化しツールキットを構築するというのはよい考えだと思います。Webサービスという観念は大いに意義のあるものと言えるでしょう。

 とはいえ、様々な標準規格が不規則に広がり、山積みになっています。彼らが何を議論しているのか、私には皆目見当が付きません。ある程度はご指摘通りで、空中の楼閣が築かれつつあります。

 ただし、SOAP(Simple Object Access Protocol)のような基本的なものは、大半のサーバやクライアントインフラストラクチャー上に展開されています。SOAPは本物です。私はWSDL(Web Services Description Language)を使っていませんが、これも確かに役立ちます。MicrosoftやVisual Studio .Net環境のユーザーのための素晴らしい統合技術もあります。もしWebサービスを利用したいとして、WSDLの記述を書ければ、驚くほど少しの作業を.Netマシン上で行うだけでアプリケーションを統合することができます。ですから話ばかりではなく、きちんとした実体もあると思います。

---XML標準は、自由なデータ交換の下地作りが1つの目的でした。各社がXML標準の上に独自技術を載せる動きについてどう思われますか。

 普通の人は誰でも懸念しているはずです。大きなシェアを持つベンダーは明らかに顧客を囲い込みたいと考えていますが、XMLはその性質上、顧客の囲い込みを困難にします。XMLはオープンな方向へと向かう性質のものだからです。社会的にもそのような期待をされています。XMLフォーマットで配信し、それがプロプリエタリなものだったら、報道陣やアナリスト、顧客から何らかの非難を受けるでしょう。だから、XMLはMicrosoftのような企業による囲い込みを困難にすると思います。

 私の見た限り、Office 2003用のXMLフォーマットは私でも扱えます。単純なフォーマットではないし、むろんWordは単純な商品ではありません。しかし必要であれば、私でもWordのXMLファイルを処理して特定の語句を含むテキストを全文から抽出するスクリプトを書けるでしょう。旧バージョンのWordではそれは非常に面倒な作業でした。

 ですから、確かに懸念の余地はあります。業界としても、自分のデータに対する自由なアクセスを守るため、絶えず警戒しなければなりません。しかし、我々は正しい方向へと向かっています。

---成功する企業とは、XML本来のインターオペラビリティと、ビジネス上優位に立つための独自技術の間に、魔法のバランスを見出した企業なのでしょうか。

 その通りです。あるアプリケーションを市場に持ち込んでXMLの旗を振りかざした場合、こう理解されるでしょう。そのアプリケーションはXMLでの入力を受け入れ、また情報を何も盗まずにXMLで返すつもりだと。その人が自分のアプリケーションのなかで何をするかについて、私は関心がありません。関心があるのは、私の求めるビジネス価値を生むかどうかです。

 私の会社では、XMLでデータを受け入れ、またXMLでの出力を提供します。しかし社内ではXMLは全く使わず、非常にプロプリエタリなデータ構造を持っています。これがXMLの真の強みなのです。

---過去にXMLは開発者にとって難しすぎるとコメントされましたね。今でも同じ意見ですか。

 XMLはプログラミングが難しすぎるというエッセイを書きました。そこには多くの考えを盛り込んでいます。内容には注意を払い、一字一句に責任を持っています。XMLのビジネス価値はとても高く、実装を正当化するには十分です。しかしXMLが開発者にとって使いやすく、生成しやすくなったかという点では、私が望んでいたほどでがありません。私自身がXMLを利用/生成するアプリケーションを個人的に書いたとき、必要以上の作業が要求されると感じました。

 とはいえ、インターオペラビリティやオープン性、そして市場での魅力という面で、XMLには時間と労力を費やすだけの価値があります。必要なのは改良されたソフトウェアであり、それももうすぐ手にできるでしょう。特に.NetにおけるXMLのハンドリングでは、そのジョブを終了するのに必要とされた作業量という点で、以前に比べて相当進歩しています。XMLそのものが、オープンで互換性のある国際的なデータ形式であり、非常に価値のある前進だと考えています。ですから、実際のツール開発が追いつくのに時間がかかっても驚くことではありません。ツールは開発されつつあり、その進歩を非常に嬉しく思っています。

---Antarcticaが何をしているのか、またXMLとの関連について教えてください。

 Antarcticaが前提としているのは、企業は一般的に情報収集が非常に得意だが、ウォール街は企業の情報収集能力を評価しないということです。一般的に企業は山積みとなった大量の情報の束から十分な価値を引き出せていない、という認識を最高情報責任者(CIO)や最高技術責任者(CTO)の大半が持っています。

 そこで、山と積まれたデータからより多くの価値を掘り起こし、生み出すことに興味を持ちました。データの山から適切な費用対効果を得られない弱点のひとつはユーザーインタフェースにあると結論を出したのです。PC用のGUI(graphical user iterface)の出現に似た話です。その昔、コンピュータは限られた人たちのためのものでした。"デスクトップ"というメタファーとともにGUIが登場してから、コンピュータの利用が大きく拡大しました。

 Antarcticaの仮説として、複雑な情報の世界にもGUIを導入すれば、そこに価値を切り開くことができると考えています。私たちの場合、メタファーはデスクトップではなく、地図です。

 XMLについては、外部とのやりとりの時だけ使っています。私たちは直接データを交信できるSQLデータベースを利用しており、またXMLにも対応します。興味深いことに、実際には、データベースとのやりとりを選んだケースは1件だけでした。ほかは皆、XMLを好んで選びましたね。

---検索の分野には多くの企業の関心が集まっています。企業はアルゴリズム(演算)よりもユーザーインタフェースの問題に焦点をあてるほうが成功すると思いますか。

 全くその通りです。検索技術の大幅な向上は期待できません。検索のための基本的なアルゴリズムは1975年ごろからあまり変わっていません。この状況を改善する唯一の方法は、検索エンジンの能力を上げるためにもっと決定論的なメタデータを用いること、本質的にはナレッジマネジメントの技術を付け加えることです。それにより、どこから関係性を導くべきかということが分かります。Googleが検索エンジンビジネスで成功したのは、優位性のある検索技術を持っていたからではありません。ひとつの鍵となるメタデータ価値を展開したからです。そのページにいくつのリンクが張られているかというもので、これにより、検索結果の関連性が向上しました。同じコンセプトを企業にも適用する必要があります。

 情報を得るには実際には2つの方法があります。検索とブラウジングです。ブラウジングにも大きな可能性が潜在しています。ただしそれには、データの掘り込みを直感的にしなくてはなりません。そこで失敗してはだめです。関連性の高いものをトップにもってくることに対して、本当に積極的にならなければなりません。必要なものを手にいれるのに、いくつもの階層を見て回ることをユーザーに強いるわけにはいきません。

---そこで、視覚的な表示が大きな役割を果たすのですか。

 はい。1インチ四方あたり最も多くの量のデータを見せる表示技術は、地図作成法にあることがわかりました。それが、私たちが地図のメタファーを採用する理由です。検索結果のリスト表示では、情報が薄すぎます。私にも責任の一端がありますが。Googleは、検索結果リストは一次元的なものだという幻想を生み出します。最も興味深いことに、実はそうでもないのです。

 例えばGoogleに「bicycle」と入力しても、Googleは私が何を探しているのかわかりません。自転車レースの結果を見たいのかもしれないし、Queenの楽曲に興味があるのかもしれません。地図を使えば、すぐに検索を始められます。音楽分野で「bicycle」にマッチした結果、アウトドアスポーツ分野でマッチした結果、ショッピング分野でマッチした結果が画面に現れるからです。

---あなたはW3Cに大きく貢献されていますが、標準化プロセスについてどう考えていますか。XMLのような例ではうまく機能しているようですが、SVG(Scalable Vector Graphics)のように進展の遅いものもあるようですが。

 標準化プロセスは新しい技術を扱うには向いていません。ですから、市場の先を行くべきだという意見には反対です。標準化のプロセスは既に解決済みの問題があるときに最も有効です。正しい方法についての合意が既にあり、そのルールを単に文章に落とすだけですから。

 それこそがXMLの正体です。SGMLが開発されてから15年が経っており、マークアップやテキストがどのように機能すべきか、十分なノウハウが蓄積されていました。ウェブが生まれてからも5年が経ち、URL(Uniform Resource Locators)の機能の仕方も分かっていました。さらにUnicodeも既に生まれていたので、国際化の方法も知っていました。XMLはこういった解決済みの問題を取り上げて、それを整然とパッケージ化して、それら全てについての合意を得たのです。

 SVGは別です。SVGについて諦めてはいませんし、SVGには明るい未来があると思っています。他の似たような技術よりもずっとすばらしいものだからです。SVGの開発者はあまり多くの発明をしませんでした。他の発明はAdobeやMicrosoftの人々が知っています。

 XMLについては多分、W3Cの場でするべきことはもうあまりないでしょう。XMLが成功した理由は、誰にも気付かれなかった点にあります。我々はレーダーの下を低姿勢で、迅速に進みました。だから、大手ベンダーが気付く頃には、既にXMLの開発が終わっていたのです。今では、XMLに関する新しい取り組みがあると、即座に75社のベンダーがワーキンググループへの参加を求めますがね。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]