お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

"APIマッチ"のセマンティック技術

2009/10/05 21:00
  • このエントリーをはてなブックマークに追加

プロフィール

野村 直之

『人工知能が変える仕事の未来』https://goo.gl/9N7cJE ・書籍帯の紹介文より: 「…ここ数年、毎日のように、人工知能についてのインパクトのあるニュースがいくつも流れる中、人工知能の産業応用について一貫して考えつづけた結論をまとめたものです。その背景には、筆者が1985年以来、職業的にAI、自然言語処理の研究開発に従事し、1993年から1994年にマサチューセッツ工科大学人工知能研究所の客員研究員(Visiting Scientist)として、ノーム・チョムスキー(自然科学としての言語学を創始)、マービン・ミンスキー(人工知能の父)、ジョージ・A・ミラー(認知心理学の開祖、ワードネット[WordNet]プロジェクトを創始)他の薫陶を受けながら脳内の言語知識のモデルを研究した経験、その成果を踏まえて、類似検索の体感精度を改善したり、高精度な文章要約システムを開発したりした経験があります。  …AIの産業応用や、AIが浸透した社会における人間の役割、教育のあり方などに興味、関心をもっておられる方に、必ずや、お役立ていただくことができると思います。  (「はじめに」より)」
ブログ管理

最近のエントリー

 標記の"APIマッチ"とは、"WebAPI比較・マッチングサービス" のことです。

”本WebAPI検索サービスをWebAPI経由でマッシュアップアプリに組込みたい方はこちら→ ... 検索結果一覧で、 のついているAPIはMA5協賛企業の提供するAPIです。 Summary文のDrag&Dropに加えWebAPI詳細を参照する矢印ボタン を付けました。”

 前回の日記「セマンティックAPI 4種、MA5に提供」でご紹介させていただいたせいか、実際にMashup Award応募予定者さんのニーズが高まっているせいか、 最近、"WebAPI"で検索してベスト10に返り咲きました。

 この他の辿り着き方ですが、検索エンジンに "dnavi" と入れてみて下さい。国会図書館オンラインの「データベースのデータベース」Dnaviをクリックし、フォームに、WebAPI (or Web API) と入れると唯一ヒットするのが、"WebAPI比較・マッチングサービス" です。

※Dnavに"Web"と入れても上位3つくらいにヒットすると思います。

 

"APIマッチ"のドメイン名の変遷

  "APIマッチ"のために最初に取得したドメイン名は、gimu-kenri.netでした。2007年8月のことです。MA3にチャレンジャーとして、マッシュアップ作品を作ってdeployし応募するために取得しました。

 「義務と演技」、、もとい、「義務と権利」。別にCGMサイトじゃありません。WebAPIのライセンス文章を自動解析し、ある文が、誰かの義務について記述していれば「」、権利なら「緑」、禁止なら「」で表示するようにしました。通常「誰か」とは、甲か乙、ここでは、WebAPIの提供者vs利用者となります。そこで、利用者視点を優先し、利用者の関する、義務、権利、禁止ならば、上記の色分けに加えて、太字で表示するようにしました。最初から、英語と日本語の両ライセンス文に対応しました。

 

  応募の直前になって、「いずれ海外の利用者にも、日本発の優れたAPIをどんどんスピーディに検索して、出自を問わずに使ってもらいたいし、、」と考え、ドメイン名を変更。2つの主なユース・ケースとして、【比較】と、【マッチング】を想定しました:

【比較】2つの似たAPIの基本プロフィールを見比べて片方ずつ落としていき、残ったものを採用。

【マッチング】マッシュアップに両方とも使いたいAPIを見比べて繋がるかどうか、内容の整合性がとれるかをチェック。

  両者の英単語をとって、compare & matching。さらに、できるだけ短く、安い(.com/.netなら安い)ものにしよう、と考えて順序を入れ替え、api-match.comを最有力候補としました。実際にこのドメイン名が空いていることを確認し、応募の直前に入れ替えた次第です。

  実はその後も半年以上は、gimu-kenri.netでもアクセスできる状態でした。でも、その後、バイリンガル化を推し進め、何回か検索して検索履歴がたまった状態でもその状態のまま 日→英、英→日、と移行できる国旗ボタンを付けたあたりで、もはやgimu-kenri.netは不要、と判断。リクルートの事務局さんも、"APIマッチ"と呼んで覚えてくださるようになっていたので、「ドメイン名さん、ご苦労様でした」とばかり、更新せずに終了させました。

 

"APIマッチ"のセマンティック技術

 でも、 gimu-kenri.netという名は無くなっても、義務なら「」、権利なら「緑」、禁止なら「」という色分け機能は残っています。これが、メタデータ株式会社が初めて世間に公開したセマンティック技術です。形式言語のセマンティクスや論理学のModal Logic (様相論理→命題をくるみその外側に確からしさや信念・価値判断に関する述語を規定したもの) に相当する自然言語表現を自動抽出し、文の役割(筆者による位置づけ) を判定して色分けするものです。

 1980年代の人工知能ブームで一時流行りましたが、機械翻訳の高精度化以外に、シンプルな応用用途を見つけられていなかったような微かな記憶があります。 今回の解析対象は、WebAPIのライセンス文(Terms of Service)です。

 日本では法律関係の人材があまりに稀少で、かつ多くの場合、「ご説明はよくわかりました。で、ソースコードって何ですか?」という質問を、背景説明を2時間した後に訊いてこられるようなことになります。その上にXMLや、APIの概念、そのWeb版に必要な免責規定や利用者の権利と義務を正当に理解していただくのは相当な難事業になります。

 結論としては、「WebAPIを使うエンジニア(か企画担当でよ〜く出来た人)」がライセンス文を読みこなすしかありません。これは辛い作業です。本物の法律文に近ければ近いほど、ちんぷんかんぷんで眠くなるか頭が痛くなることでしょう。これは、英語ネイティブが英語のライセンス文を読む場合も同じです。

 一方、 "APIマッチ"君は、ライセンス文が本物の法律文に近ければ近いほど、高い精度で、義務「」、権利「緑」、禁止「」の色分けができます。要点をながし読みしたいとき、重要な禁止事情だけ急いで再チェックしたいときなど、とても助かります。(私自身助かっています)

  こんなささやかな、ナイーブな用途にも、セマンティック技術をどんどん応用していくことで、少しでもWebが介在する世の中が便利で、ユーザも提供者も幸福になれると良い。誰にも作業を押しつけないでやろうとするならば、やはり大部分、機械が自動で作業するのが良いのではないか。

 マルクス経済学で提唱された「労働の疎外」 をテクノロジーの力で追放したい!と、経済学を専攻していた父の書斎で35年前に痛切に願った思いが心中でまだ生きているようです。そのせいで、どちらかといえば、、自分でやるなら、ソーシャルよりセマンティック、と考えるのだな、と改めて自省しました。

 

 

 ↑これがユニークな、デュアル詳細画面の表示です。

 恣意的に、ばらばらに書かれたAPIドキュメントのサイトを読み込む苦痛から、マッシュアップエンジニアを解放するため、基本的なメタデータが一目で表形式でならべて参照できるようにしました。

 ざっと眺めたら、上方のsummary行(APIの名前や見出し)から、次に詳細画面で眺めたいAPIを選び、マウスでつまんで左右どちらかにDrag&Dropしてください。

 あるいは、 のボタンを押してください。

 振り返りたくなったら、「閲覧履歴」のタブで、一度参照したAPIの一覧を見ることができます。つなぎたい順番にクリックすると、マッシュアップ企画書のドラフトができます。電車の中で、アイディアの続きを練ってください。

 MA5の〆切は、30日後の11月4日です。

 

ps 他のAPI のうち、特に、5W1H Mextractrについて hatena日記に書きました。

   APIというより、アプリ、IE8アクセラレータ版についての最近のマイコミジャーナルの紹介記事の補足のようなものです。

 

 

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー