2月9日にはEDGE内にライブドアのテクノロジをオープンソースで提供するコーナー「EDGE src」を設けた。ここではレコメンデーションエンジン「Cicindela」や、統合スパムフィルタ「スパムちゃんぷるー」などが公開されている。
Cicindelaは「このページを見た人はこんなページも見ています」といったオススメ機能を既存のサービスに簡単に追加できるもの。こうしたエンジンは通常、有償で提供されるのが一般的であるため、「専門の会社さんからは『何してくれてんだ』という声もある」(櫛井氏)という。
ライブドア内ではニュースやグルメ、クリップなどのサービスで実績のあるエンジンだ。有料で提供する価値もありそうだが、「レコメンデーションが広がるのは、ウェブ業界にとってもいいこと」(櫛井氏)との考えから、あえて無償で提供している。
一方のスパムちゃんぷるーはlivedoorのブログ、ウィキ、などのサービスで蓄積されたブラックリスト情報を、ほかのブログサービスなどでも使えるようにしたものだ。ブログ事業者が集い、共通のブラックリストを構築するのが理想的だが、各社の個人情報の扱いという法務的な壁もあって簡単には実現しないという。
まずはライブドアが率先して情報を公開することで、業界の動きを活性化させるのが狙いだ。「ほかの会社が躊躇しているところを、あえて踏み越えていきたい」と櫛井氏。公開サイトにはスパムちゃんぷるー(料理)のレシピも掲載するなど、遊び心も忘れない。
だが、極めつけは「Datesets」だろう。これはソーシャルブックマークで得た蓄積情報を研究用に提供するものだが、サイトには2人の女の子がいて、「クローリングしている暇があるなら…論文書いたら?」「べ、べつにあんたの論文が心配なんじゃないんだから! さっ、サーバーに負担がかかるでしょ!?」などと言っている。
要は「ライブドアが研究用のデータを用意しますので、サイト内をクロールするのはご遠慮ください。研究者はクロールすることが本分ではないのですから、これを使って論文に集中してください」ということだ。
このデータの中身は、ソーシャルブックマークに登録されたURL、登録したユーザーのID(乱数にしてある)、付けられたタグで構成された157万行にも上るCSVファイルだ。5人以上がブックマークしたURLのみが含まれている。
研究者はこのデータを使って、レコメンデーションエンジンの性能を評価したり、ユーザー同士の関連性を抜き出したりといった研究が可能になる。データは半年間隔で更新していくという。
なぜ、ライブドアはここまでするのだろうか。
「分社化してメディア事業とデータセンター事業に分かれたときに、『オープン&シェア』という言葉を掲げていました。情報をオープンにすることでウェブ業界を活性化して、レベルが底上げされて…。EDGEをやっていくうちに、こういうことなんだなと思いました。だからライブドアの技術力をどんどん出して、多くの人に使ってもらい、日本のインターネットを明るくしていきたいと考えています」(櫛井氏)
“収益は後回し”とはよく聞かれる言葉だが、徹底されている。櫛井氏は「いま収益化しているものも、昔は必ずしも儲かっていませんでした。まずは打席に立たないといけないですから、社内で文句を言われたことは一度もありません」と語る。
ライブドアのエンジニアが好きだという。「技術のライブドアだと思っています。今後もエッジの効いたサービスを出していきますよ」。
CNET Japanの記事を毎朝メールでまとめ読み(無料)