企画特集
-
クラウド意識調査結果を公開
率直な読者のご意見を全て公開
クラウドに対する疑問や実際の効果に迫る -
サーバ向けなのに、こんなに簡単!
ぜい弱性対策+ウィルス対策ソリューション
「あんしんパック」をインストールしてみた -
クラウド神話をリアルで読み解く
最新テクノロジ満載、「百度」の講演も!
TECHNOLOGY @WORK 東京 2012レポート -
簡単に扱えないと意味がない!
【対談】安心・簡単なセキュリティが必要
--SMBの現場ニーズ vs トレンドマイクロ -
百聞は一見で!日立のビッグデータ
JP1、Hadoop、QlickView "集計・分析"
データをクラウドに集約 ”蓄積・検索"
注目コンテンツ
本日の主要記事

ライブドア、ブログ検索をN-gram方式へ--対象は2000万ブログ超
ライブドアは2月2日、「livedoor 検索」のブログ検索において新たにN-gram方式による検索エンジンへ移行し、検索ワードの一部しか知らなくても目的のサイトを見つけられる「部分一致検索」が可能になったと発表した。N-gram方式の検索対象ブログは2000万件を突破したという。
また、これと同時にワンクリックで文字サイズを「大」「中」「小」に変更できる機能も付けた。
検索エンジンは、検索ワード(文章)を単語単位に分割して認識しており、その単語に関連性が高いと判断したサイトを順番に検索結果として表示する。ここで、文章を単語に分割する方法は大きく2つに分かれる。1つは、あらかじめ検索エンジンに用意した単語の辞書ファイルに沿って分割する「形態素解析」だ。もう1つは、文章をN文字単位で分割して単語として扱う「N-gram」だ。
たとえば、「ライブドアの検索」という文章ならば、形態素解析では「ライブドア」「の」「検索」と分割する。英語では、単語と単語の間にスペースが入るので認識しやすいが、日本語の場合は、単語の辞書ファイルを用意しなくてはならない。これがN-gramの場合、Nを2文字単位と指定すれば、「ライ」「イブ」「ブド」「ドア」「アの」「の検」「検索」と分割し、それぞれを単語として扱う。強制的に分割するので、別途辞書ファイルを用意する必要がない。
そのため、一般的に認識する単語のデータ量は、形態素解析よりもN-gramのほうが多くなるので、検索を高速に処理するのは不得手(Nを何文字にするかによっても大きく変わる)とされている。しかし、別途辞書ファイルが必要ないため多言語でも通用するほか、網羅性が高く検索の漏れがなくなりやすいとされている。
関連ホワイトペーパー (ZDNet Japan)
-
アンケートで見る運用管理の課題 -- 業務ポータルで見える化する
資料提供:日立製作所(ITプラットフォーム事業本部) 2012年03月06日
-
海外進出におけるコミュニケーションコスト削減事例
資料提供:NTTコミュニケーションズ株式会社(ボイス&ビデオコミュニケーションサービス部) 2012年03月12日
-
従来の手法では防げない「標的型攻撃」に備える最終手段
資料提供:株式会社ソリトンシステムズ 2012年02月29日
-
まさか自分が加害者になるなんて… 隔絶された生産ラインで起こり得る悲劇
資料提供:トレンドマイクロ株式会社 2012年03月14日
-
インシデント観測の仕組みで収集した各種攻撃の傾向と対策
資料提供:株式会社インターネットイニシアティブ 2012年03月30日
デジタル製品主要記事
プリンストン、Donna Karanらのアートワークを使用したiPhone用アルミバンパー
プリンストン、LEDバックライト採用の23型ワイド液晶モニタ
パナソニック、明瞭ボイスコントローラを搭載したスピーカシステム
KDDI、画面の振動で声を伝えるスマホ「URBANO PROGRESSO」
パナソニック、手元でテレビの音を確認できるワイヤレススピーカ
ひかりTV、200万円分の夢を叶えるキャンペーンを実施--Twitter、Facebookと連動
特集 by 楽天市場
CNET あとで読む




