三菱電機は、概念抽出型文書知識サーバを開発したと発表した。あらかじめ加工されていない雑多な文書から自動的に概念を抽出することで、潜在する新知識を発掘するという。「今までオフィス内に埋もれていた潜在知識を誰もがあらゆる業務に有効活用できる」(同社)
同サーバは3つの技術で実現する。すなわち、(1)文書の中から言葉の間の関連性(概念)を自動抽出し、数量化する「念抽出型テキストマイニング」、(2)手書き文書.図面.電子文書などの各種文書から文字列をもれなく抽出してキーワード検索する「レンディションフリー文書解析技術」、(3)全文検索に加えて概念検索、KnowWho(人物.組織の照会)を高速に実行する「並列ナレッジ検索プラットフォーム」である。
(1)では、同一表記の言葉であっても、その文章の全体のテーマを考慮して、適切な単語・複合語を抽出する。(2)ではワープロファイルの中に画像で表現された文字列、アウトラインフォントなどのベクトルで表現された文字列を対象とした検索が可能。(3)では、同プラットフォームを適用したPCサーバ16台の並列検索処理により1000万件の文書に対する概念検索を1秒で実現できるという。
同サーバは、一般企業、官公自治体などにおける、研究、企画、製造、営業、保守、資材、経理、事務といった業務で大きな効果を発揮すると三菱電機では説明する。また、EIP(Enterprise Information Portal)への適用、文書知識提供サービスや保守サービスなどへの展開も可能という。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス