logo

自動認識ロボットクローラによる企業情報サービスを開始  7/26デモサイト公開

リンク

株式会社キーウォーカー(東京都港区 代表取締役真瀬正義)は、予てより開発を続けてきた、ページ自動認識技術を応用した、企業情報サービスの提供を開始した。



株式会社キーウォーカー(東京都港区、代表取締役 真瀬正義)は、予てより開発を続けてきた、ページ自動認識技術を応用した、企業情報サービスの提供を開始した。

キーウォーカーは、Webクローリングサービスのトップ企業で、様々なニーズに応えるクローリングサービスを提供してきた。
同社は、さらに高度なWebブラウズコントロール技術の開発に取り組んでおり、全自動でWeb調査やビッグデータの収集をはじめとする、様々なニーズに素早く対応できるロボット型のWebクローラである、「BizWalker」を開発した。
[画像1: リンク ]

Webクローリングとは、インターネット上のWebページの情報を巡回収集し、必要なフォーマットに整理して提供する技術で、Web検索サービス / Webマーケティング / 各種情報調査 / システム間のデータ結合 / SEOなど広範囲に利用されている。

人間には簡単に解釈できるWebページに掲載される情報でも、システムが必要な項目に分類して収集するには、パーシングと呼ばれる情報分類技術が必要となる。
従来は、調査対象のWebページ毎に合わせたプログラムを開発し、e-コマースページ内に掲載される、品番・商品名・説明文・価格・在庫・写真などを分類取得していた。
100カ所のe-コマースサイトを対象としたマーケティング調査などを行う場合は、100種類のプログラムを作成する必要があり、時間とコストが掛かるサービスであった。

今回キーウォーカーが開発した「BizWalker」の持つ自動認識技術では、システムがページの特徴を認識するので、必要なページをクローラが自ら発見した後、そのWebページに掲載された情報を自動的に分類収集する事が出来る。
[画像2: リンク ]

キーウォーカーは、先ずこの認識技術を企業が提供する「会社案内ページの情報収集」に応用した。

現在は、殆どの企業が自社の会社案内や製品/サービスの案内をWebページで発信しているため、これらの情報を巡回収集することで、常に最新の企業情報を整理して活用することが可能である。

時系列にこれらの情報を蓄積することで、企業ごとの資本金や従業員数の変化・所在地移転の経歴・取扱商品や新規事業の変遷などを、時系列に調査することも可能となる。

「BizWalker」に、シードとなる企業のトップページなどのURLリストをセットすると、ページから派生するリンクを巡回し、企業案内ページの特徴を自動認識して、データを下記の様に自動分類しデータベース化する。
会社名・郵便番号・所在地・電話番号・FAX番号・設立年月日・資本金・代表者名・主要株主・主要取引先・主要取引銀行・業務内容…

従来のWebクローラは、これらの項目を相手毎に合わせてプログラミングする必要があり、大量の企業情報の収集には不向きであったが、Keywalker「BizWalker」は、自動認識技術によりこれらの項目を詳細に分類し整理格納することが可能となった。

キーウォーカーでは、「BizWalker」の応用分野を、e-コマースの商品情報・中古車・不動産・プレスリリース・ニュース・グルメ情報・旅行や観光情報・各種口コミ・動画・写真など幅広い分野に広げるべく、開発を進めている。

■「企業情報の検索サイト」

[画像3: リンク ]

企業情報検索デモサイト: リンク

キーウォーカーでは、収集した企業情報を閲覧できるデモサービスを無料提供する。
このサービスでは、日々収集している情報を随時追加している。2016年7月26日時点では、10万件以上の企業情報を提供しており、最終的には、100万件以上の企業情報収集を目指している。

■「BPAへの発展」
さらに、キーウォーカーでは、「BizWalker」を応用した、オフィス業務の自動化システムを開発している。これにより、オフィスワーカーの負担軽減やリソースの省力化を目指す、Business Process Automation(BPA)分野でのサービス提供を計画している。

BPA分野では、業務の効率化にとどまらず、統計処理やディープラーニングなどによるテキストマイニングに加え、同社が得意とする日本語解析技術などを組み合わせ応用することで、取り扱うビッグデータの解析、コンテンツマッチ、みえる化、自動分類などの意思決定支援サービスにも対応する。


株式会社 キーウォーカー について
設立:2000年11月22日
代表取締役:真瀬正義
資本金:5,000万円
事業内容:人工知能の研究開発、WEBコンテンツの企画・製作、インターネットを利用した各種情報サービス、ネットワークコンテンツの企画・開発・運営・及びその配信、広告業、テレビ・ラジオなど放送番組の企画制作
所在地:東京都港区麻布台2丁目4番2号 保科ビル4F
URL:リンク

プレスリリース提供:PR TIMES リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。