グーグル、文字認識研究OCRopusへ資金提供

文:Caroline McCarthy(CNET News.com) 翻訳校正:編集部 2007年04月12日 11時59分
  • このエントリーをはてなブックマークに追加

 Googleが人工知能研究グループによる高度な文字認識技術の開発に資金を提供する。

 オープンソースプロジェクトOCRopusは、手書き文字をテキストデータに変換する高品質で使いやすい手書き文字認識システムの開発、電子図書館構築の支援、歴史的文書の分析、視覚障害者による情報アクセスの支援などを目標としている。OCRopusの「OCR」は光学文字認識(Optimal Character Recognition)を示している。

 このプロジェクトの中心は、ドイツのカイザースラウテルンにあるドイツ人工知能研究センター(DFKI)のImage Understanding and Pattern Recognition(IUPR)研究グループである。DFKIのThomas Breuel教授がプロジェクトの指揮をとっている。

 Breuel教授は米国時間4月11日、Google Code Blogへの投稿を通して発表を行った。Googleによるスポンサーシップに加えてOCRopusは、複数のドイツ政府機関の他、公共団体や民間団体からも資金を得ている。

 OCRopusチームでは3年間の活動を予定しており、博士課程もしくは博士課程修了の学生3人を支援する予定だという。IUPRソフトウェアは、基本的に2つの研究プロジェクトを元にしている。1つは、米国勢調査局で利用するため1990年代中ごろに開発された手書き文字認識システム、もう1つは、比較的新しい文字認識用の配置分析法である。

 上記以外の研究資源には、Hewlett-Packard Labsが当初の開発元でGoogleが2006年オープンソースシステムとして再リリースした、歴史ある光学文字認識エンジンTesseractなどがある。

 OCRopusシステムのプレビュー版が、OCRopusプロジェクトのウェブサイトにApacheライセンスで公開されており、IUPRは目標達成に向けてオープンソースプロジェクトへの貢献を求めている。IUPRがかかげている目標は、OCRopusシステム用デスクトップアプリケーションの開発、サードパーティ製ツールの追加、多言語対応などである。現在OCRopusは英語のみに対応している。

この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。 海外CNET Networksの記事へ

  • このエントリーをはてなブックマークに追加