Googleが人工知能研究グループによる高度な文字認識技術の開発に資金を提供する。
オープンソースプロジェクトOCRopusは、手書き文字をテキストデータに変換する高品質で使いやすい手書き文字認識システムの開発、電子図書館構築の支援、歴史的文書の分析、視覚障害者による情報アクセスの支援などを目標としている。OCRopusの「OCR」は光学文字認識(Optimal Character Recognition)を示している。
このプロジェクトの中心は、ドイツのカイザースラウテルンにあるドイツ人工知能研究センター(DFKI)のImage Understanding and Pattern Recognition(IUPR)研究グループである。DFKIのThomas Breuel教授がプロジェクトの指揮をとっている。
Breuel教授は米国時間4月11日、Google Code Blogへの投稿を通して発表を行った。Googleによるスポンサーシップに加えてOCRopusは、複数のドイツ政府機関の他、公共団体や民間団体からも資金を得ている。
OCRopusチームでは3年間の活動を予定しており、博士課程もしくは博士課程修了の学生3人を支援する予定だという。IUPRソフトウェアは、基本的に2つの研究プロジェクトを元にしている。1つは、米国勢調査局で利用するため1990年代中ごろに開発された手書き文字認識システム、もう1つは、比較的新しい文字認識用の配置分析法である。
上記以外の研究資源には、Hewlett-Packard Labsが当初の開発元でGoogleが2006年オープンソースシステムとして再リリースした、歴史ある光学文字認識エンジンTesseractなどがある。
OCRopusシステムのプレビュー版が、OCRopusプロジェクトのウェブサイトにApacheライセンスで公開されており、IUPRは目標達成に向けてオープンソースプロジェクトへの貢献を求めている。IUPRがかかげている目標は、OCRopusシステム用デスクトップアプリケーションの開発、サードパーティ製ツールの追加、多言語対応などである。現在OCRopusは英語のみに対応している。
この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。 海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス