富士通研究開発中心(FRDC)は2月21日、中国古文書文字の文字認識において、少数の学習データでも高精度な文字認識を実現する深層学習技術を開発したと発表した。
同技術は、古文書の文字画像と文字を紐づけたデータ(教師データ)で学習させる深層学習の認識エンジンと、文字とは紐づけられていない2つの文字画像が、同じ文字かどうか特徴を学習する深層学習エンジンを組み合わせたもの。一文字当たり約70%少ない教師データ数で、従来技術と同じ精度の認識率を達成したという。
深層学習技術による文字認識では、あらかじめ文字画像と正解の文字を紐づけた教師データを用いて認識エンジンに学習させる。この時、教師データの数が多いほど認識精度が高くなるが、多様な書体があり同じ文字でも異なる字形が多数存在する中国古文書では、十分な数の教師データを用意することに課題があった。
今回の技術では、学習データを増やすため、正解の文字と対応しておらず教師データとして利用されていなかった大量の文字画像データを学習に活用。また、同じ文字ラベルを持つ文字画像の特徴パターンを、異なる文字ラベルのものと比較し、認識エンジンを学習させた。
同社では、日本語や韓国語などでも適用できるとしている。2018年度には、同社のAI技術「Human Centric AI Zinrai」への活用を目指し、限られた教師データで効果的に深層学習エンジンを学習させる仕組みを構築。植物の識別など、多数の画像データを分類する用途に実装していくとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」