logo

富士通、少数データで効率よく学習できる深層学習技術--中国古文書文字で成果

  • このエントリーをはてなブックマークに追加

 富士通研究開発中心(FRDC)は2月21日、中国古文書文字の文字認識において、少数の学習データでも高精度な文字認識を実現する深層学習技術を開発したと発表した。


新技術の認識プロセス

 同技術は、古文書の文字画像と文字を紐づけたデータ(教師データ)で学習させる深層学習の認識エンジンと、文字とは紐づけられていない2つの文字画像が、同じ文字かどうか特徴を学習する深層学習エンジンを組み合わせたもの。一文字当たり約70%少ない教師データ数で、従来技術と同じ精度の認識率を達成したという。

 深層学習技術による文字認識では、あらかじめ文字画像と正解の文字を紐づけた教師データを用いて認識エンジンに学習させる。この時、教師データの数が多いほど認識精度が高くなるが、多様な書体があり同じ文字でも異なる字形が多数存在する中国古文書では、十分な数の教師データを用意することに課題があった。

 今回の技術では、学習データを増やすため、正解の文字と対応しておらず教師データとして利用されていなかった大量の文字画像データを学習に活用。また、同じ文字ラベルを持つ文字画像の特徴パターンを、異なる文字ラベルのものと比較し、認識エンジンを学習させた。


新技術適用前との比較

 同社では、日本語や韓国語などでも適用できるとしている。2018年度には、同社のAI技術「Human Centric AI Zinrai」への活用を目指し、限られた教師データで効果的に深層学習エンジンを学習させる仕組みを構築。植物の識別など、多数の画像データを分類する用途に実装していくとしている。

-PR-企画特集