凸版印刷は、明治期から昭和初期(近代)に書かれた手書き文字の解読が可能なOCRを開発した。
近代に作られた手書きの資料は大量に残っており、公文書や企業経営にかかわる文書、業務日誌、書簡など、貴重な資料が多いそうだ。ただし、くずし字で書かれたものが多く、書き手によるくずし方の差が大きいうえ、筆記用具の多様化、カタカナ語の混在、旧字や旧仮名遣い表記などの特性があり、江戸時代の資料より解読が困難な場合もあるという。
そこで、凸版印刷は古文書解読サービス「ふみのは」で提供中の江戸時代のくずし字に対応したOCRをベースとして、近代の多様な筆跡の手書き文字に対応するOCRを開発した。今後、実証実験を進め、2023年4月より正式サービスとして提供する予定。
提供形態は、くずし字解読システム「ふみのはゼミ」の追加サービスとするほか、古文書解読アプリ向けの追加サービスや、APIサービスを検討している。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス