凸版印刷、今度は明治から昭和のくずし字文書が「読める、読めるぞ!」--2023年4月リリース

 凸版印刷は、明治期から昭和初期(近代)に書かれた手書き文字の解読が可能なOCRを開発した。

近代の手書き文字を解読(出典:凸版印刷)
近代の手書き文字を解読(出典:凸版印刷)

 近代に作られた手書きの資料は大量に残っており、公文書や企業経営にかかわる文書、業務日誌、書簡など、貴重な資料が多いそうだ。ただし、くずし字で書かれたものが多く、書き手によるくずし方の差が大きいうえ、筆記用具の多様化、カタカナ語の混在、旧字や旧仮名遣い表記などの特性があり、江戸時代の資料より解読が困難な場合もあるという。

江戸時代の資料より解読が困難な場合もある(出典:凸版印刷)
江戸時代の資料より解読が困難な場合もある(出典:凸版印刷)

 そこで、凸版印刷は古文書解読サービス「ふみのは」で提供中の江戸時代のくずし字に対応したOCRをベースとして、近代の多様な筆跡の手書き文字に対応するOCRを開発した。今後、実証実験を進め、2023年4月より正式サービスとして提供する予定。

 提供形態は、くずし字解読システム「ふみのはゼミ」の追加サービスとするほか、古文書解読アプリ向けの追加サービスや、APIサービスを検討している。

解読システムの構成と提供形態(出典:凸版印刷)
解読システムの構成と提供形態(出典:凸版印刷)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]