凸版印刷 くずし字翻刻を手軽に公開
凸版印刷は、江戸期以前のくずし字(※1)で記されている古典籍(※2)の文字を判別し、テキストデータに変換する光学文字認識(OCR)技術を2015年に確立。大学や研究機関と共同で実証実験を行っている。このほど、くずし字で書かれた歴史的資料の利活用を促進するビューア「ふみのは」を開発。5月から、同ビューアを用いた公開用データ制作サービスの提供を開始する。
同ビューアは、一般的なWebブラウザで、歴史的資料の原本画像の上に翻刻(※3)や多言語翻訳文を重ねて表示することが可能です。従来の原本画像と翻刻文の画像を重ねて表示する方法とは異なり、翻刻文をテキストとして扱えるため、全文検索やインターネット上の横断検索などにも対応している。同ビューアの開発によって、くずし字で書かれた歴史的資料がテキストデータとして容易に扱えるようになり、全国各地に眠る貴重な歴史的資料の利活用推進が可能になった。
また、観光立国の実現に向け凸版印刷が従来提供する、訪日外国人の旅の質と利便性向上を目指す「旅道」(たびどう)プロジェクトの活動とも連携し、地方創生に向けた観光地域づくりやインバウンドビジネスなどへの活用にも取り組んでいく。
※1 くずし字
ひらがな、カタカナ、漢字を崩して書いた手書き文字。
※2 古典籍
江戸時代以前に作られた、内容・形態の優れた書籍。
※3 翻刻
古典籍などの古い文献を現代の活字等を使って一般に読める形式にすること。