日本古典籍くずし字データセットを用いたAIくずし字OCRサービスとして、「KuroNetくずし字認識サービス」を公開しました。IIIF (International Image Interoperability Framework)に準拠した画像であれば、世界中で公開されるくずし字画像を翻字できます。

KuroNetくずし字認識サービスは、「KuroNetくずし字認識ビューア」と「ダッシュボード」の2つのツールを利用します。「KuroNetくずし字認識ビューア」でくずし字OCRを行う領域を指定し、「ダッシュボード」でくずし字OCRの進行状況を管理します。

ログイン後にダッシュボードへ移動
(クリックしても何も反応しない場合は、ログインして下さい
KuroNetくずし字認識ビューアを起動

ログイン

本サービスは無料ですが、利用状況の把握と過度な利用の防止のために、ログインを必須としています。ログインサービスの実装には、Google社のFirebase認証を活用しており、Google、Facebook、Twitterのアカウントと連携するか、電子メールアドレスを入力することで、ログインが可能となります。

「KuroNetくずし認識ビューア」と「ダッシュボード」は、両方とも同じアカウントでログインする必要がありますのでご注意下さい。ログイン機能は、いずれの場合も画面の右上にあります。なお、アカウント連携はログイン機能の実現のみに利用し、取得した情報はそれ以外の目的には活用いたしません。

一方、ログイン不要なサービスとしては、多文字OCRの「みを(miwo)」スマホアプリや、一文字OCRのKogumaNetくずし字認識サービスもありますので、そちらもご利用下さい。

利用方法

  1. 「KuroNetくずし認識ビューア」に、認識したい本のIIIFマニフェストをドラッグ&ドロップしてください(注意:IIIFの利用)。そして、ページ移動やサムネイル表示などを用いて、認識したい画像を表示してください。これはIIIF Curation Viewerの一般的な操作ですので、IIIF Curation Viewerのマニュアルなどをお読みください。
  2. 右上の「■」ボタンをクリックして、くずし字認識したい領域を指定します。一般的には、見開き画像の半分程度を指定することを想定しています。小さな領域を指定すると、領域が自動的に拡大します。
  3. 領域を指定した後にクリックすると、ポップアップウィンドウが表示されます。その中の「KuroNetくずし字認識サービス」をクリックしてください。なお「KuroNetくずし字認識ビューア」上でログインしていないと、ダッシュボードには進めません。
  4. ダッシュボードを表示すると「領域指定画像」欄にサムネイル画像が表示されます。なおHTTPで公開されるIIIFサイトのサムネイル画像は表示できませんので、ご了承下さい。
  5. ダッシュボードの「くずし字OCR」欄の「予約:実行」リンクをクリックし、OCRの実行を予約します。その後システムは、複数ユーザからのOCRリクエストを先着順で実行します。なおOCR実行に要する時間は入出力処理も含めて約2秒ですので、順番待ち件数×2秒程度の待ち時間を想定してください。
  6. ダッシュボードを再読み込みすると、「くずし字OCR」列に結果が表示されます。「成功:閲覧」リンクが表示されている場合、これをクリックするとIIIF Curation Viewer上にくずし字認識結果が表示されます。一方、「失敗:消去」が表示されている場合、何らかの原因でKuroNetが認識に失敗していることから、リンクをクリックして結果を消去してください。
  7. IIIF Curation Viewerの左下には、文字の表示位置や大きさ、透明度などを調整する設定機能があります。詳しくはIIIF Curation Viewerのドキュメントをご覧下さい。またOCR認識結果は誰でもアクセスできるデータとして公開されますので、URLを共有すれば他者も閲覧可能です。
  8. くずし字認識結果を目で見て確認するだけならこれで十分ですが、コピー&ペーストもできる「テキスト」として取得するにはさらに作業が必要です。実はKuroNetの認識結果は文字の位置情報しか持っておらず、文字を読む順序は持っていないからです。そこで文字の読み順を指定するために、「自動テキスト化」または「手動テキスト化」機能を活用します。
  9. 「自動テキスト化」は、左から右、上から下に文字を読むことを仮定し、自動的に文字の読み順を推定する機能です。「自動テキスト化」列の「処理:実行」をクリックして下さい。単純なレイアウトであれば、この機能でほぼ誤りなく推定することが可能です。ここから「KuroNet Text Editorを起動する」を選ぶと、推定された読み順をKuroNet Text Editor上で確認することができます。また「テキスト化を実行する」を選ぶと、推定した読み順に基づきテキストを生成します。
  10. 複雑なレイアウト等の原因で「自動テキスト化」に失敗した場合は、「手動テキスト化」を選びます。この列の「エディタ:準備」のリンクをクリックすると準備を行いますので、その後「エディタ:起動」のリンクをクリックして下さい。
  11. KuroNet Text Editorを用いて文字の読み順を推定します。なお詳しい使い方については、KuroNet Text Editorのドキュメントをご覧ください。文字の読み順を指定したら、キュレーションリストの「上書き更新」機能で結果を保存します。その後、ダッシュボードに戻って「テキスト化:実行」を行い、テキストを取得します。

その他、以下のページにも説明があります。

  1. 「KuroNetくずし字認識サービス」の使い方(@yhkondo 氏のレクチャー)【IIIF (International Image Interoperability Framework)に準拠した画像であれば、世界中で公開されるくずし字画像を翻字できる!】

お試し利用

日本古典籍データセットの各ページ、および日本古典籍くずし字データセット 書名一覧のページに、サービスをお試しできるリンクを用意しました。

IIIFの利用

このサービスを使う際の大きなハードルは、「IIIFマニフェストをドラッグ&ドロップ」という操作にあります。この操作を簡単にするためのツールとして、Open in IIIF Viewerがあります。ブラウザ拡張機能としてこれをインストールし、オプションの「Open IIIF manifest link in (URL)」に「http://codh.rois.ac.jp/kuronet/iiif-curation-viewer/?manifest=」を設定すると、ボタン一つで開けるようになります。

現在のところ、非IIIF画像の場合はIIIFへの対応が必要となります。第一に、自分が保有する画像やオープンデータであれば、Omekaなどのツールを用いてIIIF形式に対応した画像を作成し、それを使うことができます。第二に、図書館や博物館などの組織であれば、自館のシステムをIIIFに移行することを検討してください。世界の多くの図書館や博物館もIIIF形式による公開に移行しつつあり、長期的なトレンドとしてIIIF対応画像はますます増えていく見込みです。

将来的には、オープンソース版KuroNetも公開する予定です。ディープラーニング実行環境を自力でインストールするスキルがあれば、どんな画像にも利用できるようになる予定です。

制限

  1. 日本古典籍くずし字データセットを学習しているため、このデータセットに存在する文字しか認識できません。旧字と新字の統合などはこのデータセットの作成方針にしたがいます。
  2. データセットで出現頻度が低い文字は、認識が困難となる場合もあります。
  3. 版本に比べて写本、古文書は、書き手ごとの字形の変異が次第に大きくなるため、認識もより難しくなります。
  4. 石碑などの文字は3次元構造を持つため、紙の上の文字とは文字輪郭の特徴が異なり、認識が難しくなります。

こうした問題点を解決するには、より多くの種類の資料から字形を収集してデータセットを構築し学習する必要があります。

本サービスの利用は無料ですが、他の方々の利用をさまたげるような利用状況となった場合、利用制限などを行う可能性もあります。あらかじめご了承下さい。

参考文献

KuroNetの参考文献のページをご覧下さい。

関連ページ

  1. AIによるくずし字認識
  2. 受講者用 KuroNETの使い方

ポリシー

KuroNetくずし字認識サービスのポリシー

ニュース

2022-10-26

AIくずし字認識システムを、KuroNetからRURI(瑠璃)に変更し、くずし字認識精度が向上しました。この変更によりKuroNetというモデル自体は引退となりますが、歴史的な経緯も踏まえて、サービス名称としてはこのままKuroNetの名前を残すこととします。

2020-03-25

KuroNet Text Editorを公開しました。また、これと合わせてKuroNetくずし字認識サービスを改良して、自動テキスト化、手動テキスト化の機能を加えることで、文字単位の認識結果を連結して文字列(テキスト)として出力し、コピーペーストして使えるようになりました。

文字の読み順を指定するツールは2種類あります。第一にKuroNet Text Editorは、複雑なレイアウトでも読み順を正確に手動で指定できます。第二に自動読み順推定アルゴリズムは、割書などを含まない単純な縦書きレイアウトであれば、読み順を瞬時に自動で推定できます。また、最初に自動読み順推定アルゴリズムを利用し、その結果をKuroNet Text Editorで修正する、という2段階の作業も可能です。レイアウトの複雑さに応じて、2つのツールを併用して下さい。

また一部の認識結果において、文字の表示位置が左上方向にずれるバグがありましたが、この問題を修正しました。

さらに、サービスにログインできない場合がある問題についても、一部対応して状況を改善しました。

2019-11-11

AIくずし字OCRサービスの一つとして、KuroNetくずし字認識サービスを公開しました。

支援

KuroNetに関する研究は、科研費などの研究費の支援を受けています。

  1. ディープラーニングによるEnd-to-End日本古典籍くずし字認識の研究
  2. 歴史ビッグデータ研究基盤による過去世界のデータ駆動型復元と統合解析