Tesseract.jsを使ってOCR

Legacy_Account1740 · 2018 年 10 月 29 日午前 10:22

OCR(光学的文字認識)は、画像などに含まれた文字をテキストデータとして読み取る技術です。 Tesseract.jsを使うとブラウザ上で簡単にOCRを実装できます。

サンプル

添付ファイル内の文字を文字列フィールドに保存します。

フォーム設定

コード

tesseract.jsを読み込み後、下記sample.jsを読み込みます。

・sample.js

(function() {"use strict";kintone.events.on(['app.record.create.show','app.record.edit.show'],function(event){document.addEventListener('change',function(e){if(e.target.type!=='file')return;if(!e.target.files[0].type.match('image.\*'))return;varreader=newFileReader();reader.addEventListener('load',function(){Tesseract.recognize(reader.result, {lang:"jpn"}).progress(function(p){event.record.文字列.value=p.status+' : '+Math.round(p.progress\*100)+'%';kintone.app.record.set(event);
        }).then(function(result){event.record.文字列.value=result.text;kintone.app.record.set(event);
        });
      });reader.readAsDataURL(e.target.files[0]);
    },true);
  });
})();

※文字認識の精度は、文字サイズや画質に依存します。

Legacy_Account2502 · 2021 年 5 月 17 日午前 8:30

初歩的な質問で大変申し訳ないのですが、

tesseract.jsはどのように読み込みすればよいのでしょうか。

ご教示頂ければ幸いです。

Legacy_Account1740 · 2021 年 5 月 17 日午前 8:49

mionixさん

お世話になっております。
コメントありがとうございます。

記事サンプルでは下記を読み込んでおりました。
https://cdn.rawgit.com/naptha/tesseract.js/1.0.7/dist/tesseract.js

下記リンクに公式CDNが示されていたので、そちらでも良いかもしれません。
https://github.com/naptha/tesseract.js#cdn

Legacy_Account2502 · 2021 年 5 月 17 日午後 11:32

江田様

ご教示頂きありがとうございます。

無事正常に動作致しました。

Legacy_Account1923 · 2023 年 2 月 23 日午後 1:15

江田様

お世話になっております。

このコード参考にさせて頂いております。

一つご教授頂きたいことがあり、指定した添付ファイルフィールドのファイルを読み取るにはどのようにすれば

いいでしょうか？

system · 2023 年 11 月 9 日午前 7:38

このトピックはベストアンサーに選ばれた返信から 3 日が経過したので自動的にクローズされました。新たに返信することはできません。

トピック		返信	表示
カレンダービューの背景に画像を入れたい kintone カスタマイズ	2	63	2024 年 12 月 25 日
一覧表示で文字色の変更ができません kintone カスタマイズ	3	269	2021 年 6 月 11 日
レコード詳細画面でのviewer.jsについて kintone カスタマイズ	0	303	2021 年 9 月 17 日
テーブル内の値による条件分岐の操作についてご教授ください。 kintone カスタマイズ	1	88	2018 年 6 月 28 日
JSで条件を指定し入力したい kintone カスタマイズ	4	208	2022 年 4 月 15 日

Tesseract.jsを使ってOCR

サンプル

フォーム設定

コード

関連トピック