2010年07月13日

城山だよりをOCRしてみた。

14e7cade.jpg坂田さんから「城山だより」が届いた。

私の朝のお勤めのひとつは、必要な書類をスキャニングして保存することである。
ふと「城山だより」スキャニングしたくなった。
普通スキャニングして書類は捨てるが、さすがに「城山だより」捨てにくい。

OCRしてみようと思ったのだ。
坂田さんのアノフォントのような手書き(ガリ版)文字を、どれだけ認識するか興味が沸いたのだ。

結果は、ひらがな・カタカナはなんと8割以上正しく認識したのだ。
これはすごい。
私の文字なんて1割もいかないだろう。
漢字は2割くらいだけど、これはしかたない。

ちなみに、活字になっているものは、OCRフリーソフトで95%くらいは認識する。

音声認識というものもある。
近頃かなり精度が上がって、私もiPhone+Googleでよく音声認識を使う。

これいいね、タイプしなくていいから。
そう言う人もいる。
だけど、考えてみて。
書類作成の多い職場は一日中うるさくてしょうがないから。
それに、人はそんなにしゃべり続けられないって。

この記事へのトラックバックURL