2008年度卒業論文
「画像処理を用いた点字認識システムの試作」

情報バリアフリー研究室 小島 和倫

.目次


.研究の概要


 私たち人間は五感(視覚,聴覚,触覚,味覚,嗅覚)によって様々な情報を周囲から取り入れている.このうち,視覚によって取り入れる情報は全体の80%以上にもなると言われている.もしもこの視覚の働きが不十分なものになってしまった場合,得られる情報量は激減し,日常生活等において相当な不便を強いられることになる.このように視覚機能の低下によって視覚によって得られる情報が減っている,もしくはなくなっていることは視覚障害であると言える.
 視覚障害者が持つハンディキャップの1つに,紙などに書かれている文字が読めないというものがある.このハンディキャップを軽減するために,文字の代わりとして点字が開発された.現在では点字によって書かれた本や雑誌が発行されていたり,駅などの公共施設には点字による案内がなされていたりと,視覚障害者のための文字が様々な所で使用されている.しかし,点字を読むことのできる視覚障害者は全体の2割程度しかおらず,点字表示による案内があまり活用されていないという現状がある.
 そこで本研究ではその解決法として,カメラ等で撮影された点字を画像処理によって認識し音声で読み上げるシステムを挙げ,その試作を行った

.システムの概要


システムの大まかな流れは以下のようになっている.



【画像読み込み】
 点字の写っているカラー画像を読み込み,濃淡化する.(画像読み込みにはライブラリ関数 "ESPLIB"を使用)


【点字部分の抽出】
 画像中の点字部分とそれ以外の部分を分離する.このとき,点字における打点の凸部分とその周りの平面との明るさに差があることを利用し,2範囲の輝度値差の比較を用いた打点存在判定を行う.



 先ほど示した濃淡画像に対してこの処理を行うと下の図のようになる.




【打点・文字間距離決定】
 画像中の点字の大きさがどのくらいかを求める.この際,点字における3つの距離を打点間距離・文字間距離・マス間距離とし,これらの距離を特定する.


 これにはフーリエ変換・ケプストラムを用いて横方向の周期情報を抽出し,その中で多く存在する周期が高確率で該当距離であると考える(フーリエ変換にはライブラリ関数"FFTW"を使用).また,点字における3距離が2:3:5の関係にあることを利用する.
 抽出したケプストラムのデータから5:2,あるいは5:3の関係にある要素の組み合わせを探し,その中で最も合計値の高いものを選択する.


【点字格子の配置】
 打点・文字間距離を用いて点字格子を作成し,点字抽出後画像中の適切な位置に配置する.

【点字判定・文字変換】
 点字1文字分の格子データを別に作成し,すでに配置されている格子と照らし合わせることで,その場所に点字1文字が存在しているかどうかの判定を行う.点字1文字があると判定されたら,その部分の打点配置場所を調べ,それぞれの配置パターンに応じたカナ文字へと変換する.
 この点字判定と文字変換を交互に行い,画像中の全ての点字を翻訳する.



.認識率


 作成したシステムを用いて実験を行い,点字表示板の材質別に5種類に分けて点字認識率を算出した.ここでの点字認識率とは,各材質における全ての画像中の点字の文字総数からどれだけの数の文字が正しく翻訳されたかを文字数・パーセントで示したものである.



 それぞれの材質における認識率は以下の表に示す.紙に打たれた点字に関しては高い認識率となったが,他の材質に関しては50%程度の認識率となった.



.まとめ


 本研究では,点字を読むことのできない視覚障害者が点字を理解することができるようになるものとして,点字を画像から認識するシステムを挙げ,その試作を行った.このシステムを用いて5種類の表示板においてそれぞれ数枚の画像で実験を行った結果,紙の表示板については約90%,プラスチック,アルミの表示板については約50%の確率で点字から文字への変換を行うことができた.
 今回試作したシステムは,現段階ではとても視覚障害者が使えるようなものではなく,健常者であっても使いづらいものである.これをさらに使いやすいものにするために挙げられる課題としては,点字表示板以外のものが写っている画像の場合の点字部分抽出方法,斜めに写された点字の認識,音声出力,点字認識率,文字変換率の向上が挙げられる.これらの課題を解決できれば,このシステムは有用なものになり得ると考えられる.


.リンク


立命館大学
情報バリアフリー研究室
ESPLIB
FFTW