Abstract
コンピュータが普及し,様々な入力デバイスが登場した現代においても,手書きを行う機会は多くある.また,手書きを従来のものよりも良いものにするために,手書きを元々書いたものよりも綺麗に見せるための研究や,高速な入力を可能にする研究,ひとの手書きの能力を向上させる研究といったような様々な研究が取り組まれている.また,そもそもひとの手書きとはどういったものなのかという手書きの特性を明らかにすることで,先述した手書きを支援する研究などに橋渡しをする研究も多くある.
これまで我々も手書き文字,または手書き図形を数式として表現することで,複数の文字,図形の平均をとった平均文字,平均図形と呼ぶものをつくり,それらについての特性の調査を行ってきた.具体的には,手書きを平均化したものは実際に書いたものよりも綺麗になるということを明らかにした研究や,利き手と非利き手の平均文字,平均図形は類似するといったことを明らかにした研究などがその例として挙げられる.また手書きの特性の調査のみならず,実際にこの手書きの平均化の特性を活かし,実際にひとの手書きを支援する研究も行ってきた.たとえば,文字や図形を描く上での試行錯誤を平均化することによって,ひとの手書きを綺麗にするドローイングツールや,文字や図形を練習する上でのひとの手書きをお手本と融合することで,練習に対するモチベーションを維持しながらひとの手書き能力を向上させるアプリケーションの提案を行った研究が挙げられる.しかし,ここで挙げた一部の研究における特性や有用性を検証するための評価実験では,手書きという抽象的なものを扱っている以上,主観的な評価をせざるを得ない部分があり,客観性や再現性に欠けるものになっていた.また,そういった問題を解決するために,手書き文字や図形の類似という観点で定量的に評価することも行っており,利き手と非利き手の平均文字,平均図形の類似度を調べることや,練習前に書いた文字と練習後に書いた文字の,お手本との類似度を求めることによって,練習による上達度合いを評価することなどを行ってきた.しかしこれらの研究では,手書きの1画1画を構成する点列同士のユークリッド距離が手書き文字の類似度と一致するという前提で,ユークリッド距離のみによる類似度評価を行っており,実際にひとの主観と一致するかどうかは明らかではなかった.我々の仮説として,ひとが感じる手書き文字の類似には,点列同士の距離だけでなく,手書きの1画1画の曲がり度合いや,文字のバランスといった他の要素も大きく関わっていると考えた.
そこで本研究では,点列のユークリッド距離の指標の他に,文字の1画1画の曲率やバランスなどの他の類似度に関する指標を用いることで,多面的に手書き文字の類似度を評価する方法を提案する.また,ひとの手書き文字の捉え方を考慮するために,アンケートによって似ている文字と似ていない文字のデータセットを収集し,ひとの評価と一致するようなそれぞれの類似指標の重みを明らかにする.実際には,1画の文字におけるひとの文字の捉え方を考慮した類似度(Similarity Score)は,
Similarity Score=-0.047×S_point 〖-2.879×S〗_curve-1.105×S_length
-1.536×S_area-1.930×S_aspect-0.029×C_gravity + 8.480
(ただし,S_point: ユークリッド距離,S_curve: 曲率の差,
S_length: ストロークの長さ比,S_area: ストロークを外接する矩形の面積比,
S_aspect: アスペクト比の類似度,C_gravity: 重心の距離とする)
になり,2画以上の時は,
Similarity Score=〖- 0.015×S〗_point 〖 - 41.315×S〗_curve-0.284×S_length
-0.192×S_area-0.155×S_aspect-0.036×C_point-0.025×C_gravity
-1.751×C_aspect-0.284×C_balance + 8.506
(ただし, C_point: 文字全体のユークリッド距離,C_aspect: 文字全体の縦横比,
C_balance: 文字全体のバランスの類似度とする)
という計算式から導くことが可能になった.
また,この手書き文字類似度評価手法を用い,改めて利き手と非利き手の平均文字,平均図形の類似性の特性についての調査をすることで本提案手法の有用性を示す.さらに,別の応用可能性についても述べることで汎用性を示す.
本研究の貢献をまとめると,
ひとの手書き文字の捉え方を考慮した類似度の評価式を導出した
本提案手法によって利き手・非利き手の平均文字・平均図形の類似性を明らかにした
本提案手法の応用可能性を示した
の3つである.