Abstract
漫画の発話者推定などの研究を発展させるには,そのセリフを誰が発話したのかというデータセットが必要となる.本研究では,これまでに構築してきた Mangal09における漫画のセリフと発話者を対応付けるデータセットをアノテーション付与者数が平均2人から5人へとなるように拡張を行った.また,これらのデータセットにおける各セリフの評価人数や分散度合いなどを指標とした分析を行った.分析の結果,アノテーション付与者が2人と5人の時とでは 10%近く完全一致率が下がることを明らかにした.また,評価一致度指標を算出することで,SF やバトルなどのシーンでは,アノテーション付与者にとって発話者の対応付けが困難であることなどを明らかにした.