漫画のセリフと発話者対応付けデータセットの構築とその分析

櫻井 翼; 伊藤 理紗; 阿部 和樹; 中村 聡史

Abstract

漫画の発話者推定などの研究を発展させるには，そのセリフを誰が発話したのかというデータセットが必要となる．本研究では，これまでに構築してきた Mangal09における漫画のセリフと発話者を対応付けるデータセットをアノテーション付与者数が平均2人から5人へとなるように拡張を行った．また，これらのデータセットにおける各セリフの評価人数や分散度合いなどを指標とした分析を行った．分析の結果，アノテーション付与者が2人と5人の時とでは 10%近く完全一致率が下がることを明らかにした．また，評価一致度指標を算出することで，SF やバトルなどのシーンでは，アノテーション付与者にとって発話者の対応付けが困難であることなどを明らかにした．

Artifacts

Information

Book title

第6回コミック工学研究会

Pages

11-17

Date of issue

2021/11/21

Date of presentation

2021/11/21

Location

オンライン

Keywords

セリフ / コミック / 話者 / データセット構築 / 発話者 /

Citation

櫻井翼, 伊藤理紗, 阿部和樹, 中村聡史. 漫画のセリフと発話者対応付けデータセットの構築とその分析, 第6回コミック工学研究会, pp.11-17, 2021.

Links

https://nkmr-lab.org/news/cc6_comic_speaker_sakurai.html