Thesis

漫才動画再検索のためのセリフの重要度を考慮した索引化手法

Abstract

漫才は主に 2 人 1 組で行われる笑いを提供する話芸であり,老若男女問わず娯楽として 広く親しまれている人気のコンテンツである.漫才を行う「漫才師」の数は非常に多く存在 しており,この漫才師それぞれがオリジナルの漫才を複数作り出しているため,コンテンツ として膨大な数が存在している.漫才をユーザが鑑賞する方法としては,舞台やイベントな どに足を運び観覧することや,テレビ番組などのメディアや Web 上の動画サイトなどで動 画として視聴することが挙げられる.ここで,舞台やイベントなどを観覧する場合は,それ を保存して見るということが難しいが,テレビ番組で漫才を視聴する場合,録画してハード ディスクレコーダなどの自身のアーカイブに保存しておくことで,ユーザは好みの漫才を 繰り返し視聴し楽しむことができる.また,Web 上の動画サイトにおいても,自身の好み の漫才を探し出すことで特定の漫才を繰り返し楽しむことができる.このように,舞台やイ ベントなどとは異なり,テレビ番組の録画や Web 上の動画サイトでは自身の視聴したい漫 才動画を選択して楽しむことが可能である.漫才動画を選択して楽しむ場合,自身のアーカ イブや動画サイト上にある漫才動画の中から,ユーザは一度見た好みの漫才を検索して探 し出す,つまり再検索することになる.ここでの再検索とは,一度視聴した動画をもう一度 視聴しようとその漫才動画を検索して探し出す事である. このように,漫才を検索する場面が存在するものの,漫才動画の検索についての研究はな されていない.そこで本研究では,漫才動画の検索について,特に自身のアーカイブや動画 サイトでの漫才動画の再検索について着目する.ここで漫才動画の再検索における問題点 の1つとして,視聴したい漫才動画を検索する際に,実際に漫才中で発言していたセリフか ら検索クエリを作成しても,タイトルや説明文にクエリで使用した言葉が表記されていな ければ見つける事が出来ないということが挙げられる.この問題は,検索クエリと漫才動画 に付与されたタイトルや説明文などの情報とのマッチングをとるという,現状の検索の仕 組みが原因の1つであると考えられる.タイトルや説明文などは漫才動画の内容を要約し 付与した情報であり,その漫才動画の内容全てを包括しているとは言い難いため,セリフを クエリとしてもこれらの情報に含まれていないことがある.このように現状では,タイトル や説明文などの漫才動画に付与されたメタ情報から検索しており,漫才動画内の内容,つま りコンテンツ自体の情報を検索の手がかりとすることができないため,漫才動画を検索す ることは難しいと言える.この問題に対して,漫才中のセリフを全文文字起こしすることで, その情報から検索エンジンにヒットさせる方法が考えられる.この方法であれば,漫才中の セリフを検索クエリに用いた場合においても,漫才がテキスト情報として保存してあるた め,その情報とマッチすることで検索が可能となる.しかし,検索結果として出てくる漫才 動画は単純にテキストマッチングを行なっているものであるため,必ずしもユーザの検索 意図に沿ったものではない可能性がある.例えば,ある面白かったセリフをクエリとしても, そのセリフもしくは言葉を含んだ全ての漫才が検索結果として出てきてしまう.今後,漫才 i 動画が増え続けることも考慮すると,その全ての検索結果の中から目的の漫才動画を探す ことは容易ではなく,全文文字起こしする方法だけでは検索が可能になるとは考え難い. そこで本研究では,ユーザの求める漫才動画を再検索可能とするため,漫才動画の漫才コ ンテンツ自体の情報であるセリフの重要度を考慮した索引化手法の実現を目指す.本研究 では,この漫才動画を再検索可能とする手法の実現に向け,まず人が漫才動画をどのように 記憶しているかについてインタビュー調査を行なった.そこから漫才を言葉で表現する際 に着目する特徴を 9 つに分類した. 次に,実際の再検索場面を想定した調査として,調査協力者に漫才動画を視聴してもらっ たのち,その漫才動画を「文章」と「単語」で表し,さらにその漫才動画を探し出す際にど のようなクエリで検索するのかについてのアンケートに回答してもらった.結果として,あ る漫才についての記憶は欠落している情報が多く,その限られた情報から目的とする漫才 動画を探し出すことは容易ではないことを明らかにした.また,この漫才についての情報が 限られた状態で,漫才のどのような部分をクエリとして用いているかについて着目するこ とで,ユーザがどのように再検索するのかについて分析した.結果として,「フレーズ」,「場 面設定・テーマ」,「演者名」,「場所・日程」といった情報からクエリを作成することがわか ったものの,「場面設定・テーマ」,「演者名」,「場所・日程」の情報から目的の漫才動画を 特定することは容易ではないため,「フレーズ」つまりセリフをクエリとして再検索する場 面を支援する事が重要であると考察した.次に,実際にどのようなクエリが作成されたかに ついて分析を行うことで,セリフの重要度からの索引化手法を実現する上で考慮すべき点 を明らかにした.結果として,「一般的でなく聞きなれない特徴的なセリフ」,「一般的であ り漫才中で複数回発言されているセリフ」,「漫才中で笑いが起きているタイミングのセリ フ」に着目すべきであることがわかった. 最後に,漫才動画の重要なセリフを機械的に選出可能かについて実験を行うことで,セリ フの重要度を考慮した索引化手法の実現可能性について検討した.実験は TF-IDF と動画 内の音量を用いることで,漫才を全文文字起こしした台本からセリフを選出した.結果とし て,TF-IDF を用いたテキスト情報のみからのセリフ選出は,漫才が様々な要因から笑いを 提供しているため難しく,一方で音量を用いたセリフ選出は,笑いが起こっている場面を判 定できているため,その場面から重要なセリフの選出可能性が高いことを明らかにした.

Artifacts

Information

Date of issue

2019/02/01

Citation

土屋 駿貴. 漫才動画再検索のためのセリフの重要度を考慮した索引化手法, 2019.

Links