学位論文

スポーツにおけるSNS上のネタバレ判定とその応用

Abstract

スポーツは筋書きのないドラマであり,勝つか負けるかわからないというハラハラ感や 予想もしない展開に対する驚きを味わうために,リアルタイムでの視聴をしたいと考えて いる視聴者は少なくない.しかし,仕事や学業,その他の用事などでリアルタイムでの視聴 ができないため,仕方なく録画予約をして時間の許すときに視聴しようとすることもある. こうした状況において,録画視聴を楽しみにしている視聴者が,視聴前にそのスポーツの試 合結果を知ってしまうと,ハラハラ感や驚きが失われてしまう.こうしたハラハラ感や驚き を大事にしている視聴者にとって,試合結果はネタバレ情報と呼ばれており,多くの視聴者 はこれを避けるため情報遮断を積極的に行っている.ここで,ウェブ上で視聴者がネタバレ 情報に出会うのはニュースサイトやウェブログ,検索サイトなど様々であるが,特にネタバ レとの遭遇機会が多いのが Twitter に代表される SNS である.Twitter では,アクセスする だけで友人の現在の状況を知り,気軽にコミュニケーションをとることができる.そのため, 何気なくアクセスする視聴者が多く,その際にネタバレ情報も受け取ってしまう.SNS 上 にあるネタバレは,SNS サイトや SNS のアプリケーションを使用しないことで完全に断つ ことが可能である.しかし,SNS はコミュニケーションに利用されているものであり,完 全に遮断することはコミュニケーションを遮断してしまうことにつながってしまう.ここ で,例えばサッカーのある試合のネタバレツイートを遮断したい場合,トピックモデル (PLSI:Probabilistic Latent Semantic Indexing や LDA:Latent Dirichlet Allocation など がある)を利用して,サッカーに関するツイートすべて(トピック全体)を遮断するような 方法も考えられるが,そのトピックの範囲内でユーザ間のコミュニケーションが発生する 可能性があるため,トピック全体の遮断は控えるべきである.そこで,自動的にネタバレの みを検出・遮断できるようなシステムを構築することが重要である. ネタバレを防止するための研究としては,Nakamura らがテキスト情報の曖昧化処理によ るネタバレ防止手法を 4 つ考案し,それらの手法を用いてウェブページのネタバレ情報を 遮断する手法を提案している.しかし SNS 上のネタバレを対象とした場合には,テキスト 情報の曖昧化処理では,情報の錯乱を引き起こしてしまう危険があるため,ユーザ間のコミ ュニケーションを阻害してしまう可能性がある.また,ネタバレのみを高精度に判定するに はどうしたらよいのかといった点については取り組まれていないため,ユーザ間のコミュ ニケーションを遮断してしまう可能性がある.また,Jeon らは Twitter 上の投稿に対して, ネタバレの投稿には「固有表現」「頻繁に使用される動詞」「時制」などに特徴があることに 注目し,機械学習を用いてネタバレ検出をする手法を提案している.同研究では,テレビ番 組に関する投稿を用いて実験を行うことで,キーワードマッチングや LDA を用いた手法に 比べて高い精度でネタバレを検知している.さらに,スポーツの試合に関する投稿に対して も実験を行っており,提案手法の有用性を示している.しかし,スポーツについては 1 試合しか実験を行っていないうえ,ラベル付けを著者自身で行っているため,ネタバレの定義に 疑問が残る.実際,同じテレビ番組ではあっても,アニメ放送やバラエティ番組,スポーツ 中継ではコンテンツの内容が異なり,Twitter 上の投稿内容やネタバレの特徴も異なると考 えられる.そのため,スポーツについては,改めてネタバレの特徴を分析したうえで,高精 度に判定できる手法を検証していく必要がある. そこで本論文では,スポーツにおける SNS 上のネタバレを防止することを目指し,スポ ーツのネタバレを高精度に判定する手法を提案した.また,提案手法の妥当性を検証するた め,スポーツの試合に関する Twitter 上の投稿のデータセットを構築し,スポーツのネタバ レの特徴について分析を行った.分析の結果,試合中の勝敗状態とネタバレ内容の関連性を 確認することができ,提案手法の妥当性が示唆された.さらに,構築したデータセットを用 いて,スポーツに関する投稿からネタバレに関する投稿のみを判定する実験を行うことで, 提案手法の有用性を検証した.その結果,提案手法において,判定精度の評価指標である F 値が上昇し,提案手法がスポーツにおける SNS 上のネタバレ判定に有用であることを示し た.また,実験の結果,F 値の値はそれほど高くはなかったため,データセット構築の段階 でネタバレの判断基準を明確にし,その判断基準ごとにネタバレ判定を行っていく必要が あることが示唆された.そこで,ネタバレの投稿を「試合の最終結果が高い確信度で予測で きてしまう投稿」と定義したうえで改めてデータセットを構築し,再度ネタバレ判定実験を 行った.その結果,提案手法によって 0.85 を超える F 値でネタバレを判定することが可能 であることを示した.加えて本論文では,ネタバレの投稿の判定をネタバレシーンの判定に も応用可能であると考え,ネタバレしないダイジェストを生成し,映像コンテンツへの応用 可能性も検討した.アンケート調査の結果,提案手法を応用したダイジェストは,コンテン ツの面白さをあまり落とさずにネタバレを防ぐことができ,試合を視聴するかどうかの指 標としての有用性が高いことが示唆された.

Artifacts

Information

Book title

明治大学大学院 先端数理科学研究科 修士論文(工学)

Date of issue

2019/02/01

Citation

白鳥 裕士. スポーツにおけるSNS上のネタバレ判定とその応用, 明治大学大学院 先端数理科学研究科 修士論文(工学), 2019.

Links