AKB48、乃木坂46、欅坂46の違い/歌詞をテキスト分析で比較しました
- zuhiro
- 2019年2月9日
- 読了時間: 4分
以前、AKB・乃木坂・欅坂の違いを
試しにメジャーデビューからのシングル曲3曲の歌詞を
比較することで分析してみた記事を書いたのですが、
https://zuhiroi.wixsite.com/mysite/blank/%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E5%88%86%E6%9E%90-akb-%E4%B9%83%E6%9C%A8%E5%9D%82-%E6%AC%85%E5%9D%82%E3%81%AE%E6%AD%8C%E8%A9%9E%E3%81%AE%E9%81%95%E3%81%84
ほとんどPVのないこのブログの中では
比較的検索から見られているようだったこともあり、
歌詞の分析が面白そうだということもあり、、
まずはAKB・乃木坂・欅坂の歌詞をスクレイピングして
ある程度の母数で分析してみます!

とても簡単ですが、分析の手順は以下とします。
【1】歌詞検索サイト「 J-Lyric.net 」で、
それぞれの歌手の曲をスクレイピング。
VBAからseleniumを使って行いました。
※著作権的にどうなんだろうと気になりましたが、
著作権法では例外的に、情報解析のためのスクレイピングは
会員制など閲覧者が限定されたページでなければ大丈夫みたいです。
参考:
【スクレイピングと法律】
スクレイピングって法律的に何がOKで何がOUTなのかを弁護士が解説。
https://it-bengosi.com/blog/scraping/
【2】スクレイピングしたデータをcsvにして、
KHコーダーに読み込む。
【3】対応分析・多次元尺度構成法でグラフ化。
スクレイピングでとったそれぞれのグループの曲数は
■AKB:242曲
■乃木坂:175曲
■欅坂 :80曲※ひらがなけやきも含む
でした。
上記の手順で、対応分析でグラフ化したものが以下になります!

赤字のグループ名の近くにあるワードほど、
そのグループの歌詞に特徴的なワードということになるのですが、
なんとなくそれぞれのグループの特徴が出たでしょうか。。
出てきた単語を取り出すと、
■AKB:LOVE、愛しい、夢、未来、走る、キス、友達など
■乃木坂:悲しみ、恋、心、会う、しあわせ、好き、世界、生きる、悪など
■欅坂 :消える、絶対、大人、人生、言葉など
となりました。
AKBはLOVE、愛しい、キスなどの、ストレートなアイドルソングっぽい
キーワードが出てきます。無邪気な感じです。
乃木坂は悲しみ、しあわせ、生きる、など、少し憂いを帯びたワードがきます。
欅坂は消える、絶対、人生など、少し危なっかしい感じかもしれません。
また、AKBと乃木坂に比べ、欅坂は少し離れた場所に
ポインティングされていることから、それだけ異質なワードが多いようですね。
ただ、だいぶ曖昧な印象なので、
それぞれのグループに関して個別のグラフを見ていこうと思います。
まずAKBの歌詞を多次元尺度構成法で見ると、
以下になりました。

「WOW」「OH!」などがたくさん出てくる曲がいくつかあったのか、
なんだか偏りのあるグラフになっていますが…笑
水色がついているワードが一番共通する単語のグループですが、
風・未来・夢・愛・涙・世界・微笑む・思い出・しあわせ・生きる
などの言葉が、近い文脈で頻出するようです。
次に乃木坂の歌詞を多次元尺度構成法にかけた結果です。

左上のカモーンは、自惚れビーチの歌詞ですね。
最も頻出する水色のグループを見てみると、
風・夢・自分・歩く・知る・生きる・空
などとなっていました。
最後に欅坂の多次元尺度構成法です。

欅坂は比較的曲数が少ないので、
ワードから個々の曲が見えやすくなります。
一番頻出する水色のグループにあるワードは、
風・未来・言葉・太陽・時間・消える・愛
というようになっています。
ちょっと、、
最も頻出するワード群はどのグループも共通する部分が多いようです。
未来・風・夢など…特徴を探るためとすると、
なんともいえない、抽象的なキーワードですね。
より特徴的なワードを求め、
2番目・3番目の頻出グループの言葉を見ると。
AKB:
2番目(黄色)…大人・友達・走る など
3番目(紫色)…恋・好き・太陽・愛・目 など
乃木坂:
2番目…人生・光・探す・場所・強い・忘れる など
3番目…考える・聞く・胸・言葉・嘘 など
欅坂:
2番目…目・声・絶対・信じる・夜・生きる など
3番目…死ぬ・泣く・大人・誰か・傷つく・希望・涙・生まれる
少し特徴が出てきたように感じます。
AKBは明るく前進していくワードが多い(太陽、走る、好きなどの頻出語から)。
乃木坂は留まり模索する単語が多い(探す、忘れる、考える、聞くなどの頻出語から)。
欅坂は感情が揺れる表現の単語が多い(信じる、死ぬ、泣く、傷つくなどの頻出語から)。
上記は冒頭の対応分析のグラフを裏付ける結果となりました。
秋元康プロデュースの、今を代表する3グループの歌詞分析をしてきました。
母数を増やし、グループごとの違いを見ていくことで
少しは具体的なテキスト分析ができたのでは…と思います。
歌詞分析は面白かったので、
今後もいろいろやってみたいです!
Comments