世界中で毎日平均24,000曲、週単位では168,000曲の新曲がリリースされています。
しかし、この膨大な楽曲群から、本当にヒットするものはごくわずかです。そのため、音楽配信サービスがリスナーを引きつける楽曲を選ぶのも、私たちリスナーが自分の心に響く曲を見つけるのも、どんどん難しくなっています。
洪水のように溢れ出る曲の中から「ヒット曲」を的確に見つけ出せれば、音楽業界だけでなく、質の高い音楽を求めるリスナーにも大きなメリットが生まれます。しかし、これまでのヒット曲予測の試みは、ほとんどが失敗に終わっていました。
それを覆すような研究結果が、最近、米国クレアモント大学院大学(CGU)の研究者らから発表されました。彼らは「神経生理学的データに機械学習を適用することで、97%の精度でヒット曲を判断することに成功した」と述べています。
研究の詳細は、2023年6月20日付の『Frontiers in Artificial Intelligence』誌に掲載されています。
目次
- ヒット曲予測は失敗の連続だった
- 身体反応のデータと機械学習を組み合わせた手法を開発
- 身体反応により「レコメンデーション」が決まる日が来るかも
ヒット曲予測は失敗の連続だった
現代のコンテンツ生成のハードルが下がった社会では、溢れ出るコンテンツの中から「価値のあるもの」を見つけ出すことが、ますます困難になっています。
音楽も例外ではなく、配信される楽曲の中から良い曲を見つけ出すのは容易なことではありません。リスナーの中には、「ヒット曲だけを紹介してほしい」「自分に合う曲だけを紹介してほしい」と願う人も少なくはないでしょう。
もし「ヒット曲」や「リスナーの心に響く曲」を事前に予測できれば、私たちが良い曲に出会うハードルは格段に下がります。ヒット曲の確実な予測は、音楽業界にはもちろん、一攫千金を掴む大きな機会となり得ます。
だからこそ音楽業界は、ヒット曲を予測する試みに熱心に取り組んできたのです。
過去のヒット曲予測の手法には、リスナーへのアンケート調査や脳活動の調査などがありました。しかし、これらの手法の予測精度は一般的には低く、例えば機能的MRIを用いた研究でも、予測精度は50%を下回る結果にとどまりました。
機械学習の普及に伴い、テンポや楽器の種類など、楽曲の構成要素を抽出してヒット曲を予測する試み(ヒット・ソング・サイエンスと呼ばれる)も行われるようになりました。
例えば、2011年には23の曲の特徴を分析して曲の人気を判断する「ヒット可能性方程式(Hit Potential Equation)」が開発されましたが、この方程式を用いても、ヒット曲の予測精度は60%にとどまりました。
つまり、これまでの試みは、ほぼ失敗に終わっていたのです。
ヒット曲の予測は、なぜこれほどまでに難しいのでしょうか?
クレアモント大学院大学の研究者らは、これまでの研究が「音楽を聞いた後の感情の報告」の分析に主に依存していたことが問題だったと指摘します。
音楽はリスナーの感情的反応を引き出すものであり、その反応を事後に正確に報告することは難しいものです。なぜなら、感情的な反応は無意識のレベルで生じ、その結果を適切に報告することは困難だからです。
そこで研究チームは、後の感情報告に頼るのではなく、音楽に対する神経生理学的反応を直接測定することが予測精度の向上につながるという仮説を立てました。
そして、神経生理学的反応と機械学習を組み合わせた「ほぼ完璧にヒット曲を特定できる」手法を開発したのです。
では、彼らがヒット曲分類の精度を97%にまで引き上げた手法とは、どのようなものだったのでしょうか?
身体反応のデータと機械学習を組み合わせた手法を開発
研究者らは、33人の研究参加者に市販のウェアラブルデバイスを装着させ、音楽を聴いている間の心拍数データを収集しました。
参加者は、大ヒットした「ダンス・モンキー(Dance Money)」から、商業的に失敗した「デカリオ(Dekario)」まで、ロックやヒップポップなど24曲を聴かされました。
参加者の心拍数データは、アルゴリズムを使って「没入感(immersion)」という指標に変換されました。「没入感」とは、「音楽が引き起こす神経生理学的な反応を表す」指標で、ドーパミンとオキシトシンの量をアルゴリズムを用いて計算しています。
そして、この「没入感」指標とヒット曲との関係を、線形統計モデル(データの関係性を直線で表現するモデル)を用いて分析をしました。結果、ヒット曲は69%の精度で特定できました。
さらに、これらのデータを用いて訓練した機械学習モデルを適用すると、ヒット曲の特定率は97%にまで跳ね上がりました。
曲の最初の1分間だけでも、「没入感」指標に機械学習モデルを適用することで、ヒット曲を82%の成功率で正しく識別できたといいます。
身体反応により「レコメンデーション」が決まる日が来るかも
研究者らはこのモデルの優位性は「少数のデータに基づいて曲のストリーミング数など、市場の結果を予測する」点にあると説明しています。
本研究では、従来のように大規模データを使用するのではなく、少数の神経生理学的データを使用して、より大きな集団の結果を予測するアプローチ(「ニューロフォーキャスティング」という)を利用しています。
そして、このモデルの有用性は、新しい曲を生み出すことではなく、膨大な数の既存の曲を効率的に選別することにあると述べています。
例えば、リスナーのプレイリストに、ヒットしそうな新曲をより推薦するような、より効率的なストリーミング・サービスを作ることができるというわけです。
研究者らは、「将来、ウェアラブル神経科学技術が一般的になれば、身体の反応に基づくレコメンデーションができるようになるかもしれません。
リスナーには、何百もの選択肢を提示されるのではなく、2つか3つの選択肢のみが提示されるということです。それにより、より簡単かつ迅速に、楽しめる音楽を選ぶことが可能となるでしょう」
さらに研究者たちは、彼らのアプローチがヒット曲の特定以外にも利用できる可能性が高いことを期待していると言います。
「このアプローチは、映画やテレビ番組など、他の多くのエンターテインメントのヒット予測にも使えるでしょう」
参考文献
Machine learning helps researchers identify h | EurekAlert! https://www.eurekalert.org/news-releases/992481?元論文
Frontiers | Accurately predicting hit songs using neurophysiology and machine learning https://www.frontiersin.org/articles/10.3389/frai.2023.1154663/full