OPEN

Scientific Reports / (2024) 14:27766 / Springer Nature / Open Access / DOI: 10.1038/s41598-024-78156-1

音楽は社会的感情を伝達する: 750 の音楽抜粋からの証拠

原題: Music communicates social emotions: Evidence from 750 music excerpts

Elliot X. Pring / 1 School of Psychological Sciences, Macquarie University, Sydney, Australia
Kirk N. Olsen / 2 Australian Institute of Health Innovation, Macquarie University, Sydney, Australia
Anthony E. D. Mobbs / 1 School of Psychological Sciences, Macquarie University, Sydney, Australia
William Forde Thompson / 1 School of Psychological Sciences, Macquarie University, Sydney, Australia; 3 Faculty of Society and Design, Bond University, Gold Coast, Australia

Received: 2024-03-17 / Accepted: 2024-10-29

Corresponding author e-mail: bthompso@bond.edu.au

抄録. 人間は音楽から、喜び、悲しみ、恐れのような多様な基本的情動含意を知覚しうる。こうした情動含意は、リズム、和声、音色などの音楽の構造的特徴から読み取ることができる。しかし、音楽が複数の社会的機能を持つという理論的・実証的知見があるにもかかわらず、音楽が社会的地位や社会的つながりに特有の感情を伝えるかどうかを検討した研究はほとんどない。

本研究の目的は、支配性と親和性という社会的感情が音楽の中に知覚されるかどうか、また、基本的情動と同様に、音楽の構造的特徴が社会的感情を予測するかどうかを明らかにすることであった。参加者（N = 1513）は、750 の音楽抜粋の部分集合を聴取し、エネルギー覚醒、緊張覚醒、感情価、支配性、親和性を評定した。評定は、音楽の 10 個の構造的特徴にもとづいてモデル化された。

その結果、支配性と親和性は音楽の中に容易に知覚され、リズム、和声、ダイナミクス、音色を含む構造的特徴によって予測された。さらに、エネルギー覚醒、緊張覚醒、感情価も音楽構造によって予測された。著者らは、これらの結果を現行の音楽と情動のモデルの観点から論じ、音楽における社会的感情の意義を明らかにするための今後の研究を提案している。

キーワード: 基本感情、音楽知覚、社会的感情、支配性、親和性

Acoustic features of music communicate basic and social emotions: Evidence from 750 music excerpts

原文 PDF 各ページ下部の誌面フッター.

Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 1
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 2
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 3
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 4
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 5
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 6
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 7
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 8
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 9
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 10
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 11
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 12
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 13
Scientific Reports | (2024) 14:27766 | https://doi.org/10.1038/s41598-024-78156-1 | 14

序論

音楽には、きわめて幅広い感情を表現し喚起する力がある^1–3。聴き手は、わずか数秒の音楽の後でも感情的含意を同定できるが（「知覚された感情」）、実際の感情経験（「感じられた感情」）を誘発するにはより長い時間が必要である^4–6。本研究では、1563 名の参加者が 750 の音楽抜粋から異なる部分集合を聴取し、知覚された感情を評定した国際的クラウドソーシング調査の結果を報告する。回帰分析と主成分分析を用いて、音楽属性によって引き起こされる感情反応の最適モデルを特定し、あわせて、音楽との関連でこれまで検討されてこなかった 2 つの社会的感情のモデルも検討した。

音楽に対する感情反応は、通常、離散モデルまたは次元モデルの枠組みで評価される。離散モデルは、幸福、悲しみ、怒り、嫌悪のような感情ラベルを用い、それらはときに、社会的感情（例: つながり感、エンパワーメント⁷）、道徳的感情（例: 後悔、義憤⁸）、美的感情（例: 畏怖、超越）、達成関連感情（例: 誇り、失望⁹）、認識的感情（例: 好奇心、疑い¹⁰）のようなタイプにまとめられる。こうした分類は、感情が当該感情状態に結びついた因果的・文脈的状況に繋留されていることを認めるものである¹¹。

次元モデルは、感情を、たとえばその感情の中で経験されるエネルギーの度合いのような、基底にある感情連続体上の点として描く¹²。次元モデルは、強度が変化する一方でラベルづけが難しい複雑感情を捉えることができる¹³。たとえばデスメタルのファンは、自分の好む音楽の中に、緊張、エンパワーメント、エネルギー、喜びの複雑な混合を知覚しうるため、単一ラベルで示しにくい^14,15。円環モデルは、感情を覚醒と感情価という 2 次元の感情上に写像する^16–18。一部のモデルでは、覚醒はさらに 2 種の活性化、すなわち疲労から活力までを結ぶエネルギー覚醒（EA）と、平静から神経質までを結ぶ緊張覚醒（TA）に分けられる^19,20。

音楽によって表現される感情は、作曲構造と演奏属性の双方に符号化されており^21,60、そこにはモード、テンポ、ダイナミクス（ラウドネス）、音高域、アーティキュレーション、音色が含まれる^22–24。たとえば、速いテンポ、協和性、長調、明るい音色は、幸福、高覚醒、正の感情価と関連している^21,25。

音楽と感情に関する研究は、主として喜び、悲しみ、恐れ、怒りのような基本感情に焦点を当ててきた²。これらの感情は、さまざまな文脈をまたいで個人が経験しうる抽象的な感情状態を反映する。しかし、音楽はしばしば文化的儀礼、音楽祭、式典などの社会的場面で経験され、音楽の社会的機能は多くの学問領域で強調されている。音楽はファンに対して社会的包摂感（社会的親和）を引き起こしうる一方、非ファンには社会的排除感を引き起こしうる^2,14。また音楽は、エンパワーメント（支配性）から服従性・無力感までにわたる社会的地位の感情も伝えうる^11,15。

支配性と親和性は中核的な社会的感情であり^26–29、社会的感情空間の 2 軸を構成する²⁸。支配性には、他者に対するリーダーシップやエンパワーメントから、従属や無力さまでの感覚が含まれる。他方、親和性は、社会的つながり感から孤立感・寂しさまでの感覚を指す。これらの概念はときに社会的判断や性向を反映するが、同時に感情状態そのものも記述している^26–29。

最近の研究は、これら 2 つの社会的感情を検討する必要性をさらに裏づけている。Aucouturier と Canonne³⁸ は、音楽は生成において社会的であるだけでなく、知覚においても社会的であり、行為主体間の社会関係の音響的痕跡として知覚されうると提案した。彼らの研究では、音楽訓練の有無を問わず、聴取者は即興的な音楽的相互作用の音響特徴から、支配性や親和性のような社会的意図を読み取ることができた。また、他文化の音楽における特定の音楽要素への暴露が、その文化集団に対する評価に影響しうることも報告されている⁵⁹。さらに、機能的神経画像研究は、支配性と親和性に異なる神経経路があることを明らかにしており³⁰、支配性は円環モデルにおける感情の中核次元の一つとして提案されている^31–34。

本研究は、この基盤の上に立ち、1500 名超の聴取者からの反応と 750 の音楽サンプルを用いて、複数ジャンルにわたる音楽が社会的感情を伝える能力を検討した。支配性と親和性を測定する双極尺度²⁸ を用い、これらの感情がどの程度知覚されるかを評価した。また、音楽分析ソフトウェアと統計モデリングにより、さまざまな音楽属性が、支配性と親和性という社会的感情、および EA、TA、感情価という感情次元を含む、聴取者が知覚した情動的意味をどのように予測するかをモデル化した。さらに、音楽属性が次元モデルにもとづく感情反応を予測するかどうかも検討した。音楽刺激は、1 回の実験セッションで多くの抜粋を評定してもらい大規模サンプルを集められるよう、5 秒の抜粋に限定した。

サンプルからは、リズム、ダイナミクス、和声、音色といった 16 の構造要素を抽出した^34–36。モデリングによって、構造要素が音楽における知覚された EA、TA、感情価、支配性、親和性を予測するかどうかを判断した。事前仮説は 2 つである。第一に、社会的感情（支配性と親和性）と、知覚された EA、TA、感情価は、平均評定に反映されるように、音楽サンプルの中に知覚されるはずである（H1）。第二に、社会的感情および知覚された EA、TA、感情価は、リズム、音色、音高の高さのような構造要素によって予測されるはずである（H2）^19,37。

結果

記述統計

記述統計を表 1 に示す。Modified Self-Assessment Manikin（SAM）尺度への応答は、1 から 7 の値へ変換した。標本サイズが大きいため、すべての変数について標本分布の正規性を仮定した。表 1 のすべての平均値は、中立評定 4.0 より有意に高かった（p < .0001）。これは、その感情が知覚されていない場合に期待される値である。標準偏差は、個々の音楽サンプルに与えられた平均評定と、750 の全音楽サンプルで平均した平均評定との差の典型的な大きさを示している。

表1. 従属変数の平均値、標準偏差、歪度、尖度
変数	N	M	SD	歪度	尖度
EA	749	5.06	0.69	−0.30	2.08
TA	749	4.26	0.70	−0.03	2.32
Valence	749	5.05	0.44	−0.47	2.94
Dominance	749	4.69	0.56	−0.12	2.40
Affiliation	749	4.84	0.44	−0.02	2.84

注: N = 音楽刺激数、EA = エネルギー覚醒、TA = 緊張覚醒。

感情評定間の相関

各感情評定間の相関を調べたところ（表 2）、EA と TA の間には中程度で有意な正の相関があり、TA と感情価の間には中程度で有意な負の相関が見られた。支配性評定はエネルギー覚醒評定および緊張覚醒評定と高く相関しており、この社会的感情が、音楽抜粋の中に知覚される覚醒水準の影響を受けている可能性が示唆された。

表2. 従属変数間の相関
変数	EA	TA	Valence	Dominance	Affiliation
EA	-
TA	0.66**	-
Valence	−0.08*	−0.56**	-
Dominance	0.80**	0.82**	−0.29**	-
Affiliation	0.62**	0.12**	0.44**	0.39**	-

注: *p < .05、**p < .01。

音楽属性と感情評定の相関

音楽抜粋の属性と、EA、TA、感情価、支配性、親和性の知覚評定との間で二変量相関を算出した（表 3）。いくつかの音楽属性は EA、TA、支配性、親和性の指標と有意に相関しており、その強さは主として中程度であった。感情価と音楽属性との相関は弱いか、非有意であった。テンポは EA（r = .90）、TA（r = .72）、支配性（r = .81）と高く相関した。Brightness、spectral centroid、spectral rolloff、event density、spectral entropy、zero-crossing rate は、EA、TA、支配性、親和性と中程度の正相関を示した。

表3. 心理物理的音楽属性と評定尺度の相関
変数	EA	TA	Valence	Dominance	Affiliation
Tempo	0.90**	0.72**	−0.17**	0.81**	0.55**
Pulse clarity	0.46**	0.20**	0.06	0.28**	0.40**
RMSE	0.18**	0.12**	−0.05	0.28**	0.40**
Brightness	0.63**	0.46**	−0.13**	0.53**	0.36**
Dissonance	0.23**	0.30**	−0.21**	0.29**	0.05
Mode	0.02	−0.07*	0.09*	−0.02	0.08*
Spectral centroid	0.59**	0.37**	−0.04	0.45**	0.42**
Spectral rolloff	0.56**	0.32**	−0.00	0.42**	0.43**
Mean pitch	0.26*	0.20**	−0.07	0.26**	0.14*
Event density	0.39**	0.36**	−0.18**	0.36**	0.15**
Spectral spread	0.52**	0.25**	0.05	0.37**	0.44**
Spectral skewness	−0.53**	−0.34**	0.05	−0.44**	−0.38**
Spectral kurtosis	−0.32**	−0.21**	0.00	−0.27**	−0.25**
Spectral flatness	0.40**	0.17**	0.07	0.27**	0.35**
Spectral entropy	0.68**	0.48**	−0.12**	0.57**	0.43**
ZCR	0.53**	0.42**	−0.12**	0.45**	0.28**

注: 左列に心理物理的音楽属性、各列上部に評定対象の感情を示す。EA = エネルギー覚醒、TA = 緊張覚醒、RMSE = root mean square energy、ZCR = zero-crossing rate。*p < .05、**p < .01。

主成分分析による音楽特徴の削減: 共線性への対処

抽出した音楽特徴間の多重共線性に対処するため、主成分分析（PCA）を用いた。これは MIRtoolbox⁴⁷ における計算手法の重なりに由来する既知の問題である。PCA は心理物理的属性間の共通性を同定し、回帰モデルの簡潔さを保ちながら最も重要な要因だけを保持できるようにした。表 4 に示すとおり、第 1 成分はスペクトル特徴に支配されていたため、spectral centroid、brightness、zero-crossing rate のみを保持した。第 2 成分には RMSE（ラウドネス）と dissonance の両方が含まれており、それぞれ計算過程が異なること、また知覚された緊張との関連性が高いことから、両者を保持した。第 3 成分では pulse clarity と event density が関与しており、これらはリズムの明瞭さの異なる側面を反映するため、両方を保持した。最後に、第 4 成分からは、感情価知覚との関連と高い負荷量を理由に mode を保持した。全体として、6 つの音楽特徴を除外し、5 カテゴリにまたがる 10 特徴を保持した。すなわち、音色（ZCR、spectral centroid、brightness）、和声（dissonance、mode）、ダイナミクス（RMSE）、リズム（tempo、pulse clarity、event density）、音高である。

表4. 音楽属性の成分負荷量
変数	1	2	3	4
Pulse clarity	0.36	0.28	0.52	0.18
RMSE	0.17	0.86	−0.27	−0.03
Brightness	0.92	−0.14	0.10	−0.06
Dissonance	0.20	0.82	−0.10	−0.08
Mode	0.10	−0.06	−0.00	0.85
Spectral centroid	0.97	−0.07	0.07	−0.03
Spectral rolloff	0.95	−0.01	0.00	−0.01
Mean pitch	0.31	0.05	0.26	−0.44
Event density	0.23	0.49	0.49	0.20
Spectral spread	0.92	0.05	−0.12	0.01
Spectral skewness	−0.88	0.05	0.30	−0.04
Spectral kurtosis	−0.59	0.04	0.50	−0.09
Spectral flatness	0.80	−0.06	−0.12	0.04
Spectral entropy	0.94	−0.08	0.04	−0.04
ZCR	0.72	−0.26	0.37	−0.06

注: 各成分で最も高い負荷量を太字で示した。

音楽特徴と知覚された感情次元のモデル

回帰モデル: エネルギー覚醒

749 件の観測値（音楽刺激が、その音楽属性と知覚された感情によってスコア化されたもの）を用いた。Shapiro-Wilk 検定は残差が正規分布していることを示し（p > 0.05）、残差対適合値プロットの検査から線形性の仮定も満たされた。ただし残差プロットの中央付近には明瞭なクラスターが見られた。White の異分散性検定では等分散性仮定の違反は認められなかった（p = .129）。したがって、推測統計には最小二乗重回帰モデルを用いた。

音楽属性が、音楽におけるエネルギー覚醒の知覚表出と関連するかを評価するモデルは有意であり、F(10, 738) = 342.66, p < .001 で、EA 知覚の分散の 82.28% を説明した（非調整推定）。統計的に有意な関係は 3 つ観察された。EA と tempo（ηp2 = 0.636）、EA と pulse clarity（ηp2 = 0.008）、EA と brightness（ηp2 = 0.013）である（表 5）。これらはいずれも正の関係であり、他の変数を一定としたとき、tempo、pulse clarity、brightness が増えるほど、音楽における EA の知覚的大きさも増すことを意味する。pulse clarity と brightness は EA 知覚の有意な予測因子であったが、効果量はいずれも小さかった。EA はリズム要素と音色要素に密接に結びついており、その中核は拍テンポであった。

表5. エネルギー覚醒モデルの回帰統計量
変数	Coef.	SE	t	p	95% CI
Tempo	0.78	0.23	34.04	< 0.001	[0.74, 0.83]
Pulse clarity	0.19	0.06	3.02	0.003	[0.07, 0.32]
RMSE	-0.16	0.57	-0.28	0.782	[-1.28, 0.96]
Spectral centroid	-0.00	0.00	-0.40	0.686	[0.00, 0.00]
Brightness	0.54	0.17	3.15	0.002	[0.20, 0.88]
Dissonance	0.00	0.00	0.58	0.565	[0.00, 0.00]
Mode	0.13	0.08	1.74	0.082	[-0.02, 0.01]
Event density	-0.01	0.01	-1.24	0.217	[-0.03, 0.01]
Mean pitch	0.00	0.00	0.64	0.522	[0.00, 0.00]
ZCR	0.00	0.00	-1.29	0.197	[0.00, 0.00]

回帰モデル: 緊張覚醒

Shapiro-Wilk 検定は、残差の正規性仮定が満たされていることを確認した（p > .05）。残差と適合値のプロットから線形性仮定も満たされていた。残差対適合値プロットの中央付近にわずかなクラスター化が見られたものの、White 検定では等分散性仮定の違反は認められなかった（p = .381）。よって、重回帰分析が適切と判断された。

音楽属性が音楽における TA 知覚と関連するかを評価する一般モデルは有意であり、F(10, 738) = 102.01, p < .001、TA 知覚の分散の 58.02% を説明した。表 6 が示すように、このモデルでは 4 つの有意な負の関係が見られた。TA と RMSE（ηp2 = 0.005）、TA と pulse clarity（ηp2 = 0.027）、TA と spectral centroid（ηp2 = 0.022）、TA と mode（ηp2 = 0.006）である。これは、音楽の拍がより明瞭であるほど、あるいは抜粋全体のエネルギーが多いほど、TA の知覚的大きさが減少することを示している。さらに、他の音楽属性を一定とした場合、質量周波数の spectral centroid が高いほど、また modality 値がより正であるほど、音楽における TA 知覚は減少した。

このモデルでは 3 つの有意な正の関係も見出された。TA と tempo（ηp2 = 0.344）、TA と brightness（ηp2 = 0.011）、TA と dissonance（ηp2 = 0.032）である（表 6）。これは、音楽の拍速度が増加する、音楽中の高周波エネルギーが増える、あるいは音楽抜粋に含まれる不協和が増加するほど、TA の知覚的大きさが増すことを意味する。これら正負両方向の関係は、音楽における TA 知覚が、リズム（tempo と pulse clarity）、和声（mode と dissonance）、音色（spectral centroid と brightness）、ダイナミクス（RMSE）の特徴の影響を受けることを示している。すべての有意な予測因子の効果量は、tempo を除けば小さかった。

表6. 緊張覚醒モデルの回帰統計量
変数	Coef.	SE	t	p	95% CI
Tempo	0.71	0.36	19.67	< 0.001	[0.64, 0.78]
Pulse clarity	-0.46	0.10	-4.56	< 0.001	[-0.65, -0.26]
RMSE	-1.78	0.89	-2.00	0.046	[-3.52, -0.03]
Spectral centroid	0.00	0.00	-4.09	< 0.001	[0.00, 0.00]
Brightness	0.78	0.27	2.90	0.004	[0.25, 1.31]
Dissonance	0.00	0.00	5.00	< 0.001	[0.00, 0.00]
Mode	-0.26	0.12	-2.13	.033	[-0.49, -0.02]
Event density	0.01	0.01	1.09	0.277	[-0.01, 0.04]
Mean pitch	0.00	0.00	-0.13	0.896	[0.00, 0.00]
ZCR	0.00	0.00	1.66	0.098	[0.00, 0.00]

回帰モデル: 感情価

このモデルには、本研究に含まれた関連音楽抜粋 749 件すべての観測値を用いた。全体モデルの残差は Shapiro-Wilk 検定によれば正規分布していた（p > .05）。さらに、残差対適合値プロットの検査から線形性仮定も満たされていた。残差の中央付近にわずかなクラスター化が見られたが、White 検定は等分散性仮定の違反がないことを示した（p = .109）。

音楽属性が音楽における感情価知覚と関連するかを評価する一般モデルは有意であり、F(10, 738) = 11.42, p < .001、感情価知覚印象の分散の 13.40% を説明した。表 7 に示すように、3 つの有意な正の関係が見られた。感情価と pulse clarity（ηp2 = 0.013）、感情価と spectral centroid（ηp2 = 0.028）、感情価と mode（ηp2 = 0.010）である。すなわち、他の変数を一定とすると、より識別しやすい拍、高い spectral centroid、より正の modality 値（すなわち長調である可能性が高いこと）は、より正の感情価と結びついていた。

このモデルでは 3 つの有意な負の関係も示された。感情価と brightness（ηp2 = 0.020）、感情価と dissonance（ηp2 = 0.012）、感情価と event density（ηp2 = 0.010）である（表 7）。これらは、brightness、event density、dissonance のいずれかが 1 単位増えると、不快さが増すことを意味する。つまり、快さの低い感情価評定は、高周波エネルギーの増加、不協和水準の上昇、1 セグメントあたりの音楽イベント数の増加と関連していた。総じて、音楽における感情価知覚は、リズム（event density と pulse clarity）、和声（mode と dissonance）、音色（brightness と spectral centroid）といった広い音楽学的概念の影響を受けていた。

表7. 感情価モデルの回帰統計量
変数	Coef.	SE	t	p	95% CI
Tempo	-0.06	0.03	-1.91	0.057	[-0.13, 0.00]
Pulse clarity	0.29	0.09	3.20	0.001	[0.11, 0.47]
RMSE	-0.13	0.80	-0.16	0.869	[-1.71, 1.44]
Spectral centroid	0.00	0.00	4.62	< 0.001	[0.00, 0.00]
Brightness	-0.94	0.24	-3.88	< 0.001	[-1.42, -0.47]
Dissonance	0.00	0.00	-2.97	0.003	[0.00, 0.00]
Mode	0.28	0.11	2.59	.010	[0.07, 0.50]
Event density	-0.03	0.01	-2.77	.006	[-0.06, -0.01]
Mean pitch	0.00	0.00	-0.17	0.864	[0.00, 0.00]
ZCR	0.00	0.00	-1.82	0.070	[0.00, 0.00]

音楽属性と知覚された社会的感情のモデル

回帰モデル: 支配性

Shapiro-Wilk 検定によれば残差は正規分布しており（p > 0.05）、残差対適合値プロットの検査から線形性仮定も満たされていた。残差プロット中央付近にはごくわずかなクラスター化が見られた。しかし White 検定は、等分散性仮定の違反がないことを示した（p = .142）。

支配性知覚に影響する音楽属性のモデルは有意であり、F(10, 738) = 170.35, p < .001、音楽における支配性知覚分散の 69.77% を説明した。3 つの有意な正の関連が観察された。支配性と tempo（ηp2 = 0.484）、支配性と brightness（ηp2 = 0.018）、支配性と dissonance（ηp2 = 0.026）である（表 8）。つまり、テンポが速く、高周波エネルギーが大きく、不協和が強い音楽抜粋ほど、より高い支配性評定が与えられた。

また、このモデルは、支配性知覚と pulse clarity（ηp2 = 0.017）、支配性知覚と spectral centroid（ηp2 = 0.018）の 2 つの有意な負の関係も明らかにした（表 8）。したがって、音楽の拍がより明瞭であるか、spectral centroid 値がより高い場合、その音楽抜粋はより支配的でないと知覚されやすかった。総じて、支配性知覚はリズム（tempo と pulse clarity）、和声（dissonance）、音色（brightness と spectral centroid）の特徴の影響を受けていた。これらの効果は高度に有意であったが、tempo を除けば効果量は小さかった。

表8. 支配性モデルの回帰統計量
変数	Coef.	SE	t	p	95% CI
Tempo	0.65	0.02	26.31	< 0.001	[0.60, 0.70]
Pulse clarity	-0.24	0.07	-3.55	< 0.001	[-0.38, -0.11]
RMSE	-1.06	0.61	-1.74	0.083	[-2.26, 0.14]
Spectral centroid	0.00	0.00	-3.68	< 0.001	[0.00, 0.00]
Brightness	0.67	0.18	3.64	< 0.001	[0.31, 1.03]
Dissonance	0.00	0.00	4.44	< 0.001	[0.00, 0.00]
Mode	0.00	0.08	0.05	0.964	[-0.16, 0.17]
Event density	-0.01	0.01	-0.95	0.343	[0.00, 0.00]
Mean pitch	0.00	0.00	1.68	0.094	[0.00, 0.00]
ZCR	0.00	0.00	−0.033	0.743	[0.00, 0.00]

回帰モデル: 親和性

このモデルには 749 の音楽抜粋観測値すべてが含まれた。残差の正規性仮定は Shapiro-Wilk 検定によれば満たされなかった（p < .05）。残差対適合値プロットの検査から線形性仮定は満たされていたが、プロット中央付近に中程度のクラスターがあるため、等分散性仮定は破れている可能性があった。White 検定はこれを裏づけ、等分散性仮定の違反を示した（p = .032）。この潜在的な注意点はあるものの、標本サイズが大きく、重回帰が頑健であることから、重回帰モデルを継続して用いた。

音楽属性と音楽における親和性知覚の関係を説明する全体モデルは有意であり、F(10, 738) = 47.53, p < .001、音楽における親和性知覚の 39.18% を説明した。表 9 に示すように、tempo（ηp2 = 0.163）、pulse clarity（ηp2 = 0.027）、spectral centroid（ηp2 = 0.017）、mode（ηp2 = 0.013）は、いずれも親和性知覚と有意な正の関係を持っていた。したがって、他の変数を一定としたまま、これら予測因子のいずれかが 1 単位増えると、社会的親和の知覚は増加する。テンポが高く、拍がより明瞭で、spectral centroid 値が高く、長調である可能性が高い音楽抜粋ほど、より向社会的と解釈されやすかった。

Dissonance（ηp2 = 0.012）と event density（ηp2 = 0.017）は、親和性知覚と有意な負の関連を示した（表 9）。他の変数を統制したとき、これらの予測因子のいずれかが 1 単位増えると、社会的親和の知覚は減少した。したがって、不協和が大きい、あるいはセグメント内の音楽イベント数が多い音楽抜粋は、より反社会的に知覚されやすかった。ただし、係数、信頼区間、効果量からみて、dissonance と spectral centroid の効果は小さかった。tempo を除く他の有意な予測因子の効果量も小さかった。総じて、このモデルは、音楽における親和性知覚が、リズム（tempo、event density、pulse clarity）、和声（dissonance、mode）、音色（spectral centroid）の特徴と関連していることを示唆している。

表9. 親和性モデルの回帰統計量
変数	Coef.	SE	t	p	95% CI
Tempo	0.33	0.03	12.01	< 0.001	[0.27, 0.38]
Pulse clarity	0.34	0.08	4.52	< 0.001	[0.19, 0.49]
RMSE	1.24	0.67	1.85	0.064	[-0.07, 2.56]
Spectral centroid	0.00	0.00	3.54	< 0.001	[0.00, 0.00]
Brightness	-0.37	0.20	-1.82	0.069	[-0.77, 0.03]
Dissonance	0.00	0.00	-3.03	0.003	[0.00, 0.00]
Mode	0.28	0.09	3.08	0.002	[0.10, 0.46]
Event density	-0.04	0.01	-3.58	< 0.001	[-0.06, 0.02]
Mean pitch	0.00	0.00	-0.11	0.910	[0.00, 0.00]
ZCR	0.00	0.00	-2.11	0.035	[0.00, 0.00]

考察

本研究は、大規模なジャンル横断コーパスにわたる短い音楽抜粋が、支配性と親和性という社会的感情、および EA、TA、感情価という感情次元を伝達するかどうか、また、抜粋の音楽属性（例: リズム、音色、和声）が知覚された感情を予測するかどうかを検討した。これまでの研究は、演奏者間の相互作用として支配的または親和的な社会的関係が知覚されることは確認していたが³⁸、ジャンル横断的な音楽に対して、聴取者が社会的感情を知覚するかどうかは未検討であった。

支配性と親和性は社会的相互作用における中心概念であり、心理学文献では広く研究されてきた。しかし、それらが音楽経験と関連づけて検討されたことはなかった。支配性は統制感、自己主張、影響力に関わり、親和性はつながり感に関わる。音楽がこうした社会的構成概念を示しうるという結果は、新規性の高い発見である。

図 1 は、本研究結果を解釈するための枠組みを与えている。この図は、音楽サンプル・コーパスから同定された音楽特徴と、それらが知覚された社会的感情および EA、TA、感情価とどのように結びつくかを示す。図が示し、回帰分析が支持するように、複数の音楽属性が特定の情動的性質を予測するために収束しており、異なる属性集合が異なる情動的性質を予測していた。以下では、こうした相互連関と、当該感情が伝達されるという証拠を、既存の音楽と感情のモデルの観点から論じる。

図1 音楽特徴と評定尺度の関係 — **図1.** 音楽特徴と評定尺度の関係。すべての接続は各モデルにおいて有意だった心理音響学的予測因子を表す。音楽属性が説明した分散は、Energy Arousal 82.28%、Tension Arousal 58.02%、Valence 13.40%、Dominance 69.77%、Affiliation 39.18% であった。三角形で終わる線は正の関係、円で終わる線は負の関係を表す。RMSE = root mean square energy。

重回帰モデルにより、支配性評定と親和性評定の両方が音楽変数によって有意に予測されることが示されたが、説明分散は親和性（39.18%）よりも支配性（69.77%）で高かった。したがって、音楽属性が社会的感情評定への影響にもとづいて分類可能であるという仮説は支持された。

これらの知見は、Aucouturier と Canonne³⁸ が示した、音楽は演奏者間の社会関係の音響的痕跡として知覚され、その音響的帰結が聴取者に支配性や親和性のような社会的意図を推論させるという提案を補完する。彼らの実験的アプローチでは、音楽即興者が非音楽的な社会的意図を伝達し、それらが動的相互作用と特定の音響手がかりにもとづいて認識されることが示された。これに対し本研究は、平均化された静的な音楽属性が社会的感情知覚をどの程度予測できるかに焦点を当てた。その結果、支配性と親和性のいずれも予測可能であるものの、その程度には差があることが明らかになった。具体的には、音楽属性は親和性モデルより支配性モデルで 30.59% 多く分散を説明した。

音楽属性では説明されない社会的感情の分散源、とりわけ親和性については、今後の研究でさらに明らかにする必要がある。音楽が時に「代理の友人」として用いられるという観点からすれば⁵⁶、親和感は、よく知っていて好ましい音楽によって引き起こされる可能性が高い。二変量相関では、PCA による特徴削減以前の段階で、知覚された支配性はほぼすべての音楽予測因子（modality を除く）と有意に相関していた。また、知覚された親和性も、特徴削減以前には dissonance を除くすべての音楽属性と相関していた。

多くの音楽構造特徴が、親和性と支配性という社会的次元と結びついていた。音楽における支配性知覚の大きさは、リズム（tempo と pulse clarity）、和声（dissonance）、音色（brightness と spectral centroid）と関連していた。親和性知覚の大きさは、やや異なる予測因子を持っていたものの、やはりリズム（tempo、pulse clarity、event density）、和声（dissonance、modality）、音色（spectral centroid）と関係していた。ただし、本研究の分析には正規性および等分散性の仮定違反が含まれていたため、この種のモデルについてはさらなる研究が必要である。

EA、TA、感情価という各次元モデルはいずれも高い有意性を示し（p < .001）、次元的感情尺度どうしも有意に相関していた。この観察は、感情価と緊張の評定は負に相関し（r = −.70）、エネルギーと緊張の評定は正に相関する（r = .57）という先行研究と整合的である^12,39。EA と TA のモデルで説明される分散は、感情価モデルで説明される分散より大きかった。この知見もまた、音楽属性は感情価評定よりも覚醒評定の方をより安定的に予測するという先行証拠と一致する^40,41。

感情価評定を説明しにくいことは、本研究に含めたジャンルの多様性によって部分的に説明できるかもしれない。異なるジャンルは異なる感情反応や個人的連想を喚起した可能性が高く、そのため、音楽属性と感情価の関係に一貫したパターンが見えにくくなった可能性がある。曲やジャンルへの親近感、個人的連想、視覚イメージといった要因が判断に寄与し、ジャンル横断的にみた音楽属性の予測力を低下させたと考えられる⁴²。

図 1 は、有意な関連をまとめて示している。Tempo は知覚された EA と TA の最強の予測因子であり、EA と TA の両方で効果量は大きかった。これは、テンポと覚醒の関連に関する先行研究と一致する^34,43。また、拍がより識別しやすい音楽抜粋（より高い pulse clarity）は、エネルギーの増加と緊張の低下に関連していた。一方、event density はどちらの次元とも関連していなかった。

和声を構成する音楽属性（mode と dissonance）は、TA 知覚と有意に関連していた。不協和が高い、あるいは短調である音楽は、聴取者から高い緊張評定を受けた（なお dissonance の係数は小さく、0.00 に丸められている。MIRtoolbox が抽出する dissonance 値は 3 から 1390 の範囲にあるため、7 件法尺度の評定を予測する係数は小さくなる）。RMSE（ラウドネス）の増加は、音楽における緊張知覚の低下と有意に関連していた。しかし zero-crossing rate は覚醒の有意な予測因子ではなかった。

予測どおり、音楽におけるより大きなエネルギー知覚は、brightness の増加によって有意に予測された。これは、brightness と覚醒の正の関係を示した先行知見を支持する⁴⁴。さらに、緊張も spectral centroid によって有意に予測され、サンプルのスペクトル分布重心が高いほど、緊張を表出しにくいことが示された（spectral centroid も dissonance と同様に、係数が 0.00 に丸められるほど小さい。これは spectral centroid 値が 405 から 6076 に分布しているためである）。

リズムに関係する 3 つの音楽属性のうち 2 つが、音楽の快さ知覚の有意な予測因子であった。Tempo は快さ知覚を予測しなかった。テンポが幸福や悲しみの判断を予測するという先行研究はあるが^25,45,46（ただし⁴³ も参照）、本研究で快さ評定と結びつかなかったことは、幸福な音楽も悲しい音楽もどちらも心地よくなりうるという事実を反映している可能性がある^2,11。すなわち、本研究で用いた快さの次元評定尺度は、カテゴリー的感情価モデル（例: happy、joyful、sad）にもとづく評定とは異なる可能性がある。Pulse clarity と event density は、効果量は小さいものの、快さ知覚の予測に重要であった。これらの方向性は、拍がより明瞭な音楽は聴取者にとって快さを増しやすく、対して、ひとつの音楽瞬間により多くの音符を含む音楽は快さを下げやすいことを示唆している。

和声に関連する両構造特徴（mode と dissonance）も、音楽の快さ知覚を予測した。これらの関係は、長調で、耳ざわりの少ない音楽抜粋ほど快いと知覚されやすいことを示している^21,22。先行知見と異なり²¹、mean pitch は快さ知覚の有意な予測因子ではなかった。ひとつの解釈として、MIRtoolbox はこのように短い 5 秒サンプルから reliable な mean pitch を抽出できなかった可能性があり、今後はより長い音楽サンプルでこの予測因子を再検討すべきである。

RMSE（ラウドネス）と zero-crossing rate は快さ知覚の有意な予測因子ではなく、ラウドネス変動や過渡情報は、聴取者の快さ判断形成に決定的な役割を果たしていない可能性がある。この知見は、音響特徴抽出に用いた MP3 ファイルの多くが標準化された音量水準を持っていたため、ラウドネス変動の潜在的影響が覆い隠されたことに起因するかもしれない。実際、多くの抜粋は RMSE 値 0.05〜0.15（範囲 0.03〜0.25）に集中しており、快さとの関連を検出するにはラウドネスの変動が十分でなかった。

Brightness や spectral centroid のような音色関連属性は、快さの有意な予測因子として浮上した。具体的には、音響サンプルのスペクトル分布重心が高いほど、それは快いと知覚されやすかった。また、サンプル内の高周波エネルギーの増加は快さの低下と結びついており、音楽における brightness や「sharpness」は不快に知覚されうることを示している。これらの知見は、音楽の快さ判断における音色的質の重要性を示している。

支配性とエネルギーの高い相関を踏まえると、聴取者がこの 2 概念を同一視していたのではないかという疑問が生じる。しかし、この可能性は低い。なぜなら、参加者が支配性と覚醒の区別を十分理解できるよう、手順上の工夫を行ったからである。覚醒は、生理的活性化や注意の高まりに特徴づけられる一般的感情状態であり、社会的文脈にも非社会的文脈にも現れうる。それは感情経験の強度を反映するが、社会力学そのものに結びついてはいない。これに対し支配性は、社会的状況の中での力や統制感を表す社会的感情である。覚醒が単独でも特定刺激への反応でも起こりうるのに対し、支配性は関係的であり、階層的位置づけや権威が問題となる社会的相互作用の中で生じる。本研究では、支配性が単なる高覚醒状態ではなく、社会的感情であることを参加者への説明で明確にした。この区別は、覚醒とは独立した支配性に関連する固有の感情反応を捉えるうえで重要であった。

音楽構造特徴を組み込んだモデルは、社会的感情と EA、TA、感情価の双方を予測した。さらに、音楽属性はエネルギー、緊張、支配性を強く予測したが、感情価と親和性に対する予測力は相対的に弱かった。これらの結果は、親和性という社会的感情が、明示的な促しや社会的条件がなくても、音楽の中に自発的に知覚されるのかという問いを投げかける。親和性はつながり、温かさ、社会的結びつきに関わるが、社会的相互作用や一体感を示唆する文脈的・歌詞的手がかりがない場合、それは特定の音楽要素の中にのみ排他的に符号化されているわけではないのかもしれない。逆に、親和感は、音楽を「代理の友人」とみなす聴取の仕方によってプライミングされる可能性もある⁵⁶。今後の研究では、音楽における親和性知覚を高めたり弱めたりする音楽特徴、文脈、プライミング条件を同定する必要がある。

それでも、親和性が感情価よりもうまく説明されたことは注目に値する。これは、親和性モデルの方が感情価モデルより高い予測力を持つことを意味する。今後は、親和性と支配性の判断が、快・不快や活性化・不活性化といったコア・アフェクト次元とどのように関係するかを調べる価値がある。こうした関係の理解は、音楽における感情知覚の理論的枠組みをより豊かにするだろう。

本研究の限界の一つは、刺激の長さが短いことである。短い音楽サンプルを提示したことで、多くの抜粋を提示しつつ参加者疲労を避けられたが^23,24、5 秒という短時間の中にどれほどの感情情報が含まれているかは不確かである。聴取者が短い音楽抜粋の中に感情的性格を検出できることは確認されているが^1,4,57、ノスタルジアや畏怖のような複雑感情は、5 秒以上かけて伝達される可能性がある⁴²。刺激長の短さは、伝達可能な感情の種類を制限した可能性が高い。

第二の限界は、参加者がすべての感情・社会的感情尺度を逐次的に評定した点である。この手続きでは、各音楽刺激を、エネルギー、緊張、感情価、支配性、親和性の観点から継続的かつ回顧的に判断する必要があり、与えられた音楽情報量が少ないことを考えると難しかった可能性がある。それでも、聴取者は尺度の使用に特段の困難を示さず、データ検討からも、すべての評定尺度が音楽属性と系統的に関係していることが示された。したがって、この手続きが結果の質を損なったとは考えにくい。

また、募集戦略上、18 歳以上で米国在住であること以外の詳細な人口統計情報を収集できなかったことも制限である。年齢、性別、過去の音楽経験といった母集団パラメータが感情知覚にどのように関わるかは不明である。これらは本研究の主目的ではなかったが、音楽と感情の関連にさらなる洞察を与える可能性があり、今後の重要な課題である。

音楽の中に社会的感情が知覚されるという発見は、人々が音楽に関与しようとする強い動機づけを説明する一助となりうる。さらに、社会的感情と音楽構造特徴の間に見出された関連は、音楽作曲、映画音楽、ミュージカル・シアターに含意を持つ。音楽に支配性と親和性が知覚されるという証拠は、どのようなメカニズムがこの効果に関わっているのか、また、これらの社会的感情が時間的に展開する音楽の中でどのように伝えられるのか、という問いを提起する。時系列分析を用いれば、支配性と親和性の動的性質を調べることができ、音楽の社会的含意が時間の展開とともに強まったり弱まったりすることが明らかになるかもしれない。

結論として、本研究は、音楽における社会的感情研究の基礎を築くものであり、社会的ウェルビーイングや異文化理解にも含意を持つ。参加者は短い音楽抜粋の中に支配性と親和性という感情的含意を容易に知覚し、音楽が社会的感情を符号化しうることが示された。こうした知見は、音楽の社会的機能を強調する理論的議論と整合的である^{2,11,38,56,58}。支配性判断は音楽属性によって強く予測されたが、親和性判断と音楽属性の関連は弱かった。また、快さ知覚の形成における音色的質の重要な役割も強調された。総じて本研究は、社会的感情がどのように音楽の中に知覚されるかについて、理論的理解を拡張する新たな証拠を提供している。

方法

参加者

参加者はクラウドソーシング・プラットフォーム Amazon Mechanical Turk（MTurk）から募集し、1563 名の応答を記録した。参加者は米国在住の英語話者で、18 歳以上であった。すべての参加者は、調査目的の説明を受けた後に同意を与えた。

サンプリング手続き

データ収集は 2021 年 7 月に行われた。参加者は 0.30 米ドルの報酬で調査を完了した。データ品質向上のため、MTurk ワーカーには、米国在住であること、過去に最低 50 件の MTurk タスクを完了していること、過去の MTurk 承認率が 90% 以上であることを事前条件として課した。

材料と尺度

刺激集合

既存データベース¹ から収集した 750 個の 5 秒間の器楽音楽抜粋（話し声や歌詞を含まない）を刺激として用いた。音楽コーパスは 16 ジャンル（音楽メタデータ）から成っていた。Alternative（n = 38）、Ambient（n = 95）、Classical（n = 94）、Country（n = 21）、EDM（n = 82）、Electronic（n = 81）、Folk（n = 24）、Heavy Metal（n = 37）、Hip-hop（n = 15）、Jazz（n = 31）、Latin（n = 7）、Pop（n = 64）、Rock（n = 82）、R&B（n = 24）、Reggae（n = 3）、World Music（n = 52）である。なお「World Music」には、非西洋音楽だけでなく、スコットランド高地の伝統音楽のような非主流の西洋音楽も含まれていた。

参加者に提示する刺激サブセットのランダム化

750 の音楽抜粋から、各 15 曲を含む 50 個の調査用サブセットを生成した。各参加者は Qualtrics 上で 15 曲からなるサブセットのいずれか 1 つにランダムに割り当てられ、そのサブセット内のすべての抜粋に応答することで報酬対象となった。ランダム化には 2 つの制約を課した。第一に、データ収集の初めからサブセット間で均等に配分することを目指し、各サブセットに少なくとも 1 名の参加者が割り当てられ、その応答が送信されるまで、同じサブセットに 2 人目を割り当てないようにした。この手続きを、すべての参加者が割り当てられ応答が回収されるまで繰り返した。第二に、どのサブセットにおいても、ひとつのジャンルが 3 回を超えて現れないようにし、参加者が自分のサブセット内で多様なジャンルを聴くことを保証した。

尺度

音響尺度

MIRtoolbox. 音響分析は、music information retrieval（MIR）toolbox⁴⁷ を用いて行った（図 2）。

図2 MIRtoolboxの音響特徴抽出計算手法 — **図2.** 音響特徴抽出に用いた MIRtoolbox の計算手法（Lartillot et al., 2008）。

MIR root mean square energy（RMSE）. 音声サンプルの全体エネルギーとしての振幅（ラウドネス）の尺度であり、一定時間区間における平均二乗振幅の平方根として推定した⁴⁷。値域は 0 から 1 であり、高い値ほど、音響サンプル内の信号がより大きいことを示す。

MIR brightness. Brightness は、ある周波数以上に存在する音響サンプル中のエネルギーを測る尺度である^47,51。値域は 0 から 1 であり、高い値ほどサンプル中の高周波エネルギーが多いことを示す。

Roughness. Roughness は全体的な感覚的不協和の尺度であり、周波数がわずかにずれた複数の音が同時に聞こえたときに経験される「うなり」の現象に対応する⁴⁷。感覚的不協和は、音響サンプルの周波数スペクトルにおけるすべてのピーク対の平均を取ることで推定した。値域は 3 から 1390 であり、高い値ほど感覚的不協和が大きく、その結果サンプル内の音がより harsh であることを示す。

Rolloff. 音響サンプル中のどれだけのエネルギーが、あるエネルギー閾値より下に存在するかを測定する尺度である⁴⁷。MIRtoolbox では 0.85 の割合カットオフを用いる⁴⁹。Rolloff 値が高いほど、より多くのエネルギーが閾値以下に集中していることを示す。

MIR zerocross. Zero-crossing rate は、音響サンプルの雑音性の程度を測る⁴⁹。信号が X 軸（振幅 0）を横切る回数を数えることで推定した^47,50。高い値は、より高い zero-crossing rate、すなわちよりノイジーな音響サンプルを示す。

MIR mode. 音響サンプルが長調か短調かという modality の尺度である⁴⁷。値が 1 に近いほど長調である可能性が高く、−1 は短調を示唆する。0 に近い値は、modality が曖昧であることを示す。

MIR spectral centroid. 音響サンプルのスペクトル分布重心の尺度である⁴⁷。Spectral centroid は brightness と関連しており、値が高いほど brightness が低いことを示す（たとえばオーボエの spectral centroid はフレンチホルンより高い）⁵¹。

MIR pitch. 自己相関を用いて音響サンプル内の全ピーク対の平均周波数を推定することで求めた平均音高の尺度である^47,52。高い値ほど、より高い音の存在が大きいことを示す。

MIR pulse clarity. Pulse clarity は、ある音楽において聴取者が基底拍または拍節的脈動をどれだけ容易に識別できるかを表す音楽的尺度である⁴⁷。値域は 0 から 1 であり、高い値ほど基底拍や拍節的脈動が容易に聞き取れることを示す。

MIR event density. Event density は、音響サンプル内で生じるイベント（ピーク）の数を測り、1 秒あたりの平均イベント頻度を近似する^47,52。高い値は、各音楽瞬間における音符数の増加を示す。

MIR spread, skewness, kurtosis, flatness, entropy（スペクトル特性）. これら 5 つの尺度は、いずれも音響サンプルのスペクトル拡散と関係する。MIR spread はスペクトル分布の標準偏差である。MIR flatness はデータの平坦性を計算し、スペクトル分布が滑らかか尖っているかを示す。MIR entropy はスペクトルの Shannon entropy に対応し⁵³、高い値ほど不確実性やピーキーさが大きいことを示す。

応答尺度

円環モデルでは感情を覚醒と感情価という次元で分類するが¹⁷、本研究では覚醒をさらにエネルギー覚醒（EA）と緊張覚醒（TA）に分けた^12,54。また、支配性と親和性という 2 つの社会的感情も含めた²⁸。したがって本研究は、EA、TA、感情価という 3 つの感情次元と、支配性・親和性という 2 つの社会的感情を検討した。

参加者は、音楽の情動的性質を評定した。各双極尺度は 1 から 7 の範囲をとり、5 以上は高い感情水準、3 以下は低い感情水準を示した。エネルギー覚醒は tired から energetic、緊張覚醒は relaxed から tense、感情価は unpleasant から pleasant、支配性は submissive から dominant、親和性は antisocial から highly social へと連続していた。4 はすべての尺度で中立選択肢だったため、各次元（例: 親和性、支配性、感情価）の平均評定が中立値から有意に異なるかを評価できた。

Modified Self-Assessment Manikin（SAM）. SAM は、各次元の異なる水準を模式的マネキン図で示すことで、快・覚醒・支配性を測定する尺度であり、絵文字に近い視覚表現を用いる⁵⁵。本研究ではこの方略を採用し、支配性と親和性の社会的意味を強調しながら、それらの次元を説明し測定した。支配性と親和性は、それぞれ 5 つの図を含む 2 本の尺度として概念化され、各図は各次元の 7 件法反応尺度を表した。支配性は −3（大きく開いた空間にいる小さく脆弱な人物）から 3（周囲空間を支配する大きな人物）まで、親和性は −3（集団から孤立した人物）から 3（集団の中央にいる同じ人物）までの図で示した。

Tempo. Tempo に関する 7 件法評定（7 = fast）も含め、参加者が音楽抜粋をどれほど速く知覚したかを測定した。この尺度は、サンプルが非常に短いため、MIRtoolbox によるテンポ抽出結果を裏づけるために導入した。

手続き

調査は MTurk 上で公開され、参加者は Qualtrics 調査へリダイレクトされた。調査開始前に参加者は研究概要を読み、インフォームド・コンセントを与えた。調査内の 15 音声サンプルすべてに応答した場合にのみ報酬が支払われることも説明された。本研究は Macquarie University Human Research Ethics Committee（HREC）の承認を受けており、すべての方法は同委員会の倫理指針・規程、および Scientific Reports の出版方針に従って実施された。

参加者には、本研究が調べているのは、音楽によって「知覚される」感情であり、音楽によって「誘発される」感情ではないことを念押しした。この区別は、音楽が悲しみのような感情含意を持ちうる点で重要である。さらに、各双極尺度について、左端と右端の応答が当該次元の強い知覚を表すこと（例: unpleasant、pleasant）を説明した。その後、親和性と支配性をどのように判断するかについて説明した。参加者には、音楽が映画中の人物に伴う映画音楽であると想像し、その人物の性格について何を示唆するかを判断するよう求めた。親和性については、その音楽が向社会的な人物を示唆するか、反社会的な人物を示唆するかを判断させた。支配性については、その音楽が支配的な人物を示唆するか、従属的な人物を示唆するかを判断させた。Modified SAM も併せて提示し、親和性と支配性という概念の理解を助けた。各刺激は 2 回まで聴けると説明し、15 項目の調査を完了するために 1 時間の制限時間を設けた。

各音響サンプルを聴いた後、参加者は 6 つの評定を行った。すなわち、(1) その音響サンプルがどれほど tired か energetic か、(2) どれほど relaxed か tense か、(3) どれほど pleasant か unpleasant か、(4) どれほど submissive か dominant か、(5) どれほど antisocial か social か、(6) どれほど slow か fast か、である。参加者は、これら 6 つの尺度すべてに回答しなければ次ページへ進めなかった。この手続きは 15 個の音楽刺激すべてについて繰り返された。

データスクリーニング

本研究には 750 の音楽抜粋が含まれ、各抜粋には 6 つの応答尺度が対応していた。ただし 1 つの音楽抜粋は mean pitch 値を計算できなかったため除外した。したがって、統計分析には 749 の音楽抜粋を含めた。

1563 名の参加者応答が記録された。参加者は、同意しなかった場合（n = 3）、reCAPTCHA スコアにもとづいて bot と判断された場合（n = 15）、説明を読んでいないと判断された場合（n = 11）、調査に最後まで回答しなかった場合（n = 7）、あるいは 1 つの数字だけで応答した場合（n = 14）に除外した。これら 50 名を除外した後、以降の統計分析には 1513 名が残った。

参加者除外後、サブセットへのランダム割付の結果、各サブセットには 27〜32 名が配分された。したがって、各音楽抜粋に付随する各応答尺度には、最少 27 回、最多 32 回の回答があった。749 の音楽抜粋への応答は異なる参加者集合に分散していたため、統計分析ではランダム変数として参加者ではなく音楽抜粋を扱った。言い換えれば、参加者の応答から、各音楽抜粋ごとに EA、TA、感情価、支配性、親和性、tempo の平均評定尺度値を生成した。これにより、各抜粋は音楽特徴（MIRtoolbox により取得）と、EA、TA、感情価、支配性、親和性の知覚評定値の両方を持つことになり、後続の統計分析が可能になった。

データ可用性

データは W.F.T. または K.N.O. から入手可能であり、Macquarie University および Bond University に保管されている。

参考文献

Cowen, A. S., Fang, X., Sauter, D., & Keltner, D. (2020). 音楽は私たちに何を感じさせるのか: 文化を超えて音楽に伴う主観経験を少なくとも13次元が組織する. Proceedings of the National Academy of Sciences, 117(4), 1924–1934.
Juslin, P. N. (2019). Musical Emotions Explained: Unlocking the Secrets of Musical Affect. Oxford University Press.
Juslin, P. N., & Laukka, P. (2004). 音楽感情の表出・知覚・誘発: 日常聴取に関するレビューと質問紙研究. Journal of New Music Research, 33(3), 217–238.
Day, R. A., & Thompson, W. F. (2019). 音楽への応答としての感情経験とイメージ経験の生起時点の測定. Psychomusicology: Music, Mind, and Brain, 29(2–3), 75–89.
Gabrielsson, A., & Juslin, P. N. (2003). 音楽における情動表出. In Davidson, R. J., Scherer, K. R., & Goldsmith, H. H. (Eds.), Handbook of Affective Sciences (pp. 503–534). Oxford University Press.
Juslin, P. N. (2013). 音楽は何を表現するのか: 基本感情を超えて. Frontiers in Psychology, 4, 1–14.
Sznycer, D., Sell, A., & Lieberman, D. (2021). 社会的感情の形態と機能. Current Directions in Psychological Science, 30(4), 292–299.
Tangney, J. P., Stuewig, J., & Mashek, D. J. (2007). 道徳的感情と道徳的行動. Annual Review of Psychology, 58, 345–372.
Camacho-Morles, J., et al. (2021). 活動達成感情と学業成績: メタ分析. Educational Psychology Review, 1–45.
Vogl, E., Pekrun, R., & Loderer, K. (2021). 認識的感情とメタ認知的感覚. In Moraitou, D., & Metallidou, P. (Eds.), Trends and Prospects in Metacognition Research Across the Life Span: A Tribute to Anastasia Efklides (pp. 41–58). Springer Nature Switzerland AG.
Thompson, W. F., Bullot, N. J., & Margulis, L. H. (2023). 音楽鑑賞の心理学的基盤: 構造、自己、音源. Psychological Review, 130(1), 260–284.
Eerola, T., & Vuoskoski, J. K. (2011). 音楽における離散感情モデルと次元感情モデルの比較. Psychology of Music, 39(1), 18–49.
Yang, Y. H., & Chen, H. H. (2012). 音楽感情認識の機械的手法: レビュー. ACM Transactions on Intelligent Systems and Technology, 3(3).
Olsen, K. N., Terry, J., & Thompson, W. F. (2023). 攻撃的主題を持つヘヴィメタル音楽への接触の心理社会的リスクと利益: 現在の理論と証拠. Current Psychology, 42, 21133–21150.
Thompson, W. F., Geeves, A. M., & Olsen, K. N. (2019). 暴力的音楽を誰が、なぜ楽しんで聴くのか. Psychology of Popular Media Culture, 8(3), 218–232.
Cohrdes, C., Wrzus, C., Wald-Fuhrmann, M., & Riediger, M. (2018). 感情の響き: 音楽における感情価と覚醒の知覚に関する年齢差と、音楽特徴および瞬間気分との関係. Musicae Scientiae, 24(1), 21–43.
Russell, J. A. (1980). 感情の円環モデル. Journal of Personality and Social Psychology, 39(6), 1161–1178.
Russell, J. A., & Barrett, L. F. (1999). コア・アフェクト、典型的情動エピソード、そして「感情」と呼ばれるその他のもの: 象を解剖する. Journal of Personality and Social Psychology, 76(5), 805–819.
Ilie, G., & Thompson, W. F. (2006). 音楽と音声における三つの感情次元の音響手がかりの比較. Music Perception, 23, 319–329.
Thayer, R. E. (1989). The Biopsychology of Mood and Arousal. Oxford University Press.
Juslin, P. N., & Lindström, E. (2010). 音楽における感情表現: 作曲特徴および演奏特徴に対する聴取者判断のモデリング. Music Analysis, 29(1–3), 334–364.
Carr, N. R., Olsen, K. N., & Thompson, W. F. (2023). 音楽におけるアーティキュレーションの知覚的・情動的帰結. Music Perception, 40, 202–219.
Eerola, T., Friberg, A., & Bresin, R. (2013). 音楽における感情表現: 主要音楽手がかりの寄与、線形性、加法性. Frontiers in Psychology, 4, 1–12.
Panda, R., Rocha, B., & Paiva, R. P. (2015). 標準的音響特徴と旋律音響特徴を用いた音楽感情認識. Applied Artificial Intelligence, 29(4), 313–334.
Bresin, R., & Friberg, A. (2011). 音楽における感情レンダリング: 七つの音楽変数の範囲と特徴値. Cortex, 47(9), 1068–1081.
Hareli, S., David, S., & Hess, U. (2016). 社会的支配性と親和性の知覚における感情遷移の役割. Cognition and Emotion, 30(7), 1260–1270.
Hess, U., Blairy, S., & Kleck, R. E. (2000). 表情強度、性別、民族性が支配性と親和性判断に与える影響. Journal of Nonverbal Behavior, 24, 265–283.
Mobbs, A. E. D. (2020). パーソナリティ、感情、行動のアトラス. PLoS ONE, 15(1), 1–25.
van Kleef, G. A., & Côté, S. (2022). 感情の社会的効果. Annual Review of Psychology, 73, 629–658.
Quirin, M., et al. (2013). 社会的動機づけの神経相関: パワー対親和の fMRI 研究. International Journal of Psychophysiology, 88(3), 289–295.
Mehrabian, A. (1996). 快・覚醒・支配: 気質の個人差を記述し測定する一般枠組み. Current Psychology, 14(4), 261–292.
Mehrabian, A., & Russell, J. A. (1977). 感情の三因子理論を支持する証拠. Journal of Research in Personality, 11(3), 273–294.
Russell, J. A. (1978). 感情次元に関する収束的妥当性の証拠. Journal of Personality and Social Psychology, 36(10), 1152–1168.
Brinker, B., Den, Dinther, R. van, & Skowronek, J. (2012). 表出された音楽ムード分類と感情価・覚醒評定の比較. EURASIP Journal on Audio, Speech, and Music Processing, 24, 1–14.
Gingras, B., Marin, M. M., & Fitch, W. T. (2014). 強度を超えて: スペクトル特徴は音楽によって誘発される主観的覚醒を効果的に予測する. Quarterly Journal of Experimental Psychology, 67(7), 1428–1446.
Grekow, J. (2018). 音楽作品における覚醒と感情価の検出・追跡に特化した音響特徴. Journal of Information and Telecommunication, 2(3), 322–333.
Thompson, W. F., Schellenberg, E. G., & Husain, G. (2001). 覚醒、気分、そしてモーツァルト効果. Psychological Science, 12(3), 248–251.
Aucouturier, J. J., & Canonne, C. (2017). 音楽における友と敵: 即興的相互作用における親和と統制の社会的認知. Cognition, 161, 94–108.
Schimmack, U., & Grob, A. (2000). コア・アフェクト次元モデルの定量比較: 構造方程式モデリングによる検討. European Journal of Personality, 14(4), 325–345.
Tan, K. R., Villarino, M. L., & Maderazo, C. (2019). Russell の二次元感情価・覚醒空間を用いた音響・歌詞データからの自動音楽ムード認識. IOP Conference Series: Materials Science and Engineering, 482(1), 1–6.
Yang, X., Dong, Y., & Li, J. (2018). データ特徴にもとづく音楽感情認識法のレビュー. Multimedia Systems, 24(4), 365–389.
Juslin, P. N., & Västfjäll, D. (2008). 音楽への情動反応: 基底メカニズムを考慮する必要性. Behavioral and Brain Sciences, 31(5), 559–575.
Husain, G., Thompson, W. F., & Schellenberg, E. G. (2002). 音楽のテンポとモードが覚醒、気分、空間能力に及ぼす効果. Music Perception, 20(2), 151–171.
Lartillot, O., Eerola, T., Toiviainen, P., & Fornari, J. (2008). パルス明瞭度の多特徴モデリング: 設計、妥当化、最適化. In Bello, J. P., Chew, E., & Turnbull, D. (Eds.), Proceedings of the ISMIR 2008 International Conference on Music Information Retrieval (pp. 521–526). International Society for Music Information Retrieval.
Gabrielsson, A. (2002). 知覚された感情と感じられた感情: 同じであり異なるもの. Musicae Scientiae, 5, 123–147.
Vieillard, S., et al. (2008). 感情研究のための幸福・悲しみ・恐怖・平穏の音楽抜粋. Cognition and Emotion, 22(4), 720–752.
Lartillot, O., Toiviainen, P., & Eerola, T. (2008). 音楽情報検索のための MATLAB ツールボックス. In Preisach, C., Burkhardt, H., Schmidt-Thieme, L., & Decker, R. (Eds.), Studies in Classification, Data Analysis, and Knowledge Organization (pp. 261–268). Springer-Berlin Heidelberg.
Juslin, P. N. (2000). 音楽演奏における感情伝達の手がかり利用. Journal of Experimental Psychology: Human Perception and Performance, 26(6), 1797–1813.
Tzanetakis, G., & Cook, P. (2002). 幾何学的方法を用いた音響信号の音楽ジャンル分類. IEEE Transactions on Speech and Audio Processing, 10(5), 293–302.
Banchhor, S. K., & Khan, A. (2012). ゼロ交差率と短時間エネルギーを用いた楽器認識. International Journal of Applied Information Systems, 1(3), 16–19.
McAdams, S., & Giordano, B. L. (2015). 音楽音色の知覚. In Hallam, S., Cross, I., & Thaut, M. H. (Eds.), The Oxford Handbook of Music Psychology (2nd ed., pp. 113–124). Oxford University Press.
Eerola, T., Lartillot, O., & Toiviainen, P. (2009). 多変量回帰モデルを用いた音響からの多次元感情評定予測. In Hirata, K., Tzanetakis, G., & Yoshii, K. (Eds.), Proceedings of the 10th International Society for Music Information Retrieval Conference (pp. 621–626). International Society for Music Information Retrieval.
Shannon, C. E. (1948). 通信の数学的理論. Bell System Technical Journal, 27, 379–423.
Schimmack, U., & Reisenzein, R. (2002). 活性の経験: energetic arousal と tense arousal は感情価と活性の混合ではない. Emotion, 2(4), 412–417.
Bradley, M. M., & Lang, P. J. (1994). 感情の測定: Self-Assessment Manikin と semantic differential. Journal of Behavior Therapy and Experimental Psychiatry, 25(1), 49–59.
Schäfer, K., & Eerola, T. (2020). 音楽聴取と他メディアへの関与はいかに帰属感を与えるか: 社会的代替に関する探索的研究. Psychology of Music, 48(2), 232–251.
Paquette, S., Peretz, I., & Belin, P. (2013). Musical emotional bursts: 聴覚情動処理を調べるための妥当化済み音楽感情バースト集合. Frontiers in Psychology, 4, 509.
Savage, P. E., et al. (2021). 社会的絆のための共進化システムとしての音楽. Behavioral and Brain Sciences, 44(e59), 1–22.
Treider, J. M., Kunst, J. R., & Vuoskoski, J. K. (2023). 音楽パラメータと主観的音楽評定が文化知覚に与える影響. Scientific Reports, 13(1), 20682.
Quinto, L., Thompson, W. F., & Taylor, A. (2013). 音楽における感情伝達に対する作曲構造と演奏表現の寄与. Psychology of Music, 42(4), 492–512.

著者貢献

E.X.P.、K.N.O.、A.E.D.M.、W.F.T. は、研究の構想、設計、データ分析、解釈に寄与した。E.X.P. は原稿初稿を執筆した。K.N.O.、A.E.D.M.、W.F.T. は原稿に対して提案と修正を行った。本研究は、Australian Research Council から W.F.T. に授与された助成金 DP210101247 により資金提供された。

宣言

競合的利益

著者らは、競合する利益が存在しないことを宣言する。

追加情報

Supplementary Information. オンライン版には補足資料が含まれており、https://doi.org/10.1038/s41598-024-78156-1 で利用できる。

Correspondence and requests for materials. 資料請求および連絡先は W.F.T. 宛である。

Reprints and permissions. リプリントと許諾に関する情報は www.nature.com/reprints で入手できる。

Publisher’s note. Springer Nature は、掲載地図および所属機関表記における管轄権主張について中立的立場を保持する。

Open Access

本論文は Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License のもとで提供される。これは、著者と出典への適切なクレジット表示、ライセンスへのリンクの提示、改変の有無の明示を条件として、非営利目的での使用、共有、配布、複製を認めるものである。ただし、このライセンスのもとでは、本論文またはその一部から派生した改変物を共有することはできない。論文中の画像その他の第三者素材も、別記がない限り同ライセンスに含まれる。もし該当素材がライセンスに含まれず、利用予定が法定利用範囲を超える場合には、著作権者から直接許可を得る必要がある。ライセンス本文は http://creativecommons.org/licenses/by-nc-nd/4.0/ で閲覧できる。