1.分析の概要
1.1.分析対象の作品
従来の分析同様、マーラーの交響曲全曲(第1交響曲~第10交響曲および「大地の歌」)を対象とした。なお、第10交響曲はクックによる5楽章版を対象とした。
1.2.分析対象の特徴量と分析環境・手法
作品を構成する楽章・曲単位に作成されたMIDIファイル毎に、各拍において長三和音、短三和音の出現状況に注目して、以下の特徴量を集計した。出現頻度については、長三和音・短三和音の出現回数、長三和音⇔短三和音の交替頻度のいずれについても曲の長さ(拍数)の違いを吸収するために出現回数を総拍数で割って単位拍数あたりの割合(それぞれmaj, min, mod)とし、更に交替頻度については長短三和音の出現回数(maj+min)で割った割の合(以下のmod_frq)も計算した。また、曲頭において先に出現するのは長三和音・短三和音のどちらか(in)および曲尾において後に出現するのは長三和音・短三和音のどちらか(out)の判定も行った。従って特徴量は以下の6種類となる。
- 長三和音の出現頻度(maj):単位拍数あたりの割合
- 短三和音の出現頻度(min):単位拍数あたりの割合
- 長三和音⇔短三和音の交替頻度1(mod):単位拍数あたりの割合
- 長三和音⇔短三和音の交替頻度2(mod_frq):長短三和音の出現回数(maj+min)あたりの割合
- 曲頭において先に出現するのは長三和音(1)・短三和音(-1)のどちらか(in)
- 曲尾において後に出現するのは長三和音(1)・短三和音(-1)のどちらか(out)
これらの特徴量について、対象となる交響曲毎の平均値を計算して各交響曲の特徴ベクトルとし、これに加えてマーラーの交響曲全体の平均値、これまで分析対象としてきたマーラーの作品全体(全交響曲に若干の歌曲を加えたもの)の平均値、更に今回は現在手元にあるマーラーの作品のMIDI全体の平均値も計算して、以下の3つを交響曲単位の特徴ベクトルに加えて分析対象とした。
- gm:これまで分析対象としてきたマーラーの作品全体(全交響曲に若干の歌曲を加えたもの)の平均値
- gm_all:現在手元にあるマーラーの作品のMIDI全体の平均値
- gm_sym:マーラーの交響曲全体の平均値
比較対象のための対照群としては、本ブログでこれまでに公開してきた和音出現頻度に基づく分析で使用した以下の作曲家の作品のデータを利用した。実験群同様、対象となる各作曲家の作品全体の平均値を計算し、これを対照群の特徴ベクトルセットとした。
- ペルゴレージ(ファイル数:28, のべ拍数:8019)
- グルック(ファイル数:19, のべ拍数:4791)
- ハイドン(ファイル数:110, のべ拍数:123061)
- モーツァルト(ファイル数:957, のべ拍数:636619)
- シューマン(ファイル数:102, のべ拍数:133234)
- ブラームス(ファイル数:132, のべ拍数:188627)
- ブルックナー(ファイル数:70, のべ拍数:61947)
- フランク(ファイル数:62, のべ拍数:59554)
- シベリウス(ファイル数:17, のべ拍数:17769)
- スクリャービン(ファイル数:62, のべ拍数:18640)
- ラヴェル(ファイル数:55, のべ拍数:39135)
- ショスタコーヴィチ(ファイル数:71, のべ拍数:39229)
1.3.分析手法と分析環境
分析方法および分析環境についても従来の分析を引き継ぎ、R言語(version 4.1.0 (2021-05-18版)を用いて以下の分析を行い、履歴を保存した。
A.非階層クラスタリング:kmeansを使用。
- 結果のグラフ表示には、clusterライブラリのclusplotを使用。
B.階層クラスタリング:hclustを使用。
- complete法, average法, ward法の3種類を使用。
C.主成分分析:prcompを使用。
- 特徴ベクトルの要素間のスケールに違いがあるため、scale=T。
- 説明率90%を目安として負荷と主成分得点を計算。
- 結果のグラフ表示には、ggbiplotライブラリのggbiplotを使用。
- 負荷と主成分得点はbarplotでグラフ化。
1.4.アーカイブファイルの内容
アーカイブファイル長短交替_他の作曲家の作品との比較.zip中には以下のファイルが含まれる。
分析条件・履歴
- 入力ファイル:gm_control_sheet12.csv
- 色指定ファイル:gm_control_sheet12_col.csv
- ラベルファイル:gm_control_sheet12_label.csv
- 履歴:hist.txt
階層クラスタ分析
- hclust_complete.pdf:complete法でのクラスタリング結果のデンドログラム
- hclust_average.pdf:average法でのクラスタリング結果のデンドログラム
- hclust_ward.D2.pdf:ward法でのクラスタリング結果のデンドログラム
非階層クラスタ分析(kmeans法、クラスタ数=6)
- kmeans6.pdf:分類結果の主成分平面へのプロット
- kmeans6.csv:分類結果の出力
主成分分析
- prcomp_T.pdf:主成分分析(scale=T)の結果
- ggbiplot12.pdf:第1・第2主成分空間へのグループ表示つきプロット
- ggbiplot23.pdf:第2・第3主成分空間へのグループ表示つきプロット
- ggbiplot34.pdf:第3・第4主成分空間へのグループ表示つきプロット
- pr_score-1.pdf:第1主成分得点
- pr_score-2.pdf:第2主成分得点
- pr_score-3.pdf:第3主成分得点
- pr_score-4.pdf:第4主成分得点
- prcomp_PC1.pdf:第1主成分負荷
- prcomp_PC2.pdf:第2主成分負荷
- prcomp_PC3.pdf:第3主成分負荷
- prcomp_PC4.pdf:第4主成分負荷
2.分析結果
2.1.階層クラスタ分析
(a)complete法
(a)complete法
(b)average法
(c)ward法
2.2.非階層クラスタ分析(k-means法, クラスタ数=6)
1 2 3 4 5 6
baroque 0 0 1 0 0 0
classic 1 0 0 0 2 0
gm 1 0 2 0 0 0
gm_sym 1 1 1 4 2 2
modern 0 0 2 0 0 1
romantic1 4 0 0 0 0 0
romantic2 0 0 1 0 0 0
gm gm_all gm_sym erde sym1 sym2 sym3 sym4 sym5 sym6
3 1 3 6 4 4 1 3 5 2
sym7 sym8 sym9 sym10 wam jbp ab asc cf dsch
4 6 5 4 5 3 1 3 1 3
fjh jb js mr rsch chwg
5 1 3 6 1 1
2.3.主成分分析
scale=Tでのprcompのsummaryは以下の通り
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.5417 1.1941 1.0753 0.8232
Proportion of Variance 0.3962 0.2377 0.1927 0.1129
Cumulative Proportion 0.3962 0.6338 0.8265 0.9395
[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。
(2021.12.17公開)
0 件のコメント:
コメントを投稿