2020年2月23日日曜日

MIDIファイルを入力とした分析:和音の出現頻度から見たマーラー作品(2021.6.17更新)

MIDIファイルを入力とした分析の一環として、和音(コード)の出現頻度に基づくマーラーの作品の他の作品との比較を試みたので、その結果を以下に報告します。分析の単位は楽章毎(単一楽章の場合には曲毎)で、各拍の和音(コード)をラベリングした結果(「MIDIファイルを入力とした分析の準備:調性推定と和音のラべリング」https://gustav-mahler-yojibee.blogspot.com/2020/01/midi2020128.html参照)に基づき、単音を含む18種類のコードの出現頻度をとって対象の楽章(ないし曲)の全拍のうち占める割合を計算したものを分析対象としました。

(2021.6.17追記:集計プログラムの制約で、対象作品のMIDIデータの各ファイルに含まれる最初の1591拍分のみが分析対象となっていることがわかりました。各ファイルは概ね交響曲作品の楽章単位であることから、楽章の長さに応じて、全てが対象となっている場合もあれば、前半の1591泊目までが対象となっている場合もあることになります。この点についての記載が漏れていたことにつき、お詫びして追記します。なお、この制約をなくした分析を、今後実施の予定です。仮に両者に違いが確認できるのであれば、それ自体、音楽作品の時系列の構造の特性が反映したものである可能性が考えられます。)

分析やグラフの作成はR言語を用いて行い、階層・非階層のクラスタ分析、主成分分析、因子分析を行いました。分析の入力データと結果のデータ・グラフについては、以下からダウンロードできます。(和音出現特徴分析.zipという1ファイルにアーカイブされています。)

https://drive.google.com/file/d/1fbLw8kq0R8e5psjYcOtQoUXwFVrTxEDD/view?usp=sharing

以下では、分析の概要と上記のアーカイブファイルに含まれる各ファイルとの対応づけを記述します。

このような和音の出現頻度に関する量的分析は音楽情報処理分野ではありふれたものであると思います。このブログで以前言及したものでは、Tonal Theory for the Digital Age, Computing inMusicology 15 (2007-08)には、Eva Ferkova et al., Chordal Evaluation in MIDI-Based Harmonic Analysis: Mozart, Schubert, and Brahms があり、その中で報告された分析の一部として、和音のラベリングと頻度の分析が含まれますが、マーラーの作品について同様の分析が行われたことがあるかどうかは寡聞にして知りません。もしご存じの方がいらっしゃればご教示頂ければ幸いです。

いずれにせよ、時系列に添ったプロセスである音楽に対して、このように静的かつ巨視的な情報に基づく量的・統計的分析が語ることがごく限られていることは言うまでもなく明らかなことと思われます。また、以下の結果は分析の手始めに過ぎず、この結果に基づいて更に分析を行っていく必要があり、実際にその後若干の追加の実験も行っていますが、これまで多くの優れた分析者が直観的に把握してきたマーラーの作品の特性のうちのごく僅かな部分であっても、データに基づく検証が行われることには一定の意味があるものと考え、ささやかなものではありますが、まずは最初の分析結果を公開する次第です。(2020.2.23記)

1.対象データ
・マーラーの作品:重心計算や調性推定で用いた全交響曲のMIDIデータ(楽章毎)
  合計50ファイル⇒カテゴリ2

・比較対照用の作品:以下の作品のMIDIデータ(楽章毎。合計71ファイル)
 便宜的に4つのカテゴリに分類し、クラスタ分析結果との照合を行った。

 カテゴリ1:近現代の作品
  アイヴズ 答えのない質問
  シベリウス 交響曲第2番、7番、タピオラ
  ヴェーベルン パッサカリア
  ショスタコーヴィチ 交響曲第10番
  スクリャービン 交響曲第3番
  シュニトケ 交響曲第5番=合奏協奏曲第4番第1楽章
 カテゴリ3:ロマン派
  ブラームス 交響曲第2番、3番、4番
  ブルックナー 交響曲第5番、7番、9番
  フランク 交響曲
  スメタナ わが祖国
 カテゴリ4:古典派
  ハイドン 交響曲第104番
  モーツァルト 交響曲第38番、39番、40番、41番 
 カテゴリ5:前期ロマン派
  シューマン 交響曲第3番

2.分析に用いた特徴量:上記MIDIデータの各拍毎の以下の和音(コード)の出現割合
 単音、重音:完全五度、長二度、短三度、長三度、短二度、増四度
 短三和音、長三和音、属七和音、属九和音、付加六、イタリアの増六
 減三和音、増三和音、長七和音、トリスタン和音、フランスの増六

3.分析手法
 分析はすべてR言語(version.3.6.2, 2019-12-12版)を用いて行った。
 分析履歴をアーカイブに含めた。(hist.txt)
 A.主成分分析:prcompを使用。標準化を行う(scale=TRUE)。
  説明率80%⇒第9主成分までについて負荷と主成分得点を計算。
  分析結果はbiplotでグラフ化。負荷と主成分得点はbarplotでグラフ化。
 B.因子分析:factanalを使用。
  因子数の決定は相関行列の固有値を参照:固有値が概ね1以上⇒5因子と決定
  rotationはvarimax(直交回転), promax(斜交回転)の両方を試行。
  分析結果はbilplotでグラフ化。負荷と因子得点はbarplotでグラフ化。
 C.階層クラスタリング:距離はユークリッド距離を使用し、結果をhclustに与えた。
  クラスタリング手法としては以下の3種を試行し、結果はデンドログラムでグラフ化。
   complete(完全連結法)
   average(群平均化法)
   wardD2(最小分散法) 
  クラスタの安定度を確認するために、ユークリッド距離・完全連結法での
  上記の2クラスタのJaccard係数の平均値をfpcパッケージのclusterbootを
  用いて求めた。(hist.txt)
  更にマハラノビス距離を用いて最小分散法によるクラスタリングを行った。
 D.非階層クラスタリング:kmeansを使用。
  クラスタ数はギャップ統計を参考にした。
  kmax=10、最大イテレーション回数=200でclusGapを使用。
  結果をbarplotでグラフ化。
  ⇒クラスタ数2で試行した結果をclusplotでグラフ化。
 
4.分析結果の概要
 A.主成分分析
第9因子までのCumulative Proportionは0.81455(詳細はhist.txt中のsummary参照)
主成分得点のうち、マーラー作品を特徴づけるものと考えられるのは第2主成分であり、上記グラフでは、中心から下側にマーラーの作品が偏って分布する様子が読み取れる。

以下に第2主成分得点のbarplotを示す(赤がクラスタ2=マーラーの作品。クラスタ1(近現代)=黒、クラスタ3(ロマン派)=緑、クラスタ4(古典派)=青、クラスタ5(前期ロマン派)=水色)。緑色でマーラーと同じ傾向なのはブルックナーの第5交響曲と第9交響曲。近現代では、ショスタコーヴィチとシュニトケが同傾向で、楽章によってはマーラーより強く傾向が出ている。
なお、ここからマーラー作品の中で第2主成分得点について例外的という意味で「マーラー的」でない、むしろ古典派的な楽章を取り出すことができるだろう。



第2主成分の負荷は以下の通り。主三和音・属七和音の比率が高く、長三度を除く重音の比率が低い成分だが、マーラーの作品は得点がマイナスなので、主三和音・属七和音の比率が低く・長三度を除く重音比率が高い傾向にあると言えそう。

B.因子分析
まず、相関行列の固有値をとると以下のようになる。固有値が概ね1以上であることやグラフの傾きから、因子数を5とする。
因子分析の結果でも因子数=5で十分との判定が得られた。rotation=varimaxの結果を以下に示す。中心から右下側にマーラーの作品が固まっている様子が読み取れる。なおpromaxでも大まかな傾向は同様(アーカイブ中には両方の結果が収められている)。
因子得点を確認すると、マーラーの作品を特徴づける因子は、以下に示す第2因子と思われる。

第2因子の負荷は以下の通りであり、特に属七和音比率高・付加六和音および長七和音比率低の因子だが、マーラーの作品は得点が低いため、属七和音比率が低く、付加六・長七和音比率が高い傾向があることを示していると考えられる。近現代で同傾向なのはスクリャービンの第3交響曲。

C.階層クラスタ分析
距離はユークリッド距離のみ。クラスタリング手法としてhclustでデフォルトのcompleteを使った結果は以下の通り。大きく古典派系と非古典派系に分かれ、マーラー作品の多くは後者に属することが読み取れる。

なお、クラスタの安定性が低そうなことが実験結果から窺えたため、fpcパッケージのclusterbootを用いてJaccard係数の平均値を求めた結果を履歴ファイルに収めている。マーラーの作品が含まれる上位のクラスタについては比較的安定しているという結果になっている。
更に距離をユークリッド距離からマハラノビス距離に変えてward法を用いた結果を参考までに以下に示す。
なお必ずしもこの結果に限定されないが、マーラーの作品の中、マーラー作品の多くが属するクラスタではない、別のクラスタに属する楽章を見てみると、主成分分析や因子分析における「非マーラー」的な楽章と概ね一致する傾向があることを確認できる。


D.非階層クラスタ分析
適当なクラスタ数を検討するためにclusGapを用いてGap統計をとったが、結果が安定しないため(アーカイブ中のhist.txt参照)、安定して同じ結果が得られる2クラスタの結果のみを示すことにした。k-means法は手法上ランダムネスが含まれるので、試行毎に解が変わりうるが、何度か試行した限りでは2クラスタの場合には同一の結果が得られるようである。他の手法の結果と照合して評価をする必要があるが、大まかな傾向―すなわちここでは、マーラーの作品の多くが非古典的なクラスタ(以下の結果では第2クラスタ)に分類される傾向にあること―は、主成分分析や因子分析、或いは階層クラスタ分析の結果によっても同様の傾向が得られているのであって、安定したものであると言えるだろう。

事前に用意した5つの区分(1:近現代、2:マーラー、3:ロマン派、4:古典派、5:前期ロマン派)と上記のクラスタリングの結果との照合結果は以下の通り。なお、個別の作品がどのクラスタに属するかについては、アーカイブ中のhist.txtを参照のこと。

  res
ans   1   2
  1    4  10
  2    6  44
  3  19  14
  4  18    1
  5    4    1


5.アーカイブファイルに含まれるファイルの説明
和音出現特徴分析.zipの中には以下のファイルが含まれます。

(1)入力データ
 cfreqA.csv:分析対象の和音(コード)の出現割合のファイル
 col_cfreqA.csv:対象作品のクラス分けを定義したファイル(色指定も兼ねる)
 (1:近現代、2:マーラー、3:ロマン派、4:古典派、5:前期ロマン派)
 class_cfreqA.csv:対象作品を作曲家別に分類したファイル
 corresp_cfreqA.csv:生の頻度情報ファイル。cfreqAに含まれないコードも含む

(2)主成分分析系
 prcomp.pdf:主成分分析結果のbiplotグラフ
 pr_score-[1-9].pdf:主成分得点のbarplotグラフ
 prcomp_PC[1-9].pdf:主成分負荷量のbarplotグラフ

(3)因子分析系
 (3-1)直交回転(varimax):因子数=5
  varicomp5.pdf:因子分析結果のbiplotグラフ
  vari_score-[1-5].pdf:因子得点のbarplotグラフ
  vari_load-[1-5].pdf:因子負荷量のbarplotグラフ
 (3-2)斜交回転(promax):因子数=5
  procomp5.pdf:因子分析結果のbiplotグラフ
  pro_score-[1-5].pdf:因子得点のbarplotグラフ
  pro_load-[1-5].pdf:因子負荷量のbarplotグラフ
 (3-3)相関行列の固有値
   eigen.pdf

(4)階層クラスタ分析系
 (4-1)ユークリッド距離を用いたクラスタリング結果
  hclust_complete.pdf:完全連結法による結果のデンドログラム
  hclust_average.pdf:群平均化法による結果のデンドログラム
  hclust_wardD2.pdf:Ward法(最小分散法)による結果のデンドログラム
 (4-2)マハラノビス距離を用いたクラスタリング結果
  hclust_hclust_Mahalanobis_ward.D2.pdf:Ward法による結果のデンドログラム
 (4-3)クラスタの安定度解析で用いた条件(解析結果はhist.txtに収録)
  hclust_complete_rect2.pdf:ユークリッド距離・完全連結法で2クラスタまでを評価

(5)非階層クラスタ分析系:
 (5-1)ギャップ統計
  clusGap.pdf
 (5-2)クラスタリング結果
  kmeans2.pdf:2クラスタでの分類結果のプロット
  kmeans2.csv:2クラスタでの分類結果
  kmeans.xls:2クラスタでの分類結果と対象作品のクラス分けの対照用

(6)分析履歴
  hist.txt:R言語を用いた分析履歴。各分析の数値的な結果を含む。

[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。
(2020.2.23公開, 24一部加筆修正, 25結果データを追加, 26非階層クラスタ分析の結果を差し替え)

0 件のコメント:

コメントを投稿