2021年7月7日水曜日

MIDIファイルを入力とした分析:和音の出現頻度から見たマーラー作品(その5:全拍対象・比較対照作品追加・傾向分析:2021.7.21更新)

 これまでMIDIファイルを入力とした分析の一環として、和音(コード)の出現頻度に基づくマーラーの交響曲作品50ファイル(楽章単位)の他の作品71ファイルとの比較を試みた結果を「MIDIファイルを入力とした分析:和音の出現頻度から見たマーラー作品」(https://gustav-mahler-yojibee.blogspot.com/2020/02/midi.html)として報告し、次いでその第2報として比較対象となる作品数を増やして、マーラーの作品50ファイルに対して、他の作曲家の作品200ファイルの合計250ファイルでの分析結果について「MIDIファイルを入力とした分析:和音の出現頻度から見たマーラー作品(その2:拡張版)」(https://gustav-mahler-yojibee.blogspot.com/2020/02/midi2.html)として報告しました。更に2つの報告を補完する分析として、各和音毎の出現頻度の傾向を、マーラーの交響曲と比較対象となる作品群との間で比較した、「MIDIファイルを入力とした分析:和音の出現頻度から見たマーラー作品(その3:補遺 )」(http://gustav-mahler-yojibee.blogspot.com/2020/03/midi3.html)を公開しました。

その後、集計プログラムの制約で、対象作品のMIDIデータの各ファイルに含まれる最初の1591拍分のみが分析対象となっていることが判明したため、そのことについて各ページで告知するとともに、ファイルに含まれる全ての拍を対象とした分析を今後実施予定の旨、告知しました。当初は公開済の3つの分析それぞれについて全拍を対象とした分析結果を改めて公開する方針で進めていましたが、実際に分析を進めると、大まかな傾向としては分析結果に著しい違いがあるわけではないことがわかってきたため、勿論、厳密な意味では、両者を比較対照できるような形で公開することには意味があるものの、ブログの記事として公開する情報としては稍々冗長との感じを持つようになりました、一方で、比較的手薄だったマーラーの同時代以降の作品のMIDIファイルが公開されており、利用可能であることがわかり、更に比較対照用のデータを増やした分析を行うことができるようになりました。

上記の経緯を踏まえ、この記事ではマーラーの全交響曲と今回更に追加された作品を含む比較対照群の合計300ファイルを対象として主成分分析・因子分析・クラスタ分析を実施した結果について示します。なお今回は、コメントは原則として行わず結果だけを示すことにします。

1.対象データ

  0.アイヴズ 答えのない質問
  1.シベリウス 交響曲第2番、7番、タピオラ、5番3楽章、6番4楽章、3番2楽章
  2.マーラー 交響曲第1~10番、大地の歌
  3.ブラームス 交響曲第1番、2番、3番、4番
  4.ブルックナー 交響曲第1番、4番、5番、7番、8番、9番
  5.ショスタコーヴィチ 交響曲第10番、1番第2楽章、7番第2楽章、9番第1,3,5楽章
  6.モーツァルト 交響曲第38番、39番、40番、41番 
  7.シューマン 交響曲第1番、3番
  8.スクリャービン 交響曲第3番
  9.スメタナ わが祖国
  10.フランク 交響曲
  11.ハイドン 交響曲第83、88、92、96、99~104番
  12.シュニトケ 交響曲第5番=合奏協奏曲第4番第1楽章
  13.ヴェーベルン パッサカリア
  14.バルトーク 管弦楽のための協奏曲
  15.ベートーヴェン 交響曲第3、4、5、6、7番
  16.ベルリオーズ 幻想交響曲
  17.ドヴォルザーク 交響曲第8、9番
  18.エルガー 交響曲第1、2番
  19.メンデルスゾーン 交響曲第3番
  20.ワーグナー パルジファル前奏曲
  21.ラフマニノフ 交響曲第2番
  22.シューベルト 交響曲第8、9番
  23.チャイコフスキー 交響曲第4、5、6番
  24.ペッテション 交響曲第6~16番、交響的断章、ヴァイオリン協奏曲第2番
  25.ストラヴィンスキー 詩篇交響曲
  26.ヴィエルヌ オルガン交響曲第1,2番
  27.シュトラウス アルプス交響曲、死と変容
  28.シェーンベルク 浄夜
  29.ラヴェル ダフニスとクロエ第2組曲
  30.マニャール ベレニス序曲
  31.グルック アウリスのイフゲニア序曲
  32.ホルスト 惑星
  33.ヤナーチェク シンフォニエッタ

2.分析に用いた特徴量:

  単音、重音:完全五度、長二度、短三度、長三度、短二度、増四度
  短三和音、長三和音、属七和音、属九和音、付加六、イタリアの増六
  減三和音、増三和音、長七和音、トリスタン和音、フランスの増六 
    減三+減七、減三+短七、増三+長七、短三+長七

3.分析手法

 分析はすべてR言語(version 4.1.0 (2021-05-18版)を用いて行った。
 分析履歴をアーカイブに含めた。(hist.txt)
 A.主成分分析:prcompを使用。標準化を行う(scale=TRUE)。
  説明率60%⇒第6主成分までについて負荷と主成分得点を計算。
  分析結果はggbiplotとbiplotでグラフ化。負荷と主成分得点はbarplotでグラフ化。
 B.因子分析:factanalを使用。
  因子数の決定は相関行列の固有値を参照:固有値が概ね1以上⇒6因子と決定
  rotationはvarimax(直交回転), promax(斜交回転)の両方を試行。
  分析結果はbilplotでグラフ化。負荷と因子得点はbarplotでグラフ化。
 C.非階層クラスタリング:kmeansを使用。
  クラスタ数はギャップ統計を参考にした。
  kmax=10、最大イテレーション回数=100でclusGapを使用。
  結果をbarplotでグラフ化。
  ⇒クラスタ数8と9で試行した結果をclusplotでグラフ化。

4.分析結果の概要

以下では分析結果の概要を示すことを目的とし、結果の一部のみを示す。詳細については後述のアーカイブファイル中の結果を参照。

A.主成分分析

 A-1-1.第1、第2主成分でプロット:マーラー(水色)・それ以外(赤)


A-1-2.第1、第2主成分でプロット:マーラー(緑)・古典派(赤)・ロマン派(紫)・近現代(水色)

なお、ここではマーラーと比較対象として用いた作品群の比較対照が目的であり、比較対象の作品群の内部構造の分析は目的としていないので、比較対照群の分類は恣意的なものであり、分類に付したラベルもまた便宜的なものである。
  • 古典派:モーツァルト、ハイドン、ベートーヴェン、グルック
  • ロマン派:シベリウス、ブラームス、ブルックナー、シューマン、スクリャービン、スメタナ、フランク、ベルリオーズ、ドヴォルザーク、エルガー、メンデルスゾーン、ワグナー、ラフマニノフ、シューベルト、チャイコフスキー、ヴィエルヌ、シュトラウス、マニャール
  • 近現代:アイヴズ、ショスタコーヴィチ、シュニトケ、ヴェーベルン、バルトーク、ペッテション、ストラヴィンスキー、シェーンベルク、ラヴェル、ホルスト、ヤナーチェク

A-1-3.第5、第6主成分でプロット:マーラー(緑)・古典派(赤)・ロマン派(紫)・近現代(水色)

A-1-4.第1、第2主成分でプロット:ファイル名を表示

A-2.第1主成分得点・負荷

なお得点のグラフの色と作曲家の対応は、左側から右側へ順番に以下の通りである。

 マーラー(赤)・アイヴズ(黒)・シベリウス(黒)・ブラームス(緑)・
 ブルックナー(白)・ショスタコーヴィチ(黒)・モーツァルト(青)・
 シューマン(水色)・スクリャービン(黒)・スメタナ(紫)・フランク(黄)・
 ハイドン(青)・シュニトケ(赤)・ヴェーベルン(白)・シベリウス(黒)・
 バルトーク(灰色)・ベートーヴェン(青)・ベルリオーズ(水色)・
 ブラームス(緑)・ブルックナー(白)・ドヴォルザーク(緑)・エルガー(紫)・
 ハイドン(青)・メンデルスゾーン(緑)・ワグナー(水色)・
 ラフマニノフ(黒)・シューベルト(青)・シューマン(水色)・シベリウス(黒)・
 ハイドン(青) ・チャイコフスキー(紫)・ペッテション(黄)・
 ストラヴィンスキー(灰色)・ヴィエルヌ(白)・ショスタコーヴィチ(黒)・
 シュトラウス(緑)・シェーンベルク(青)・ラヴェル(水色)・マニャール(紫)・
 グルック(黄)・ホルスト(灰色)・ヤナーチェク(黒)





B.因子分析(斜交回転のみ、直交回転は略)
B-1.第1因子・第2因子でプロット



B-2.第1因子得点・負荷量








C.非階層クラスタ分析
k-means法、クラスタ数=8での結果

      res
class  1  2   3  4   5  6  7   8
   0   1   0   0  0   0  0  0   0 アイヴズ
   1   0   0   0  1   2  0  3   2   シベリウス
   2   3   1   0  5 19  0  2 20 マーラ―
   3   5   0   6  0   1  0  4   0 ブラームス
   4   6   1   2  1   7  0  1   5 ブルックナー
   5   0   0   0  1   0  4  0   4 ショスタコーヴィチ
   6   1   6   6  0   0  0  1   1 モーツァルト
   7   0   0   6  0   1  0  2   0 シューマン
   8   0   0   0  0   3  0  0   0 スクリャービン
   9   2   0   2  0   1  0  1   0 スメタナ
   10  0   0   0  0   2  0  0  1 フランク
   11  2 23 10  0   0  3  0  2 ハイドン
   12  0   0   0  1   0  0  0  0 シュニトケ
   13  0   0   0  1   0  0  0  0 ヴェーベルン
   14  0   0   0  0   2  1  0  2 バルトーク
   15  3   8   3  0   0  1  3  0 ベートーヴェン
   16  0   0   0  0   2  1  0  2 ベルリオーズ
   17  2   0   1  0   0  0  5  0 ドヴォルザーク
   18  0   0   0  1   4  0  2  0 エルガー
   19  1   0   0  0   1  0  2  0 メンデルスゾーン
   20  0   0   0  0   0  0  1  0 ワグナー
   21  0   0   0  0   2  0  1  1 ラフマニノフ
   22  0   0   3  0   0  0  3  0 シューベルト
   23  0   0   0  2   5  3  2  0 チャイコフスキー
   24  0   0   0 11   0  0  0  2 ペッテション
   25  0   0   0  3   0  0  0  0 ストラヴィンスキー
   26  0   0   0  1   1  2  0  7 ヴィエルヌ
   27  0   0   0  1   1  0  0  0 シュトラウス
   28  0   0   0  1   0  0  0  0 シェーンベルク
   29  0   0   0  1   0  0  0  0 ラヴェル
   30  0   0   0  0   0  0  0  1 マニャール
   31  0   0   1  0   0  0  0  0 グルック
   32  0   0   0  4   2  0  0  1 ホルスト
   33  0   0   0  0   2  0  1  2 ヤナーチェク

5.アーカイブファイルに含まれるファイルの説明
の中には以下のファイルが含まれます。

(1)入力データ
 cfreqA.csv:分析対象の和音(コード)の出現割合
 col_cfreqA.csv:対象作品の得点に関するbarplotにおける色指定
 class_cfreqA.csv:対象作品の作曲家別分類ファイル
 biclass_cfreqA.csv:対象作品をマーラーとそれ以外に分類
   hiclass_cfreqA.csv:対象作品をマーラーとその他の古典派・ロマン派・近現代の作品群に分類
  corresp_cfreqA.csv:生の頻度情報

(2)主成分分析系
 gg_prcomp-class2.pdf:主成分分析結果(第1,第2成分・マーラーとそれ以外を区別)のggbiplotグラフ
 gg_prcomp.pdf:主成分分析結果(第1,第2成分・時代別)のggbiplotグラフ
 gg_prcomp-PC56.pdf:主成分分析結果(第5,第6成分・時代別)のggbiplotグラフ
 prcomp.pdf:主成分分析結果のbiplotグラフ
 pr_score-[1-6].pdf:主成分得点のbarplotグラフ
 prcomp_PC[1-6].pdf:主成分負荷量のbarplotグラフ

(3)因子分析系
 (3-1)直交回転(varimax):因子数=6
  varicomp.pdf:因子分析結果のbiplotグラフ
  vari_score-[1-6].pdf:因子得点のbarplotグラフ
  vari_load-[1-6].pdf:因子負荷量のbarplotグラフ
 (3-2)斜交回転(promax):因子数=6
  procomp.pdf:因子分析結果のbiplotグラフ
  pro_score-[1-6].pdf:因子得点のbarplotグラフ
  pro_load-[1-6].pdf:因子負荷量のbarplotグラフ
 (3-3)相関行列の固有値
   eigen.pdf

(4)非階層クラスタ分析系:
 (5-1)ギャップ統計
  clusGap8.pdf
  clusGap9.pdf
 (5-2)クラスタリング結果
  kmeans8.pdf:8クラスタでの分類結果のプロット
  kmeans8.csv:8クラスタでの分類結果
      kmeans9.pdf:9クラスタでの分類結果のプロット
  kmeans9.csv:9クラスタでの分類結果
  
(6)分析履歴
  hist.txt:R言語を用いた分析履歴。各分析の数値的な結果を含む。

[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。
(2021.7.7 マーラーの誕生日に公開、2021.7.21 分析に用いた特徴量の記載漏れを修正)

0 件のコメント:

コメントを投稿