2023年9月3日日曜日

後期マーラーの「挑戦」?:MIDIファイルを入力とした分析:状態遷移パターンの多様性に注目した予備分析(2023.9.4更新)

1.はじめに

 これまで何回かに亘って、状態遷移の集計方法の検討を行い、検討内容に基づいた集計結果を公開してきました。状態遷移パターンについては今回初めて集計を行ったので、従来やってきた和音(といっても機能和声理論上のものではなく、寧ろピッチクラスセット上で定義される集合ですが)の出現頻度と異なって、土地勘のようなものが全くありません。そこで今後の分析のための予備作業として、集計した状態遷移パターンについて、個別のパターンに踏み込んだ分析を行う前に、記事MIDIファイルを入力とした分析の準備(3):状態遷移の集計手法の検討と集計結果の公開MIDIファイルを入力とした分析の準備(4):状態遷移の集計結果の公開(続き)およびMIDIファイルを入力とした分析の準備(6):状態遷移の集計結果の公開(補遺その2)において「和音・状態遷移パターン種別」として報告・公開しているデータを用いて状態遷移パターンの異なり数について確認してみたところ、マーラーの作品に関して興味深い特徴があるように思われたので、簡単な分析を行ってみました。以下でその内容を報告します。

2.本分析の背景

 「和音・状態遷移パターン種別」として公開しているデータにおいては、これまで集計・公開してきた複数の条件による状態遷移パターンの抽出結果について、遷移パターンの抽出対象となる和音の総数、和音の種類数(状態遷移パターンとしては深さ=0に相当)、深さ1~5までの状態遷移パターン数を集計しています。

 一般にパターン数は、対象となる和音の総数に相対的なものと考えられます。つまり短く小節数が少なく、拍数もまた少ない作品では、同じ複雑さであればパターン数は少なく、大規模になればパターン数が増加するものと考えられます。但しそれでは際限なく拍数を増やしていけばパターン数も比例して増加し続けるかと言えば、ここで対象としているタイプの音楽作品の場合にはそうではなく、同じパターンの繰り返しの割合が増えていくものと想定されます。一方で、反復繰り返しを多く含む作品の場合には、同じ拍数で出現するパターンの数はその程度に応じて少なくなるものと予想されます。このことは、分析の入力として使わせて頂いているMIDIの作り方に、ここで注目しているパターン数が影響を受けることもまた、意味しています。演奏においてもしばしばそうですが、特に古典派の作品の場合、ソナタ形式の楽章の提示部やメヌエットやスケルツォ楽章におけるDa Capoが典型的なように、リピート記号に忠実に繰り返すか省略するかについての選択には任意性がありますが、ここで注目している特徴量はその選択の影響を受けることになります。マーラーの場合に限れば、リピートが問題になるケースというのはあまりなく、第1交響曲第1楽章、第6交響曲第1楽章のソナタ提示部の繰り返しくらいでしょうか?(未完成作品まで含めれば、第10交響曲第3楽章のDa Capoが思いつきますが、これは文字通りの反復を嫌ったマーラー「らしくない」との嫌疑がかけられたりもして物議を醸してきた部分でもあります。更には第5交響曲第2楽章のごく初期の出版譜では提示部に反復記号があるのですが、この稿態が採用されることはまずないでしょう。)更に言えば、上記のような事情を踏まえると、仮に割合が同じだとしても規模が大きく異なる作品間の割合の比較には色々な意味で慎重さが要求されるということでもあると思います。また同様に、個別の作品(各交響曲)と作品全体(交響曲全て)の比較についても注意が必要です。各曲毎にその内部は多様性に富んでいても、「同じような」作品を繰り返し書けば、作品全体としてみれば反復が生じていることになり、単純な各曲における割合の平均にはならず、割合が下がることも考えられるからです。

 こうした事情を勘案すると、マーラーの作品についてはパターン数は多く、多様性に富んでいることが想像されるわけですが、実際にデータを眺めてみると、特に深さが増していくにつれてその傾向が極端になり、深さ4,5のパターンとなると、作品と抽出条件によっては複数回使用されるパターンがほんの僅かしかないことがわかります。特に最後に補遺2で追加した抽出条件のうち、転回形も五度圏上の位置の違いも区別する条件(trans_inではその傾向が著しく、繰り返し用いられるパターンに注目するようなデータ分析が実質的に無意味になってしまいかねない程です。(エントロピーという観点では限りなく1に近づいているということになります。)ここで対象にしているのが和音のパターンであるため、単独の和音パターンの種類数でも100を超えます。状態遷移パターンは最も単純な条件でも、深さをnとすれば和音パターン数のn+1乗の組み合わせが理論的には可能です。実際には深さ2くらいのレベルでは対象となっている拍の総数よりも遥かに小さいパターン数になりますが、深さが深くなるにつれてパターン数は増大していきます。深さ4,5になれば前の状態の理論的な組み合わせは天文学的な数字になるため、実質的は総拍数が上限となります。そこで多様性を測る最も簡単な尺度として、パターンの異なり数が総拍数にどこまで近づくか、という点に注目するやり方が考えられます。本分析では、まずはこの観点からデータを眺めて簡易的な分析をすることにします。

 本分析では、比較的区別が緩い抽出パターンとして、転回は区別せず、五度圏上の位置についても、状態遷移における移動の仕方が同じであれば同一のパターンと看做す条件(default)を用いて分析を行うことにします。

 以下は公開済のパターンの種類数の集計結果を元に、状態遷移パターンについては抽出対象とした三和音以上の和音の総数に対するパターンの種類数の割合を計算し、抽出対象とした三和音以上の和音の総数については、総拍数(休符や単音、重音の箇所も含む)に対する割合を計算した結果を示したものです。割合が1の時、全ての対象和音について全て異なった状態遷移パターンであり、繰り返し利用されるパターンが無いことを意味します。

 ここで割合が1に近いものを視覚的に読み取れるように、0.8以上、0.9以上、0.95以上、0.99以上について、それぞれ異なる背景色をつけてみました。


深さ3以上のパターンではほとんど全ての交響曲で0.8を超えていることが確認できますが、それだけではなく、第6交響曲を除くと、初期は割合が相対的に低く、後期になると高くなるという大まかな傾向が読み取れるように思われます。そこで、従来の和音の出現頻度の分析でも用いてきた創作年代区分で集計したらどうなるか?という疑問が自然に浮かびます。実際に集計をして、更に割合を求めた結果は以下に示す通りです。参考までに、パターン数の全交響曲の単純合計(のべに相当:sum)、全交響曲での集計結果(all)を第1~4交響曲(m1-4)、第5~7交響曲(m5-7)、第8~10交響曲(「大地の歌」を含む:m8-10)とともに示しました。(sumについては割合の計算は意味がないため行っていません。)



 まず全交響曲(all)の集計結果と割合について見て見ると、深さ1では明らかに、同じパターンが複数の交響曲で重複して出現していることが読み取れます(重複率は85%にも及びます。)しかし深さ2では50%近くまで下がり、深さ3では10%程度、深さ4,5では1%程度となり、ほとんど重複がないことがわかります。同じ和音を用いながら、状態遷移パターンとしては深さが深くなれば各曲毎に異なったパターンが用いられていることが窺い知れます。

 次に創作時期別の傾向を確認してみると、個別の交響曲毎に読み取れた傾向が時期毎の全体を対象にしたパターン抽出の結果からも読み取れることがわかります。状態遷移パターンの異なり数、つまりマーラーの場合、後期に行くに従ってパターンの多様性は拡大傾向にあるということが明確に読み取れると思います。各時期毎の対象拍数は大きく異ならず、相対的には初期が大きく、中期が小さく、後期がその中間ですが、深さ0にあたり和音単独でのパターンの割合はほとんど同じであるにも関わらず、状態遷移パターンについて言えば、深さが深くなるにつれて後期の方が多様性に富むという傾向は明らかなように思われます。

 これは少なくとも私にとっては驚くべき結果で、ここでもマーラーが、所謂「発展的な」作曲家であるということが、状態遷移パターンの多様性というシンプルが特徴量の上で明確に読みとれることがわかったことになります。これまでも状態遷移の分析にあたって参照してきた大黒達也さんの『音楽する脳』では、「ベートーベンの挑戦」と題された節(p.123)において、「脳の統計学習の計算モデルを用いて、ベートーベンの『ピアノソナタ』全曲の不確実性(情報エントロピー)を解析した」(同頁)結果が示されていますが、そこでは後期に至って飛躍的にエントロピーが増大するという結果を以て、「昔から新しい不確実な音楽への挑戦に非常に意欲的だったといわれてい」(同頁)るベートーベンが、実際に「生涯、常に新しい音楽を求めて曲を作り続けて来たのかもしれない」(p.124)とされていますが、本稿では、遥かに初歩的な集計結果の比較という、素朴なやり方ではありますが、状態遷移パターンの異なり数の比較を通して、マーラーもまた「発展的な」作曲家であったことの傍証となりうる結果が得られたのではないかと思います。分析の手法は異なりますが、アドルノが「後期様式」というものをとりわけてもベートーヴェンとマーラーについて述べたことが恣意ではなく、優れた音楽的資質に恵まれていたらしいアドルノの、その経験に基づく直観に根差した指摘ではなかったかとも感じました。

 なおここでは直接エントロピーの計算はしていませんが、マルコフ過程であれば多重度に相当する深さに応じた過去の値の系列(状態)から次の値への遷移の条件つき確率をベースに定常分布における状態の期待値の確率としてエントロピーが計算されることを考えれば、例えば出現頻度が1である状態がほとんどを占めるような系列は高エントロピーの系であると推測できます。更に創作時期を追う毎に異なるパターンの割合が増えていく傾向があるということから、マーラーの場合もベートーヴェンの場合と同様、創作時期を追う毎にエントロピーが増大する傾向であろうことも推測できます。勿論、厳密には計算が必要ですが、ここではエントロピーの肌理の粗い近似として状態遷移パターンの多様性を用いていることになるかと思います。

 さて、ここまではマーラーの作品間の比較を行ってきましたが、それでは他の作曲家の作品の場合はどうなのでしょうか?直近の、旋法性に関わる和音の出現頻度に関する分析において比較対照のために取り上げた作曲家・作品との比較がまず思い浮かびますが、ここでも状態遷移パターンについては初めて集計結果に接したこともあって、より広い範囲での展望を得ておきたく、時代を遡ってバロック期や古典期の作品ではどうであるかについても一瞥してみることにしました。結果として前回の実験と同じ作曲家の同じ作品に加えて、古典期とバロックの作品の例としてシュターミッツとゼレンカの作品を加えた以下のデータセットについて集計・分析を行うことにしました。(括弧内は以下に示す分析結果におけるラベルを表します。)

  • マーラー(mahler):第1~10交響曲、大地の歌(m1~10, erde)
  • ブラームス(brahms):第1,2,3,4交響曲(jb1,2,3,4)
  • ブルックナー(bruckner):第5,7,8,9交響曲,第9交響曲フィナーレ断片つき(ab5,7,8,9,9f)
  • フランク(franck):交響的変奏曲、交響曲 (cfVar,  cfSym)
  • ラヴェル(ravel):左手のための協奏曲、ピアノ協奏曲ト調、高雅で感傷的な円舞曲、ダフニスとクロエ第2組曲 (mr_leftpc, mr_pc, mr_vns, mr_dcl)
  • シベリウス(sibelius):第2,7交響曲、タピオラ (js2,7, jsTapiola)
  • タクタキシヴィリ(taktakishvili):ピアノ協奏曲第1番 (ot)  
  • ヤナーチェク(janacek):シンフォニエッタ (lj)
  • ドヴォルザーク(dvorak):第7,8,9交響曲 (dv7,8,9)
  • スメタナ(smetana):我が祖国 (bs)
  • カール・シュターミッツ(stamitz):クラリネット協奏曲第3番、第10番、2本のクラリネットと管弦楽のための協奏曲、フルート協奏曲ト長調作品29,、 ヴィオラ協奏曲ニ長調作品1 (st3cl, st10cl, stdpcl, stfscgd, stt_vacon)
  • ゼレンカ(zelenka):聖セシリアのミサ、 聖霊のミサ、信仰のミサ、慈善のミサ、ミゼレーレニ短調 (zwv1, 4, 6, 10, 56)
以下にまず集計結果を示します。まずブルックナーとブラームスです。


次いで、フランク、ラヴェル、シベリウス、タクタキシヴィリです。


最後に、ヤナーチェク、ドヴォルザーク、スメタナ、シュターミッツ、ゼレンカの結果です。


 まず今回追加したシュターミッツとゼレンカについて確認すると、古典期を切り開いたマンハイム楽派の代表的存在であるシュターミッツの方が、時代的には先行するが、しばしば同時代で交流もあったJ.S.バッハと比較されることもあるゼレンカの作品よりも状態遷移パターンに関してシンプルであると言う傾向が明確に読み取れると思います。

 ブルックナー、ブラームスはスメタナやドヴォルザークとともにマーラーに先行する世代ですが、ドヴォルザークの第7交響曲を例外として、後はいずれもシュターミッツ程ではないにせよ、状態遷移パターンに関しては相対的にシンプルであると言えそうです。一方でフランク、ラヴェル、シベリウス、タクタキシヴィリは相対的にパターンの多様性が確認できるグループですが、マーラーにおいては初期と同程度であるに過ぎず、マーラーの中期以降、特に後期の作品における多様性が際立つ結果となりました。実際マーラー以外では、ラヴェル、シベリウス、タクタキシヴィリの一部の作品の深さ5のパターンでようやく95%が出現する程度であり、マーラーのように深さ4,5が軒並み95%以上といった値は他には見当たりませんし、99%以上に達するケースはありませんでした。ヤナーチェクもマーラーとほぼ同時代の作曲家ですが、ここで取り上げたシンフォニエッタが典型的にそうであるように、短い動機や旋律の繰り返しを構成原理とする、どちらかというとミニマリズム的な傾向があることが、ここでは状態遷移パターンの相対的な少なさとして確認できるように思います。

 以上、ここまでは集計された状態遷移パターンの異なり数についての集計結果に基づく、ごく初歩的な確認によって、マーラーの交響曲間、マーラーと他の作曲家の作品間の比較において、比較的明確に区別ができそうな見通しが得られたと考えます。そこで以下では、これ迄に得られた見通しに基づいて、更に状態遷移パターンの異なり数に関するデータを用いたクラスタ分析・主成分分析を行った結果を報告します。

3.分析条件

 上記のような検討から、従来、和音の出現頻度に対して適用した統計分析を状態遷移パターンにも適用することとし、以下のようにレイアウトした分析を行うことにしました。

対象とするデータ:上記の検討において検討の対象としたデータには、状態遷移パターン抽出の対象である三和音以上の拍数に対する状態遷移パターンの異なり数の割合とともに、総拍数と三和音以上の拍数(=状態遷移パターン抽出の対象)の割合についての集計も含まれていましたが、これは意味的にはテクスチュアの厚みに関わる特徴量と捉えることができ、反復/多様性に関する特徴量である状態遷移パターンの異なり数とは意味的に異質の情報であると考えられます。そこで以下の分析においては、総拍数と三和音以上の拍数(=状態遷移パターン抽出の対象)の割合については分析対象から除外しました。状態遷移パターンについては深さ0(単独の和音に相当)~深さ5まで全てを用いました。

分析手法:従来和音の出現頻度の分析で用いたのと同じ、階層的クラスタ分析、非階層的クラスタ分析、主成分分析を行いました。階層的クラスタ分析としては、今回はcomplete法とward法の2種類、非階層クラスタ分析はk-means法を用い、Gap統計量に基づいてクラスタ数を指定しました。主成分分析に際しては、今回対象とする特徴量は全て同じ種類であり、かつ最大値1という点でも揃っていますが、状態遷移の深さが増すと増大する性質を持つため、標準化を行わないと深さの大きいパターンの寄与が大きくなってしまうことが予め予想されたため、標準化を行うモードで分析を行いました。

分析対象のデータ:上述の通り、前回の実験と同じ作曲家の同じ作品に加えて、古典期とバロックの作品の例としてシュターミッツとゼレンカの作品を加えた以下のデータセットについて集計・分析を行うことにしました。(括弧内は以下に示す分析結果におけるラベルを表します。)集計・分析は基本的には曲単位で行いました。

  • マーラー(mahler):第1~10交響曲、大地の歌(m1~10, erde)
  • ブラームス(brahms):第1,2,3,4交響曲(jb1,2,3,4)
  • ブルックナー(bruckner):第5,7,8,9交響曲,第9交響曲フィナーレ断片つき(ab5,7,8,9,9f)
  • フランク(franck):交響的変奏曲、交響曲 (cfsymvar,  cfsym)
  • ラヴェル(ravel):左手のための協奏曲、ピアノ協奏曲ト調、優雅で感傷的な円舞曲、ダフニスとクロエ第2組曲 (mr_leftpc, mr_pc, mr_vns, mr_dcl)
  • シベリウス(sibelius):第2,7交響曲、タピオラ (js2,7, jsTapiola)
  • タクタキシヴィリ(taktakishvili):ピアノ協奏曲第1番 (ot)  
  • ヤナーチェク(janacek):シンフォニエッタ (lj)
  • ドヴォルザーク(dvorak):第7,8,9交響曲 (dv7,8,9)
  • スメタナ(smetana):我が祖国 (bs)
  • カール・シュターミッツ(stamitz):クラリネット協奏曲第3番、第10番、2本のクラリネットと管弦楽のための協奏曲、フルート協奏曲ト長調作品29,、 ヴィオラ協奏曲ニ長調作品1 (st3cl, st10cl, stdpcl, stfscgd, stt_vacon)
  • ゼレンカ(zelenka):聖セシリアのミサ、 聖霊のミサ、信仰のミサ、慈善のミサ、ミゼレーレニ短調 (zwv1, 4, 6, 10, 56)


4.分析結果

(A)マーラーの交響曲間の比較

2つの階層クラスタ分析の結果は同一となり、大地の歌、第9,10交響曲の後期3作品とそれ以前の作品で大きく2つに分かれ、それ以前の作品は更に、ソナタ楽章の提示部反復を含む第1、第6交響曲がまず分かれ、残りが更に第2,3,8交響曲と第4,5,7交響曲に分かれる結果となりました。




次いで非階層クラスタ分析ですが、クラスタ数を決めるためのGap統計量は、何回かシミュレーションするとかなりの揺れを示しますが、概ね2,4あたりが常に小さい値となる傾向が見られたため、クラスタ数2の場合とクラスタ数4の場合の2パターンの分析を行いまいした。

クラスタ数=2の場合には、2種の階層クラスタ分析の結果と同様、(1)大地の歌、第9,10交響曲の後期3作品とそれ以前の作品である(2)第1~第8交響曲で大きく2つに分かれます。

      res
ans    1 2
symA 0 4 : 初期(第1~4交響曲)
symB 0 3:中期(第5~7交響曲)
symC 0 1:第8交響曲
symD 3 0:後期(大地の歌、第9,10交響曲)

m1   m2   m3   m4   m5   m6   m7   m8 erde   m9  m10 
   2      2      2      2      2      2     2     2      1      1      1 




クラスタ数=4の場合も2種の階層クラスタ分析の結果と同様の結果となっています。即ち、(1)大地の歌、第9,10交響曲の後期3作品のグループ、(2)第4,5,7交響曲のグループ、(3)第2,3,8交響曲のグループ、(4)第1,6交響曲のグループに分かれています。

        res
ans    1 2 3 4
symA 0 1 2 1 : 初期(第1~4交響曲)
symB 0 2 0 1:中期(第5~7交響曲)
symC 0 0 1 0:第8交響曲
symD 3 0 0 0:後期(大地の歌、第9,10交響曲)

  m1   m2   m3   m4   m5   m6   m7   m8 erde   m9  m10 
    4      3      3      2      2      4      2      3      1      1      1 


上掲のkmeans法によるクラスタ分析結果のclusplotによる表示は、主成分分析での第1主成分を横軸、第2主成分を縦軸としたものですが、主成分分析の結果を方を次に確認します。以下のprcompの結果は、第1主成分軸の正負が逆転しているため、clusplotの表示に対して左右が反転していますが、同様の結果が得られていることが確認できます。


                               PC1     PC2      PC3      PC4      PC5      PC6
Standard deviation       2.0935 1.1922 0.43063 0.09385 0.03863 0.01294
Proportion of Variance  0.7305 0.2369 0.03091 0.00147 0.00025 0.00003
Cumulative Proportion  0.7305 0.9674 0.99826 0.99972 0.99997 1.00000

 主成分分析のサマリーを確認すると、第3主成分までで累積が99.8%であり、それ以下の成分の寄与は実質的にほとんどないことから、以下では第1~3主成分までに絞って見ていくことにします。

 以下の横軸を第1主成分、縦軸を第2主成分としたggbiplotの表示では、時代区分毎に楕円で囲われるため、後期(大地の歌、第9,10交響曲)が比較的均質であるのに対し、初期と中期は第1交響曲、第6交響曲というソナタ提示部反復を持つ作品とその他の作品との距離が大きく、特に7割以上の割合を占める第1主成分側での違いが大きいために、それぞれの楕円は大きく横に広がる結果となっています。総体としては第1・第2主成分の組み合わせによって、中心より左上側に固まっている後期/右下側に広がっている初期・中期というように分類できそうで、この結果はクラスタ分析の結果とも一致しています。
以下は第2主成分を横軸、第3主成分を縦軸にした表示ですが、ここで興味深いのは、割合的には3%程度で限定されますが、第3主成分で初期と中期が中心の下側・上側に分かれる点が興味深く思われます。

上記を踏まえて、各主成分の得点と負荷を確認してみます。

まず得点ですが、第1主成分では大まかな傾向として、+方向の初期、ほぼ0に近い中期と-方向の後期という対照が見られるように思います。但し、第1、第6交響曲はソナタ提示部の反復などから点数が高くなっている点を考慮にいれるべきかと思われます。第2主成分については、第1、6と後期のグループ(+)と第2~5、第7、第8のグループ(-)とに分かれていることが確認できます。割合が小さいため得点の絶対値が小さくなってしまっていますが、第3主成分は、-方向の初期、+方向の中期に対し、後期は作品によってばらつくもののほぼ0に近いと捉えることができそうです。

一方負荷を見ると、第1主成分は、深さによらず状態遷移パターンの多様性が低いものの得点が高くなることがわかります。第2主成分は状態遷移パターンの深さ0から5に向けて負荷が+から-に変化しており、深さが浅いパターンの多様性が大きく、深さが深いパターンの多様性が小さければ得点が高くなることが読み取れます。つまり単純な和音単独の多様性や(前、後)という短い状態遷移パターンでより多様性が大きく、深さが増す(つまり状態遷移パターンの系列の長さが長くなる)に従って多様性が相対的には限定される傾向にあると点数が高くなるということで、多様性が局所的(浅い)なのか、大域的(深い)なのかに関わっているように思います。そしてこのパターンに当て嵌まるのが第1、6と後期のグループであり、第2~5、第7、第8のグループはこれに当て嵌まらない、言い換えれば和音のパターンや浅い部分の状態遷移パターンはそうでもないが、深くなると急激に多様性が増す傾向があることになります。それに対して第3主成分は同様にして、和音単独と深いパターンで多様性が低く、浅いパターンについて多様性が高いものの得点が高くなることが窺えます。

第1主成分得点



第2主成分得点


第3主成分得点

第1主成分負荷



第2主成分負荷



第3主成分負荷


(B)マーラーと他の作曲家の作品間の比較

 続けてマーラーの交響曲と他の作曲家の作品の比較結果を見ていきます。

 最初は階層クラスタ分析です。complete法の結果とward法の結果には細かいところでは差異がありますが、大きく、マーラーが含まれるグループとマーラーが含まれないグループに分かれている点、マーラーが含まれるグループには、フランク、シベリウス、ラヴェル(左手のための協奏曲除く)、タクタキシヴィリが含まれる点は共通しています。ドヴォルザークは第7交響曲のみマーラーが含まれるグループに含まれています。




非階層クラスタ分析のクラスタ数を決めるためのギャップ統計量の推計では、クラスタ数=4が比較的安定してギャップが小さいという結果が得られたため、クラスタ数=4でkmeans法によるクラスタリングを行いました。clusplotによるプロットを見ると明らかなように、後で見る主成分分析における第一主成分方向右から左に以下のように4つのグループが出来ています。第一主成分がどのような特徴を示しているかは、主成分分析の結果で確認することにします。

1:マーラー、フランク:交響的変奏曲、シベリウス第7、ラヴェル:ピアノ協奏曲、ダフニスとクロエ第2組曲
2:タクタキシヴィリ、ゼレンカzwv4,10,56、フランク:交響曲、ドヴォルザーク第7、マーラー第1、6、シベリウス:タピオラ、ラヴェル:高雅で感傷的な円舞曲
3:ブラームス、ブルックナー、スメタナ、ドヴォルザーク第8、ヤナーチェク、シュターミッツ:クラリネット協奏曲第3、フルート協奏曲、ヴィオラ協奏曲、ゼレンカzwv1,6、ラヴェル:左手のための協奏曲、シベリウス第2
4:シュターミッツ:クラリネット協奏曲第10、2本のクラリネットのための協奏曲、ドヴォルザーク第9

               res
ans               1 2 3 4
brahms          0 0 4 0
bruckner        0 0 5 0
dvorak           0 1 1 1
franck            1 1 0 0
janacek          0 0 1 0
mahler-early   2 1 0 0
mahler-late     4 0 0 0
mahler-middle 3 1 0 0
ravel              2 1 1 0
sibelius           1 1 1 0
smetana         0 0 1 0
stamitz           0 0 3 2
taktakishvili     0 1 0 0
zelenka           0 3 2 0

m1        m2        m3        m4        m5        m6        m7 
  2         1         1         1         1         2         1 
m8      erde        m9       m10       ab5       ab7       ab8 
  1         1         1         1         3         3         3 
ab9      ab9f       jb1       jb2       jb3       jb4     cfsym 
  3         3         3         3         3         3         2 
cfsymvar mr_leftpc     mr_pc    mr_vns    mr_dch       js2       js7 
  1         3         1         2         1         3         1 
jsTapiola        ot        lj       dv7       dv8       dv9        bs 
  2         2         3         2         3         4         3 
st3cl    st10cl    stdpcl   stfscgd stt_vacon      zwv1      zwv4 
  3         4         4         3         3         3         2 
zwv6     zwv10     zwv56 
  3         2         2 

主成分分析のサマリーを見ると、第1主成分で76%、第2主成分で20%、第3主成分で3%の割合を占め、この3つで99%以上の割合となっているので、この3成分に絞って調べていきます。以下のprcompの結果の第1主成分、第2主成分のbiplotによる表示、ggbiplotによる表示はいずれも横方向の第1主成分軸(左右)の方向について階層クラスタ分析と同じですが、第2主成分軸(上下)の方向については正負が逆転しています。ここではマーラーは中心から右上隅に集中しており、第1主成分、第2主成分の両方において明確な傾向があることが確認できます。


                               PC1     PC2      PC3      PC4      PC5      PC6
Standard deviation       2.1391 1.0858 0.46827 0.15237 0.05030 0.01415
Proportion of Variance  0.7626 0.1965 0.03655 0.00387 0.00042 0.00003
Cumulative Proportion  0.7626 0.9591 0.99568 0.99954 0.99997 1.00000

ggbiplotでは、緑色から青緑色の楕円がマーラーの作品を表しており、第1、第2主成分でのプロットでは第1象限(右上隅)に固まっていること、第2,第3主成分でのプロットでは第4象限(右下隅)に固まっている様子が窺えます。

そこで主成分得点、主成分負荷について確認すると、第1主成分負荷については、マーラー作品間の分析における第1主成分負荷と正負が逆転しているものの、ほぼ同様の傾向を示しており、特に状態遷移パターンが多様性に富んでいることを示しています。第1主成分得点について見ても、マーラーの作品の部分だけ見ると(正負は逆ですが)同じように後期作品になるとパターンの多様性が大きくなるという明確な傾向が見られます。ただし他の作曲家の作品との比較では、マーラーの作品全体が相対的に多様性が大きいため全てが正の得点を持ち、ブルックナー、ブラームス、シュターミッツ、ドヴォルザーク第8、第9、ヤナーチェクが負の得点を持つのと対照を示しています。

 第2主成分負荷について見ると、こちらもマーラー作品間の分析における第2主成分と似た傾向を持ち(ただし正負の向きは逆)、単独の和音のパターンを深さ=0の状態遷移パターンと見做すならば、状態遷移パターン多様性が、深さが深くなるにつれて増している場合に得点が高くなります。興味深いことに、第2主成分得点について見ると、第1主成分得点では同様の傾向を示していたマーラーとラヴェル、シベリウスの傾向がわかれ、マーラーは正の得点を持つのに対して、ラヴェルとシベリウスは大まかには負の得点を持っており、第1・第2主成分の組み合わせによって特徴づけることができそうです。即ち、

  • 全般に多様・深い程多様:マーラー(特に初期・中期)
  • 全般に多様・浅い方が多様:ラヴェル・シベリウス

という傾向が取り出せそうです。ただしマーラーについては、マーラーの作品間の分析でもその傾向が確認できたように、和音のパターンや状態遷移パターンの浅い部分が単純で、深くなると急激に多様性が増す初期・中期と、そうした傾向が強くは現れない後期の作品に明確に分かれていることも確認できます。シベリウスやラヴェルは、用いられている和音の種類は豊富で多様性に富みますが、状態遷移パターンが深くなる(より長い系列に注目する)とマーラーと比べた場合には、それほど多様性が増すわけではないことが確認できます。

 更に第3主成分について見ると、これも正負の逆転があるのでその点を考慮すると、細かい部分では差異があるもののマーラーの作品間の分析での第3主成分と大まかには似た傾向を示していることがわかります。つまり、単独の和音の多様性と状態遷移パターンの多様性を区別してみたときに、和音も多様で状態遷移パターンの深いところが多様な作品が正の得点を持ち、逆に和音の多様性よりも状態遷移パターンの浅いところの多様性が大きい作品は負の値と持つことになります。割合が3%と小さいため、得点の絶対値は小さなものですが、第3主成分方向に作曲家を分類すれば、大まかには以下のようになりそうです。

  • 和音も多様で状態遷移パターンの深いところが多様:シベリウス、ラヴェル、ゼレンカ、シュターミッツなど
  • 和音の多様性よりも状態遷移パターンの浅いところの多様性が大:マーラー、ブルックナー、ドヴォルザークなど

第1主成分得点



第2主成分得点



第3主成分得点

第1主成分負荷



第2主成分負荷



第3主成分負荷

5.まとめ

 本稿では、単独の和音や状態遷移パターンの多様性に注目して、マーラーの作品間の比較、マーラーと他の作曲家の作品との比較を行いました。その結果として、両方の分析に共通して、大まかに以下のような特徴が取り出せることがわかりました。(正負の向きは個別の分析では逆転する場合がありますが、ここでは個別の場合の向きは捨象して、以下に記載の方向に向きを統一して話を進めさせて頂きます。)
  • 第1主成分:全般的な多様性(+:多様/-:多様でない)
  • 第2主成分:状態遷移の深さと多様性の関係(+:深さに応じて多様性拡大/-:和音は多様だが、深くなっても多様性拡大せず)
  • 第3主成分:和音の多様性と状態遷移の多様性の関係(+:和音が多様で、深い状態性も多様/-:状態遷移の深さの浅い部分の多様性が大きい)
上記の3つの特徴について作曲家・作品についておおまかな傾向を整理すると、マーラーは他の作曲家との比較においては、全般的な多様性(+)、深さに応じて多様性拡大(+)、和声単独の多様性よりも状態遷移の深さの浅い部分の多様性が大きい(-)という特徴により他と区別できると言えそうです。一方で、マーラーの作品間の比較においては以下のように特徴づけられそうです。
  • 全般的な多様性:後期になると多様性が増大する傾向がある。
  • 状態遷移の深さと多様性の関係:第1、第6交響曲と後期作品は和音のパターンや浅い状態遷移パターンが多様であり、状態遷移パターンが深くなっても多様性が更に拡大することはないのに対して、その他の交響曲では深くなると多様性急激に拡大する傾向にある。ただし全般的な多様性との関係から、第1、第6では大規模な反復が存在するせいで深くなっても多様性が拡大しないのに対し、後期は既に和音のパターンや浅い状態遷移パターンで大きな多様性を示してしまっているために、深くなってもそれ以上多様性が拡大する余地がないのであって、第1、第6とは理由が異なる。
  • 和音の多様性と状態遷移の多様性の関係:初期は和音が多様で、深い状態性も多様なのに対し、中期は状態遷移の深さの浅い部分の多様性が相対的に大きい。
 全般として、マーラーの作品は状態遷移の多様性において際立っていますが、更に後期になればなるほど多様性が増大し、深い状態遷移パターンにおいては多様性が極限まで拡大していくという点がユニークな特徴であると言えるのではないかと思います。この点に関して思い浮かぶのは、本分析の背景のところで触れたことの繰り返しになりますが、大黒達也『音楽する脳』の「ベートーベンの挑戦」と題された節(p.123)において、「脳の統計学習の計算モデルを用いて、ベートーベンの『ピアノソナタ』全曲の不確実性(情報エントロピー)を解析した」(同頁)結果が示されていますが、そこでは後期に至って飛躍的にエントロピーが増大するという結果を以て、「昔から新しい不確実な音楽への挑戦に非常に意欲的だったといわれてい」(同頁)るベートーベンが、実際に「生涯、常井新しい音楽を求めて曲を作り続けて来たのかもしれない」(p.124)とされている点です。
 本稿では、多重マルコフ過程としてのエントロピーを計算することはせず、遥かに初歩的なパターンの異なり数集計結果の比較やクラスタ分析・主成分分析という素朴なやり方ではありますが、状態遷移パターンの多様性の比較を通して、マーラーもまた「発展的な」作曲家であったことの傍証となりうる結果が得られたのではないかと思います。
 個別の作品について見ると、ソナタ楽章における提示部反復が存在する第1交響曲、第6交響曲は、マーラーに先行する作品と共通する部分が大きく、「古典的」な傾向を持つのに対して、それ以外の作品は機械的な文字通りの反復を嫌い、有機体的な絶えざる発展を重んじたマーラー自身の意図通りに、その作品における状態遷移パターンは他の作曲家との比較においても極めて多様であること、更に全体として深さが深くなればなるほど(マルコフ過程としてみた場合には多重度が大きくなればなるほど)同一パターンが繰り返し使用される傾向が低くなる度合いが大きいという点において徹底している点が印象的です。しかも、その傾向が創作年代を追う毎に強くなり、マーラーの作品の中ではいわゆる「後期」作品の特徴、最近特に個人的に関心を抱いているマーラーにおける「老い」と関係した、ジンメル=アドルノの言うところの「後期様式」に関わる統計上の特徴が発見できたことは興味深く、正直に言えば、本稿で報告したような、状態遷移パターンの中身には立ち入らない、単なる多様性の分析のみで上述のような明確な結果が得られるとは予期しておらず、率直に言って驚きを感じました。アドルノは特にベートーヴェンとマーラーを対象として後期(晩年)様式について語り、大黒さんはベートーヴェンの後期ピアノソナタを対象にして、その「挑戦」を語りましたが、状態遷移パターンの多様性、エントロピーといった側面から、ベートーヴェンと同様にマーラーもまた「挑戦」を続けたことが示されたと言っていいのではないでしょうか?
 更に言えば、例えばマーラーの作品間、マーラーと他の作曲家の分析の両方において、主成分分析によって得られた上位3つの主成分が似た特徴を持っているという点は、単なる偶然である可能性も勿論否定できませんが、そのそれぞれが何等かの「意味」と関係している可能性も感じられ、更なる考察、分析を続ける価値があるように思っています。(2023.9.3公開, 9.4 主成分第2分析の第2主成分についてのマーラーの作品に関する記述を訂正するなど加筆。)

[付録]ダウンロード可能なアーカイブファイル和声状態遷移パターン数分析.zip の中には以下のファイルが含まれます。

(A)マーラーの交響曲間の比較(フォルダ名gm_sym)

(A1)入力データ
 gm_sym_cdnz.csv:分析対象の
 gm_sym_col.csv:対象作品の作曲家に対応した色(主成分得点グラフで使用)
 gm_sym_label.csv:対象作品の作曲家名ラベル

(A2)主成分分析結果
 eigen.jpeg:固有値のグラフ
 prcomp_T.jpeg:主成分分析(scale=T)結果のbiplotグラフ
 ggbiplot12.jpeg:主成分分析結果(第1,第2成分)のggbiplotグラフ
 ggbiplot23.jpeg:主成分分析結果(第2,第3成分)のggbiplotグラフ
 pr_score-[1-3]T.jpeg:主成分得点のbarplotグラフ
 prcomp_PC[1-3].jpeg:主成分負荷量のbarplotグラフ

(A3)階層クラスタ分析系:
 hclust_complete.jpeg:complete法での分類結果
 hclust_wardD2.jpeg:ward法での分類結果

(A4)非階層クラスタ分析系:
 clusGap.jpeg:ギャップ統計量のシミュレーション結果サンプル
 kmeans2.csv:kmeans法(クラスタ数=2)での分類結果
 kmeans2.jpeg:kmeans法(クラスタ数=2)での分類結果のclusplotグラフ
 kmeans3.csv:kmeans法(クラスタ数=3)での分類結果
 kmeans3.jpeg:kmeans法(クラスタ数=3)での分類結果のclusplotグラフ

(A5)分析履歴
 hist.txt:R言語を用いた分析履歴(Windows版R言語 ver.4.1.0をR studio上で実行)。
 主成分分析結果サマリを含む。

(B)マーラーと他の作曲家の作品の比較(フォルダ名gm+control)

(B1)入力データ
 gm_control_cdnz.csv:分析対象の和音形(maj, maj46, min, dom7, dom9, add6, penta, ganz, ganz-1, ganz-2) の分析対象作品毎の出現割合
 gm_control_col.csv:対象作品の作曲家に対応した色(主成分得点グラフで使用)
 gm_control_label.csv:対象作品の作曲家名ラベル

(B2)主成分分析結果
 eigen.jpeg:固有値のグラフ
 prcomp_T.jpeg:主成分分析(scale=T)結果のbiplotグラフ
 ggbiplot12.jpeg:主成分分析結果(第1,第2成分)のggbiplotグラフ
 ggbiplot23.jpeg:主成分分析結果(第2,第3成分)のggbiplotグラフ
 pr_score-[1-3]T.jpeg:主成分得点のbarplotグラフ
 prcomp_PC[1-3]T.jpeg:主成分負荷量のbarplotグラフ

(B3)階層クラスタ分析系:
 hclust_complete.jpeg:complete法での分類結果
 hclust_wardD2.jpeg:ward法での分類結果

(B4)非階層クラスタ分析系:
 clusGap.jpeg:ギャップ統計量のシミュレーション結果サンプル
 kmeans4.csv:kmeans法(クラスタ数=6)での分類結果
 kmeans4.jpeg:kmeans法(クラスタ数=6)での分類結果のclusplotグラフ

(B5)分析履歴
 hist.txt:R言語を用いた分析履歴(Windows版R言語 ver.4.1.0をR studio上で実行)。
 主成分分析結果サマリを含む。

[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。