お詫びとお断り

2020年春以降、2024年3月現在、新型コロナウィルス感染症等の各種感染症の流行下での遠隔介護のため、マーラー祝祭オーケストラ第22回定期演奏会への訪問を例外として、公演への訪問を控えさせて頂いています。長期間に亘りご迷惑をおかけしていることにお詫びするとともに、何卒ご了承の程、宜しくお願い申し上げます。

2023年9月15日金曜日

MIDIファイルを入力とした分析:状態遷移パターンの出現確率に注目した予備分析(2023.9.23更新)

1.はじめに

 これまで記事:MIDIファイルを入力とした分析の準備(3):状態遷移の集計手法の検討と集計結果の公開MIDIファイルを入力とした分析の準備(4):状態遷移の集計結果の公開(続き)およびMIDIファイルを入力とした分析の準備(6):状態遷移の集計結果の公開(補遺その2)にて、状態遷移の集計方法の検討、検討内容に基づいた集計結果を公開を行い、更に本格的な分析の予備作業として、状態遷移パターンの多様性についての確認と簡単な分析を行った結果を記事:後期マーラーの「挑戦」?:MIDIファイルを入力とした分析:状態遷移パターンの多様性に注目した予備分析において報告しました。今回はその続きとして、集計した状態遷移パターンの出現確率についての集計・分析の結果を報告します。

 前回の分析では、状態遷移パターンの出現頻度ではなく、パターンの異なり数にフォーカスし、いわばパターンの多様性の観点から、マーラーの作品間に見られる傾向の違いや、他の作曲家の作品との比較を通して見たマーラーの作品の特徴を調べてみました。その結果、マーラーの作品は状態遷移の多様性において際立っており、更に後期になればなるほど多様性が増大し、深い状態遷移パターンにおいては多様性が極限まで拡大していくという点がユニークな特徴であることを確認しました。

 そこでここではいよいよ一般的に状態遷移の分析において行われるように、パターンの出現頻度にフォーカスし、その出現確率の偏りや不確実性の大きさを調べてみることにします。通常、状態遷移のプロセスは、マルコフ過程として捉えられることが多く、またその特徴量としてはエントロピー(情報量)に注目することが多いのですが、ここではマルコフ過程としてのエントロピーの計算の前に、和音の出現確率(状態遷移パターンとしてみた場合には深さ=0に相当)、状態遷移パターンの出現確率のエントロピーを計算してみることにします。そして最後に参考情報として、比較的計算が容易な単純マルコフ過程としてみた場合(これはこれまで公開してきた集計結果では、深さ=1の場合に相当します)のエントロピーの計算を行い、その結果と比較できるようにしました。

 結果を先回りして述べると、今回の分析結果を眺めるにあたり、エントロピーという量の定義を念頭において、どうしてそういう結果になったかを理解する必要がありました。そしてその過程で、幾つかの補足的な計算を行い、その結果とともに以下では報告させて頂くことになります。また、計算対象として、以下の分析条件に記載する通り、和音のパターン(例えば「長三和音形」)のみを状態とする(pcls)条件での集計結果を用います。更にこの集計結果は、休止の拍は当然として、単音・重音の拍はスキップし、同じ和音パターンの連続もスキップした系列となっていること、更に、これはこれまでも常に問題になってきた点ですが、同じ和音パターンには、ある和音の移置・転回も含まれますから、機能的には異なる和声として区別されるべきものを区別していないという点に留意すべきと考えます。

 要するに、ここで計算対象としている系列は、通常、楽曲分析において楽典の知識を有する分析者が抽出する和声進行とはかなり異なったものであるという点は強調し過ぎてもし過ぎということはありません。和音のパターンの出現頻度のような特徴量ならば、テクスチュアのような表層的なレベルを扱っているというような見方が可能でしょうが、状態遷移パターンを扱う今回の分析では、「聴いた感じ」とはかなり異なった情報を抽出していると言えると思います。つまり人間の分析者が行ったかも知れない分析を自動化したという見方は本稿で報告する内容についてはできないと考えます。実はこれは本稿をお読み頂いた方の一人から頂戴した指摘をそのまま受け入れて記載させて頂いているのですが、それに意味があるかどうかは措いて、人間ではなく、機械が楽曲を(人間とは異なった視点で)「分析する」としたら、という「ありえるかも知れない分析」の一つの可能性を示したものと見做すのが適切と考えます。(勿論ここでのケースに限れば、機械が自分で分析条件を設定し、興味深いパターンを発見するといった水準には程遠く、分析が「つまらない」ものであることの責任は、ここでは偏に私に存するわけですが。)

 一連の計算と計算結果の分析をした上での率直な感想を申し上げれば、パターンが多くなりすぎることと、「差分」「変化」ではなく単独で定義できる「状態」を対象とするという点を踏まえて、和音のパターンのみを状態とする(pcls)条件を用いたわけですが、その結果は、何をパターンとするかに関して余りに人間の感覚から離れすぎてしまって結果の意味づけを行うことが困難であるというように感じています。後述するマルコフ過程として見た場合の「吸収的状態」の発生に関しても、パターンが多すぎて状態遷移の経路が一意に決まる方向性も考えられる一方で、パターンが過度に同一視された結果、人間にとっては異なるものが同一のパターンと判定された結果、その条件限りでの「吸収的状態」が発生するといった方向性も考えられそうです。従って、状態遷移の分析を本格的に行うのであれば、せめてもう少し「変化」をきめ細かく捉えた条件で生成した系列を用いて行うのが適切ではないか、というのが現時点での偽らざる認識です。本稿を「予備分析」としているのは、そうした点を踏まえて、分析手順を確認し、起こりうる問題を事前に把握して検討することで、来るべき本格的な分析に備えるといった目的があるからです。

 上記のような事情を踏まえ、ここでは従来行ってきたような分析結果に基づく対象の作品に関する検討は行わず、分析の報告のみを行います。

 なお、本稿で報告している分析はごく初歩的なものであり、Webで多数公開されている情報理論についての説明をご覧頂ければ十分に理解可能なものですので、本稿では情報量としてのエントロピーの定義や計算方法についての説明は割愛させて頂き、それらについての知識を前提に分析方法や分析結果についての記述を行わせて頂きますので、予めご了承の程よろしくお願いします。


2.分析条件

 上記を踏まえ、以下のようにレイアウトした分析を行うことにしました。

対象とするデータ:状態遷移をマルコフ過程として扱った場合のエントロピー(記憶を持つ情報源についての条件付きエントロピー)ではなく、無記憶情報源について出現する状態遷移パターンの出現確率からエントロピーを計算する場合に限ると、これまで報告してきたどの条件の集計結果でも計算はできますが、最後に単純マルコフ過程として捉えた場合のエントロピーを計算して比較することを踏まえ、MIDIファイルを入力とした分析の準備(6):状態遷移の集計結果の公開(補遺その2)で公開した、和音のパターン(例えば「長三和音形」)のみを状態とする(pcls)条件での集計結果を用いることにします。深さに関しては、無記憶情報源について出現する状態遷移パターンの出現確率からエントロピーを計算する際には集計したすべての深さ(深さ0(単独の和音に相当)~深さ5)を用いますが、マルコフ過程としてのエントロピーの計算は、比較的簡単に計算できる単純マルコフ過程の場合(深さ=1に相当)のみとしました。

分析手法:今回はタイトルには予備分析とあるものの、実際にはエントロピーの計算を行った結果を集計・報告するだけです。計算にあたっては従来から用いてきたR言語にあるエントロピー計算用のライブラリ(entropy)とマルコフ過程用のライブラリ(markovchain)を用いました(そのためR言語のバージョンアップを行い、バージョン4.3.1を使用しています)。状態遷移パターンの出現頻度・確率に関するエントロピーは単純に公開している集計結果をentropyライブラリのentropy関数に渡すだけです。エントロピーは対数の底として何を用いるかにより値が異なりますが、ここでは情報量としてのエントロピーで普通に用いられるlog2を用いました。単純マルコフ過程としてのエントロピーの計算で必要となる定常分布の計算にはmarokovchainライブラリのsteadyStates関数を用いました。steadyStatesには状態遷移マトリクスを渡す必要がありますが、これは集計結果から事前に計算をしておいたものを用いました。(本稿末で公開しているデータに含めてあります。)状態遷移マトリクスの作成は、通常のマルコフ過程の場合の分析の場合には、観測によって得られたサンプルは無限に続く系列の一部であるとして推定の上で行われます。markovchainライブラリでもサンプルの系列を基に、様々なタイプの推定に基づいて状態遷移マトリクスを計算する関数(createSequenceMatrix)が用意されていますが、ここでの分析対象である音楽作品は有限の確定した系列を持っており、前提が異なります。従ってここでは公開済の結果からそのまま生成した状態遷移マトリクスを用いました。 

 これは技術的なディティールに属する話かも知れませんが、サンプルそのものから直接状態遷移マトリクスを作成する際に系列がある特徴を持っている場合、問題が生じます。具体的には、単純マルコフ過程として見た場合なら系列の末尾に出現する和音が、それまでに一度も出現したことがない場合です(多重マルコフ過程なら、多重度に応じた長さの和音の部分系列が末尾のみに用いられる場合です)。その和音に続く和音はありませんから、その和音から他の和音への遷移確率は0となってしまい、状態遷移マトリクスを作成する条件を満たしません。このケースについては、その最後の和音を所謂「吸収的状態」と看做し、その和音に続くのは確率1でその和音自身のみであるという閉包として系列を一つ追加してやることで状態遷移マトリクスを作ることができます(ちなみにこの件とは直接の関係はありませんが、今回対象としている和音の系列は、同一和音の反復を取り除いたものを用いているので、この操作をしなければ同一和音が続く遷移は含まれません)。具体的な作品について単純マルコフ過程として見た場合にこのケースは例外的に感じられるかも知れませんが、例えばピカルディ終止のようなものはたちまちに思い浮かびますし、深さが大きくなり、マルコフ過程としての多重度が上がれば、特定の和音の系列が一度きり作品の末尾にしか出現しないというのはあってもおかしくないように思えます。古典期によく見られるような、末尾に反復記号がついて最初に戻って全く同じ系列が反復されるケースは当て嵌まらない一方で、マーラーが志向したような、文字通りの反復を嫌う有機的な音楽の展開を志向した作品の場合には、寧ろ意図的にそのように末尾が構成される可能性すらあるでしょう。また、曲の長さとは必ずしも関係せず、短い曲であっても(否、寧ろ短い曲の方が)末尾にそれまでに出てこない和音を出して終えるということは起こりそうで、実際に今回の一連の分析にあたって、いつも分析用のプログラムの動作確認や、分析手順の確認のサンプルとして用いている歌曲「私はやわらかい香りをかいだ」の今回の分析用に生成した系列を二重マルコフ過程としてみた場合にそれが起きることを確認しています。しかも状態遷移マトリクスが生成できても、それで問題解決というわけには行かないのです。この点についてはもう一度後で述べますが、結論だけ言えば、吸収的状態を含むマルコフ過程のエントロピーは0になってしまい、作品の特徴を分析するための手段としては意味がなくなってしまいます。本稿では単純マルコフ過程のエントロピーの計算結果のみを示し、深さ2以上の多重マルコフ過程としてのエントロピーの計算結果を示すのを保留したのにはこの点が関わっています。

分析対象のデータ:前回の予備分析と同じで、以下の通りです。(括弧内は以下に示す分析結果におけるラベルを表します。)集計・分析は基本的には曲単位で行いましたが、マーラーの作品に関してのみ、個別の作品毎ではなく全交響曲での集計に基づく計算を一部では行っています。

  • マーラー:第1~10交響曲、大地の歌(m1~10, erde)、全交響曲(all)
  • ブラームス:第1,2,3,4交響曲(jb1,2,3,4)
  • ブルックナー:第5,7,8,9交響曲,第9交響曲フィナーレ断片つき(ab5,7,8,9,9f)
  • フランク:交響的変奏曲、交響曲 (cfsymvar,  cfsym)
  • ラヴェル:左手のための協奏曲、ピアノ協奏曲ト調、優雅で感傷的な円舞曲、ダフニスとクロエ第2組曲 (mr_lpc, mr_pc, mr_vns, mr_dcl)
  • シベリウス:第2,7交響曲、タピオラ (js2,7, jsTapiola)
  • タクタキシヴィリ:ピアノ協奏曲第1番 (ot)  
  • ヤナーチェク:シンフォニエッタ (lj)
  • ドヴォルザーク:第7,8,9交響曲 (dv7,8,9)
  • スメタナ:我が祖国 (bs)
  • カール・シュターミッツ:クラリネット協奏曲第3番、第10番、2本のクラリネットと管弦楽のための協奏曲、フルート協奏曲ト長調作品29,、 ヴィオラ協奏曲ニ長調作品1 (st1, st2, st3, st4, st6)
  • ゼレンカ:聖セシリアのミサ、 聖霊のミサ、信仰のミサ、慈善のミサ、ミゼレーレニ短調 (zwv1, 4, 6, 10, 56)

3.分析結果

(1) 状態遷移パターンの出現確率のエントロピー計算結果

(A)マーラー作品間の比較(深さ=0,1,5のみ)




(B)マーラーと他の作曲家の作品との比較(深さ=0,1,5のみ)




 マーラーの作品間の比較に注目すると、深さ=0,1では概ね後期になると増大していたものが、深さ=5においては後期は寧ろ中期に比べて低下していることがわかります。全般に前回の分析において、和音のパターンや状態遷移パターンが分析対象総数との割合で非常に高い場合において、エントロピーは寧ろ低くなる傾向があることがわかります。
 これはエントロピーの定義そのものがその原因であるらしいことが、以下のような簡単な計算から推測できます。シャノン・エントロピーの場合、2のn乗のパターン数で全てのパターンが等確率で生じる場合にエントロピーは最大となり、nになります。パターン数8(2の3乗)のそれぞれのパターンの発生確率が等確率であれば、エントロピーは3です。逆にエントロピーが小さくなるのは、生起しうるパターンのうちの1つが偏って高確率で生起する場合です。つまりエントロピーはパターン数に応じた量であり、各パターンがそれぞれたかだか1回しか起きない場合には、系列の長さに応じた値となることがわかります。系列長が決まればとりうるエントロピーの上限が決まることになります。
 ここで対象としているのは有限の長さを持った音楽作品の拍のうち、三和音以上が鳴っている箇所を抜き出して作成した系列における和音の出現確率や和音の遷移のパターンの発生確率です。従ってパターンの異なり数の系列の長さに対する割合が100%に近づくケースでは、エントロピーの大きさは系列の長さの影響を受けやすくなることが想定されます。つまり作品自体が長いか、テクスチュアが厚くて三和音以上が鳴っている箇所の割合が大きい作品程エントロピーは高くなります。
 そこでパターン数が決まった時の取りうるエントロピーの最小値と、更に系列長が決まった時に取りうるエントロピーの最大値を計算し、実際の作品の持つエントロピーとの比較をすることによって、とりうるエントロピーの値の幅がどれくらいで、実際の作品のエントロピーがその中のどのあたりに位置しているのかを確認することが考えられます。以下に示すのは、このアイデアに基づく計算の結果です。
 (2-i)のグラフでは青で下限値を、灰色で上限値を示して比較できるようにしています。

(2-i)状態遷移パターンの出現確率のエントロピー計算結果(上下限つき)

(A)マーラー作品間の比較(深さ=0,1,5のみ)




(B)マーラーと他の作曲家の作品との比較(深さ=0,1,5のみ)



 (2-ii)では左側(オレンジ)が下限値とのマージン、右側(青)が上限値とのマージンを表します。
 特に深さ=5においてパターンの異なり数の系列の長さに対する割合が100%に近づくケース(マーラーであれば特に後期作品、他の作曲家との比較においてはマーラーの第1、第6交響曲以外が顕著ですが、それ以外でもフランクの交響曲、ラヴェルやゼレンカの一部作品などが該当します)では、マージンがほとんどないことがわかります。従って、エントロピーについてはマーラーの大地の歌、第9,10交響曲が、より長大で変化に富んだ第6,8交響曲に比べて大きな値をとり得ないことがわかります。

(2-ii)状態遷移パターンの出現確率のエントロピーの上下限とのマージン

(A)マーラー作品間の比較(深さ=0,1,5のみ)



(B)マーラーと他の作曲家の作品との比較(深さ=0,1,5のみ)




 最後に、いよいよマルコフ過程として見た場合のエントロピーを計算した結果を示して、本稿を終えたいと思います。本稿で「深さ」と述べてきたのは、謂わば記憶の深さのことであり、マルコフ過程としてみた場合には多重度に相当します。ここでは比較的簡単に計算できる深さ=1の場合、つまり単純マルコフ過程としてみた場合のエントロピーの計算結果のみを示します。

 実は既に多重度=2のマルコフ過程と看做した場合について計算をしてみたのですが、markovchainライブラリのsteadyStates関数で定常状態を求めるところで、作品によってはある状態のみが確率1となり、他の状態が0となるようなケースが出現することがわかりました。当然この場合、定常状態におけるエントロピーは0となってしまいます。

 実はこのケースは、本稿2節で分析条件について述べた際に触れた吸収的状態の存在が関わっています。ここでは一例として何種類かの和音が1回ずつ順次出現するような系列をもった作品を仮定します。この場合、各和音および状態遷移パターンは等確率に出現しますので、まず和音の出現頻度に関するエントロピーはその系列でとりうる最大値となり、その値は系列長で決まります(系列長が2のn乗なら、エントロピーはnになります)。またこのケースでは単純マルコフ過程の状態遷移マトリクスは、全ての行について、それぞれ異なる1列だけが確率1で残りの列は全て0になりますが、最後に出現する和音の行はその和音に続く和音がないため全体の和が0となってしまうため状態遷移マトリクスが生成できず、そのままでは定常分布の計算もエントロピーの計算もできません。そこで最後に出現する和音についてはクロージャ(閉包)として自分自身のみに確率1で遷移することにします。これにより状態遷移マトリクスが構成でき、それに基づく定常分布の計算はできますが、その結果は最後の和音のみ1で他は0という結果となります。マルコフ過程のエントロピーは状態遷移マトリクスの各行の状態の確率分布のエントロピーをその状態の定常状態における発生確率で乗じたものの総和ですから、結果として1次以上のエントロピーは0になるというわけです。

 ではこのケースは例外的なケースなのかと言えば、実際にはそうとは言えないようです。本稿2節で分析条件について述べた際にも述べた通り、マーラーの作品では歌曲「私はやわらかな香りをかいだ」を二重マルコフ過程として見た場合でも起こりましたし、同様のことが少なくとも第3交響曲、第7交響曲でも起こることを確認しています。これは確認したわけではない推測ですが、多重度が上がれば上がるほど、状態として扱われる和音の系列は長くなるので、末尾に吸収的状態を持つ確率は大きくなると想定されます。

 これは見方を変えれば、離散力学系として見た場合に、必要なだけ長い時間を与えた時、ある音(の系列)に収束してしまうような系に該当するのかも知れません。(実際、三輪眞弘さんの「虹機械」の系列の作品ではそのような力学系が用いられています。ただしそのままではなく、その上で作品構成上の工夫が凝らされているわけですが。)これはウルフラムのセル・オートマトンの分類では、タイプ1の秩序状態になるグループに該当します。こういう言い方をすると、セル・オートマトンのようにタイプ分けができるのではないかという発想になってそれならば面白そうなのですが、現時点でわかっているのは、上記のように、最後にそれまで未知のパターンが現れるという、状態遷移系列全体からすれば局所的な特徴を持つときにそうなるということで、それ以前の系列がどんなものであるかは全く関係がありません。そのような局所的な条件でエントロピーが求まったり求まらなかったりするのだとしたら、その限りにおいては、マルコフ過程としてのエントロピーは作品の特徴づけとしてはあまり適切でないということになるようにも思います。

 これはもともと無限の系列の一部が観測されたものとしてサンプルを扱うマルコフ過程の前提が、決定した有限の長さの系列を持ち、特にその最後の系列に特徴を持ったパターン(音楽理論上は「カデンツ」とか「終止形」と呼ばれるものに対応するものと考えられます)が出現することも珍しくない過去の或る特定の文化的伝統に属する音楽作品という対象にそぐわないという点が露呈されたものと考えることができるように思います。そもそもがそれ自体は統計的な対象ではなく、過去に生成され、閉じた決定論的な過程を持つウニカート(一点もの)な存在である音楽作品の分析を目的として統計的な処理を行うことの持つ意味合いを考えた上で、どのような場合にどのような分析方法を用いるのが適当かを検討すべきように感じます。別のところ(備忘:mathesis singularisとしての「マーラー学」?―アドルノのモノグラフを手掛かりにして―)で、本稿を含む本ブログのアプローチを「個別学」mathesis singuralisとして規定することを試みましたが、「個別学」という観点から、ある分析の結果にどのような意味があるのか、どのような分析が適切なのかが問われているようにも思います。

 結果だけから言えば、今回報告した対象作品に限っては、単純マルコフ過程として見た場合には問題が起こらなかったため、以下にその計算結果を報告しました。一方で既述の通り、二重マルコフ過程として見た場合には上記の問題が起こることを確認しており、しかも繰り返しを厭わずに言えば、それが起きる確率は多重度が増大すればするほど高くなると想像されます。勿論、技術的には、問題となる最後の和音ないし和音の系列を除外した系列で計算をするといった荒っぽい解決方法もあるでしょうし、エントロピーのような巨視的な統計量であれば、必ずしも不適切な操作ではないかも知れないとはいえ、もともとが「カデンツ=終止形」の近似として状態遷移パターンを捉えてその特徴を調べることが目的であったことを思えば、全曲か、個別の楽章かは措いても曲の末尾を取り除いた系列の分析には強い違和感を感じます。そこで差し当たりここでは単純マルコフ過程として見た場合のエントロピーについてのみ、あくまでも参考として報告することにします。繰り返しになりますが、マルコフ過程としてのエントロピーの計算が前提としている「定常状態」を想定することが、ここでの分析の対象と目的にとってどのような意味を持つのかに(控えめに言っても)議論の余地があり、適切なのかに疑念があるからです。その限りにおいては、本稿でここまで報告してきた、無記憶情報源として扱い、状態遷移パターンの単なる出現確率に基づいた計算結果の方が、ここでの主旨に照らした限りでは妥当であるという見方もできるように思います。

(3)(参考)単純マルコフ過程(深さ=1)として見た場合のエントロピー

(A)マーラー作品間の比較

(B)マーラーと他の作曲家の作品との比較


 ここで特徴的に感じられる点を簡単に述べるならば、以下のようになるでしょうか?

(A)マーラーの作品間の比較においては、初期作品は作品の長さに比して素朴で簡素な印象があり、中期作品(ここでは第6、第7に加えて第8)において複雑さが頂点に達したのが、「大地の歌」に至って、初期の素朴さとは異なった意味合いでの「簡潔さ」が現れるが、第9,10は中期と同様の複雑さを備えているといった印象に対応するような結果が得られているように感じます。

 (B)マーラーと他の作曲家の作品との比較においては、マーラーの作品の複雑さは際立っており、和音や状態遷移パターンの多様性においてはマーラーと比肩するレベルにあったラヴェルやシベリウスの作品のエントロピーが必ずしも高くなく、ブルックナーの第5交響曲、フランクの交響曲やドヴォルザークの第7交響曲、スメタナの「我が祖国」といった作品の方が高い値となっていること(ここでもその原因の一つとして作品の長さが関わっているというのは考えられますが、ブルックナーやドヴォルザークの他の作品やブラームスの作品を考えると、それだけではなさそうです)、特にシベリウスでは後期に向けて作品が圧縮される傾向とその内部における多様性の拡大といった相反する傾向がパターンの多様性と単純マルコフ過程としてのエントロピーとの対比によって読み取れるように思われれることが印象的です。


[追記]二重マルコフ過程(深さ=2)として見た場合のエントロピー計算結果

参考までに、二重マルコフ過程(深さ=2)として見た場合に吸収的状態を含むために定常状態が単一の状態に収束してしまい、エントロピーの計算ができなくなるケースについて、吸収的状態を除去して計算した結果を以下に掲げます。吸収的状態を含む作品は、以下の通りです。

  • マーラー:第3交響曲(第1楽章末)(m3)、第7交響曲(第4楽章末)(m7)
  • ブルックナー:第7交響曲(ab7)
  • ラヴェル:ピアノ協奏曲(mr_pc)・優雅で感傷的な円舞曲(mr_vns)
  • ヤナーチェク:シンフォニエッタ(lj)
  • スメタナ:「我が祖国」(bs)
  • ゼレンカ:聖霊のミサ、慈善のミサ、ミゼレーレニ短調 (zwv4, 10, 56)

(A)マーラー作品間の比較(深さ=1(青),2(オレンジ))


(B)マーラーと他の作曲家の作品との比較(深さ=1(青),2(オレンジ))

 なお、個別のどの作品のどこの部分で吸収的状態が生じるかどうかには、今回対象とした系列の性質が少なからず影響することを付記させて頂きます。つまり、今回は、各作品の各拍を対象に、三和音以下(つまり休符・単音・重音のみ)の箇所をスキップし、かつ同じ和音の繰り返しもスキップし、三和音以上からなる系列を各楽章毎に構成し、曲毎にエントロピーを求めています。従って対象の系列には自分自身に遷移するパターンは含まれていません。現実の作品では途中に同じ和音の繰り返し、休止、単音や重音の拍が含まれるので、それらを考慮すれば吸収的状態にはならない可能性があります。

(2023.9.15公開, 9.17-18 技術的な側面での補足を追記。9.21 二重マルコフ過程として見た場合のエントロピー計算結果を追記。9.23 1.はじめに に本稿の分析の制限について追記。)


[付録] 公開データの内容

(A)マーラーの作品間の比較

 gm_A_cdnz3_pcl_transition.zip には以下のファイルが含まれます。

(A-1)入力データ

  • *_A_cdnz3_pcl_transition.csv:状態遷移マトリクス

(A-2)出力データ

  • sym_A_pcls3.xlsx:系列長・パターン数のデータおよびエントロピーの計算結果
(A-3)画像

  • shanon-entropy-pcls(depth=[0-5]).jpg:和音・状態遷移パターンの出現確率に基づくエントロピーのグラフ
  • minmax[0,1,5].jpg:和音・状態遷移パターンの出現確率に基づくエントロピーの計算結果とその上下限の比較グラフ
  • margin[0,1,5].jpg:和音・状態遷移パターンの出現確率に基づくエントロピーの計算結果とその上下限とのマージンのグラフ
  • markov1.jpg:単純マルコフ過程としてのエントロピーのグラフ


(B)マーラーと他の作曲家の作品との比較

 control_A_cdnz3_pcl_transition.zip には以下のファイルが含まれます。

(B-1)入力データ

  • *_A_cdnz3_pcl_transition.csv:状態遷移マトリクス

(B-2)出力データ

  • control_A_cdnz3_pcl.xlsx:系列長・パターン数のデータおよびエントロピーの計算結果

(B-3)画像

  • shanon-entropy-pcls(depth=[0-5]).jpg:和音・状態遷移パターンの出現確率に基づくエントロピーのグラフ
  • minmax[0,1,5].jpg:和音・状態遷移パターンの出現確率に基づくエントロピーの計算結果とその上下限の比較グラフ
  • margin[0,1,5].jpg:和音・状態遷移パターンの出現確率に基づくエントロピーの計算結果とその上下限とのマージンのグラフ
  • markov1.jpg:単純マルコフ過程としてのエントロピーのグラフ

[参考]

 markov_entropy_A_cdnz3_pcl.zip には以下のファイルが含まれます。

(B-1)出力データ

  • markov_entropy_A_cdnz3_pcl:単純マルコフ過程・二重マルコフ過程として見た場合のエントロピー計算結果。数値に*がついている箇所は、吸収的状態を含むため定常状態が収束してしまい、エントロピーの計算ができないため、吸収的状態を除去した計算結果となっています。詳細は記事本文をご覧ください。

(B-2)画像

  • markov2_gmsym.jpg:マーラーの交響曲間の比較
  • markov2_control.jpg:マーラーと他の作曲家の作品との比較


[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。

2023年9月3日日曜日

後期マーラーの「挑戦」?:MIDIファイルを入力とした分析:状態遷移パターンの多様性に注目した予備分析(2023.9.4更新)

1.はじめに

 これまで何回かに亘って、状態遷移の集計方法の検討を行い、検討内容に基づいた集計結果を公開してきました。状態遷移パターンについては今回初めて集計を行ったので、従来やってきた和音(といっても機能和声理論上のものではなく、寧ろピッチクラスセット上で定義される集合ですが)の出現頻度と異なって、土地勘のようなものが全くありません。そこで今後の分析のための予備作業として、集計した状態遷移パターンについて、個別のパターンに踏み込んだ分析を行う前に、記事MIDIファイルを入力とした分析の準備(3):状態遷移の集計手法の検討と集計結果の公開MIDIファイルを入力とした分析の準備(4):状態遷移の集計結果の公開(続き)およびMIDIファイルを入力とした分析の準備(6):状態遷移の集計結果の公開(補遺その2)において「和音・状態遷移パターン種別」として報告・公開しているデータを用いて状態遷移パターンの異なり数について確認してみたところ、マーラーの作品に関して興味深い特徴があるように思われたので、簡単な分析を行ってみました。以下でその内容を報告します。

2.本分析の背景

 「和音・状態遷移パターン種別」として公開しているデータにおいては、これまで集計・公開してきた複数の条件による状態遷移パターンの抽出結果について、遷移パターンの抽出対象となる和音の総数、和音の種類数(状態遷移パターンとしては深さ=0に相当)、深さ1~5までの状態遷移パターン数を集計しています。

 一般にパターン数は、対象となる和音の総数に相対的なものと考えられます。つまり短く小節数が少なく、拍数もまた少ない作品では、同じ複雑さであればパターン数は少なく、大規模になればパターン数が増加するものと考えられます。但しそれでは際限なく拍数を増やしていけばパターン数も比例して増加し続けるかと言えば、ここで対象としているタイプの音楽作品の場合にはそうではなく、同じパターンの繰り返しの割合が増えていくものと想定されます。一方で、反復繰り返しを多く含む作品の場合には、同じ拍数で出現するパターンの数はその程度に応じて少なくなるものと予想されます。このことは、分析の入力として使わせて頂いているMIDIの作り方に、ここで注目しているパターン数が影響を受けることもまた、意味しています。演奏においてもしばしばそうですが、特に古典派の作品の場合、ソナタ形式の楽章の提示部やメヌエットやスケルツォ楽章におけるDa Capoが典型的なように、リピート記号に忠実に繰り返すか省略するかについての選択には任意性がありますが、ここで注目している特徴量はその選択の影響を受けることになります。マーラーの場合に限れば、リピートが問題になるケースというのはあまりなく、第1交響曲第1楽章、第6交響曲第1楽章のソナタ提示部の繰り返しくらいでしょうか?(未完成作品まで含めれば、第10交響曲第3楽章のDa Capoが思いつきますが、これは文字通りの反復を嫌ったマーラー「らしくない」との嫌疑がかけられたりもして物議を醸してきた部分でもあります。更には第5交響曲第2楽章のごく初期の出版譜では提示部に反復記号があるのですが、この稿態が採用されることはまずないでしょう。)更に言えば、上記のような事情を踏まえると、仮に割合が同じだとしても規模が大きく異なる作品間の割合の比較には色々な意味で慎重さが要求されるということでもあると思います。また同様に、個別の作品(各交響曲)と作品全体(交響曲全て)の比較についても注意が必要です。各曲毎にその内部は多様性に富んでいても、「同じような」作品を繰り返し書けば、作品全体としてみれば反復が生じていることになり、単純な各曲における割合の平均にはならず、割合が下がることも考えられるからです。

 こうした事情を勘案すると、マーラーの作品についてはパターン数は多く、多様性に富んでいることが想像されるわけですが、実際にデータを眺めてみると、特に深さが増していくにつれてその傾向が極端になり、深さ4,5のパターンとなると、作品と抽出条件によっては複数回使用されるパターンがほんの僅かしかないことがわかります。特に最後に補遺2で追加した抽出条件のうち、転回形も五度圏上の位置の違いも区別する条件(trans_inではその傾向が著しく、繰り返し用いられるパターンに注目するようなデータ分析が実質的に無意味になってしまいかねない程です。(エントロピーという観点では限りなく1に近づいているということになります。)ここで対象にしているのが和音のパターンであるため、単独の和音パターンの種類数でも100を超えます。状態遷移パターンは最も単純な条件でも、深さをnとすれば和音パターン数のn+1乗の組み合わせが理論的には可能です。実際には深さ2くらいのレベルでは対象となっている拍の総数よりも遥かに小さいパターン数になりますが、深さが深くなるにつれてパターン数は増大していきます。深さ4,5になれば前の状態の理論的な組み合わせは天文学的な数字になるため、実質的は総拍数が上限となります。そこで多様性を測る最も簡単な尺度として、パターンの異なり数が総拍数にどこまで近づくか、という点に注目するやり方が考えられます。本分析では、まずはこの観点からデータを眺めて簡易的な分析をすることにします。

 本分析では、比較的区別が緩い抽出パターンとして、転回は区別せず、五度圏上の位置についても、状態遷移における移動の仕方が同じであれば同一のパターンと看做す条件(default)を用いて分析を行うことにします。

 以下は公開済のパターンの種類数の集計結果を元に、状態遷移パターンについては抽出対象とした三和音以上の和音の総数に対するパターンの種類数の割合を計算し、抽出対象とした三和音以上の和音の総数については、総拍数(休符や単音、重音の箇所も含む)に対する割合を計算した結果を示したものです。割合が1の時、全ての対象和音について全て異なった状態遷移パターンであり、繰り返し利用されるパターンが無いことを意味します。

 ここで割合が1に近いものを視覚的に読み取れるように、0.8以上、0.9以上、0.95以上、0.99以上について、それぞれ異なる背景色をつけてみました。


深さ3以上のパターンではほとんど全ての交響曲で0.8を超えていることが確認できますが、それだけではなく、第6交響曲を除くと、初期は割合が相対的に低く、後期になると高くなるという大まかな傾向が読み取れるように思われます。そこで、従来の和音の出現頻度の分析でも用いてきた創作年代区分で集計したらどうなるか?という疑問が自然に浮かびます。実際に集計をして、更に割合を求めた結果は以下に示す通りです。参考までに、パターン数の全交響曲の単純合計(のべに相当:sum)、全交響曲での集計結果(all)を第1~4交響曲(m1-4)、第5~7交響曲(m5-7)、第8~10交響曲(「大地の歌」を含む:m8-10)とともに示しました。(sumについては割合の計算は意味がないため行っていません。)



 まず全交響曲(all)の集計結果と割合について見て見ると、深さ1では明らかに、同じパターンが複数の交響曲で重複して出現していることが読み取れます(重複率は85%にも及びます。)しかし深さ2では50%近くまで下がり、深さ3では10%程度、深さ4,5では1%程度となり、ほとんど重複がないことがわかります。同じ和音を用いながら、状態遷移パターンとしては深さが深くなれば各曲毎に異なったパターンが用いられていることが窺い知れます。

 次に創作時期別の傾向を確認してみると、個別の交響曲毎に読み取れた傾向が時期毎の全体を対象にしたパターン抽出の結果からも読み取れることがわかります。状態遷移パターンの異なり数、つまりマーラーの場合、後期に行くに従ってパターンの多様性は拡大傾向にあるということが明確に読み取れると思います。各時期毎の対象拍数は大きく異ならず、相対的には初期が大きく、中期が小さく、後期がその中間ですが、深さ0にあたり和音単独でのパターンの割合はほとんど同じであるにも関わらず、状態遷移パターンについて言えば、深さが深くなるにつれて後期の方が多様性に富むとう傾向は明らかなように思われます。

 これは少なくとも私にとっては驚くべき結果で、ここでもマーラーが、所謂「発展的な」作曲家であるということが、状態遷移パターンの多様性というシンプルが特徴量の上で明確に読みとれることがわかったことになります。これまでも状態遷移の分析にあたって参照してきた大黒達也さんの『音楽する脳』では、「ベートーベンの挑戦」と題された節(p.123)において、「脳の統計学習の計算モデルを用いて、ベートーベンの『ピアノソナタ』全曲の不確実性(情報エントロピー)を解析した」(同頁)結果が示されていますが、そこでは後期に至って飛躍的にエントロピーが増大するという結果を以て、「昔から新しい不確実な音楽への挑戦に非常に意欲的だったといわれてい」(同頁)るベートーベンが、実際に「生涯、常に新しい音楽を求めて曲を作り続けて来たのかもしれない」(p.124)とされていますが、本稿では、遥かに初歩的な集計結果の比較という、素朴なやり方ではありますが、状態遷移パターンの異なり数の比較を通して、マーラーもまた「発展的な」作曲家であったことの傍証となりうる結果が得られたのではないかと思います。分析の手法は異なりますが、アドルノが「後期様式」というものをとりわけてもベートーヴェンとマーラーについて述べたことが恣意ではなく、優れた音楽的資質に恵まれていたらしいアドルノの、その経験に基づく直観に根差した指摘ではなかったかとも感じました。

 なおここでは直接エントロピーの計算はしていませんが、マルコフ過程であれば多重度に相当する深さに応じた過去の値の系列(状態)から次の値への遷移の条件つき確率をベースに定常分布における状態の期待値の確率としてエントロピーが計算されることを考えれば、例えば出現頻度が1である状態がほとんどを占めるような系列は高エントロピーの系であると推測できます。更に創作時期を追う毎に異なるパターンの割合が増えていく傾向があるということから、マーラーの場合もベートーヴェンの場合と同様、創作時期を追う毎にエントロピーが増大する傾向であろうことも推測できます。勿論、厳密には計算が必要ですが、ここではエントロピーの肌理の粗い近似として状態遷移パターンの多様性を用いていることになるかと思います。

 さて、ここまではマーラーの作品間の比較を行ってきましたが、それでは他の作曲家の作品の場合はどうなのでしょうか?直近の、旋法性に関わる和音の出現頻度に関する分析において比較対照のために取り上げた作曲家・作品との比較がまず思い浮かびますが、ここでも状態遷移パターンについては初めて集計結果に接したこともあって、より広い範囲での展望を得ておきたく、時代を遡ってバロック期や古典期の作品ではどうであるかについても一瞥してみることにしました。結果として前回の実験と同じ作曲家の同じ作品に加えて、古典期とバロックの作品の例としてシュターミッツとゼレンカの作品を加えた以下のデータセットについて集計・分析を行うことにしました。(括弧内は以下に示す分析結果におけるラベルを表します。)

  • マーラー(mahler):第1~10交響曲、大地の歌(m1~10, erde)
  • ブラームス(brahms):第1,2,3,4交響曲(jb1,2,3,4)
  • ブルックナー(bruckner):第5,7,8,9交響曲,第9交響曲フィナーレ断片つき(ab5,7,8,9,9f)
  • フランク(franck):交響的変奏曲、交響曲 (cfVar,  cfSym)
  • ラヴェル(ravel):左手のための協奏曲、ピアノ協奏曲ト調、高雅で感傷的な円舞曲、ダフニスとクロエ第2組曲 (mr_leftpc, mr_pc, mr_vns, mr_dcl)
  • シベリウス(sibelius):第2,7交響曲、タピオラ (js2,7, jsTapiola)
  • タクタキシヴィリ(taktakishvili):ピアノ協奏曲第1番 (ot)  
  • ヤナーチェク(janacek):シンフォニエッタ (lj)
  • ドヴォルザーク(dvorak):第7,8,9交響曲 (dv7,8,9)
  • スメタナ(smetana):我が祖国 (bs)
  • カール・シュターミッツ(stamitz):クラリネット協奏曲第3番、第10番、2本のクラリネットと管弦楽のための協奏曲、フルート協奏曲ト長調作品29,、 ヴィオラ協奏曲ニ長調作品1 (st3cl, st10cl, stdpcl, stfscgd, stt_vacon)
  • ゼレンカ(zelenka):聖セシリアのミサ、 聖霊のミサ、信仰のミサ、慈善のミサ、ミゼレーレニ短調 (zwv1, 4, 6, 10, 56)
以下にまず集計結果を示します。まずブルックナーとブラームスです。


次いで、フランク、ラヴェル、シベリウス、タクタキシヴィリです。


最後に、ヤナーチェク、ドヴォルザーク、スメタナ、シュターミッツ、ゼレンカの結果です。


 まず今回追加したシュターミッツとゼレンカについて確認すると、古典期を切り開いたマンハイム楽派の代表的存在であるシュターミッツの方が、時代的には先行するが、しばしば同時代で交流もあったJ.S.バッハと比較されることもあるゼレンカの作品よりも状態遷移パターンに関してシンプルであると言う傾向が明確に読み取れると思います。

 ブルックナー、ブラームスはスメタナやドヴォルザークとともにマーラーに先行する世代ですが、ドヴォルザークの第7交響曲を例外として、後はいずれもシュターミッツ程ではないにせよ、状態遷移パターンに関しては相対的にシンプルであると言えそうです。一方でフランク、ラヴェル、シベリウス、タクタキシヴィリは相対的にパターンの多様性が確認できるグループですが、マーラーにおいては初期と同程度であるに過ぎず、マーラーの中期以降、特に後期の作品における多様性が際立つ結果となりました。実際マーラー以外では、ラヴェル、シベリウス、タクタキシヴィリの一部の作品の深さ5のパターンでようやく95%が出現する程度であり、マーラーのように深さ4,5が軒並み95%以上といった値は他には見当たりませんし、99%以上に達するケースはありませんでした。ヤナーチェクもマーラーとほぼ同時代の作曲家ですが、ここで取り上げたシンフォニエッタが典型的にそうであるように、短い動機や旋律の繰り返しを構成原理とする、どちらかというとミニマリズム的な傾向があることが、ここでは状態遷移パターンの相対的な少なさとして確認できるように思います。

 以上、ここまでは集計された状態遷移パターンの異なり数についての集計結果に基づく、ごく初歩的な確認によって、マーラーの交響曲間、マーラーと他の作曲家の作品間の比較において、比較的明確に区別ができそうな見通しが得られたと考えます。そこで以下では、これ迄に得られた見通しに基づいて、更に状態遷移パターンの異なり数に関するデータを用いたクラスタ分析・主成分分析を行った結果を報告します。

3.分析条件

 上記のような検討から、従来、和音の出現頻度に対して適用した統計分析を状態遷移パターンにも適用することとし、以下のようにレイアウトした分析を行うことにしました。

対象とするデータ:上記の検討において検討の対象としたデータには、状態遷移パターン抽出の対象である三和音以上の拍数に対する状態遷移パターンの異なり数の割合とともに、総拍数と三和音以上の拍数(=状態遷移パターン抽出の対象)の割合についての集計も含まれていましたが、これは意味的にはテクスチュアの厚みに関わる特徴量と捉えることができ、反復/多様性に関する特徴量である状態遷移パターンの異なり数とは意味的に異質の情報であると考えられます。そこで以下の分析においては、総拍数と三和音以上の拍数(=状態遷移パターン抽出の対象)の割合については分析対象から除外しました。状態遷移パターンについては深さ0(単独の和音に相当)~深さ5まで全てを用いました。

分析手法:従来和音の出現頻度の分析で用いたのと同じ、階層的クラスタ分析、非階層的クラスタ分析、主成分分析を行いました。階層的クラスタ分析としては、今回はcomplete法とward法の2種類、非階層クラスタ分析はk-means法を用い、Gap統計量に基づいてクラスタ数を指定しました。主成分分析に際しては、今回対象とする特徴量は全て同じ種類であり、かつ最大値1という点でも揃っていますが、状態遷移の深さが増すと増大する性質を持つため、標準化を行わないと深さの大きいパターンの寄与が大きくなってしまうことが予め予想されたため、標準化を行うモードで分析を行いました。

分析対象のデータ:上述の通り、前回の実験と同じ作曲家の同じ作品に加えて、古典期とバロックの作品の例としてシュターミッツとゼレンカの作品を加えた以下のデータセットについて集計・分析を行うことにしました。(括弧内は以下に示す分析結果におけるラベルを表します。)集計・分析は基本的には曲単位で行いました。

  • マーラー(mahler):第1~10交響曲、大地の歌(m1~10, erde)
  • ブラームス(brahms):第1,2,3,4交響曲(jb1,2,3,4)
  • ブルックナー(bruckner):第5,7,8,9交響曲,第9交響曲フィナーレ断片つき(ab5,7,8,9,9f)
  • フランク(franck):交響的変奏曲、交響曲 (cfsymvar,  cfsym)
  • ラヴェル(ravel):左手のための協奏曲、ピアノ協奏曲ト調、優雅で感傷的な円舞曲、ダフニスとクロエ第2組曲 (mr_leftpc, mr_pc, mr_vns, mr_dcl)
  • シベリウス(sibelius):第2,7交響曲、タピオラ (js2,7, jsTapiola)
  • タクタキシヴィリ(taktakishvili):ピアノ協奏曲第1番 (ot)  
  • ヤナーチェク(janacek):シンフォニエッタ (lj)
  • ドヴォルザーク(dvorak):第7,8,9交響曲 (dv7,8,9)
  • スメタナ(smetana):我が祖国 (bs)
  • カール・シュターミッツ(stamitz):クラリネット協奏曲第3番、第10番、2本のクラリネットと管弦楽のための協奏曲、フルート協奏曲ト長調作品29,、 ヴィオラ協奏曲ニ長調作品1 (st3cl, st10cl, stdpcl, stfscgd, stt_vacon)
  • ゼレンカ(zelenka):聖セシリアのミサ、 聖霊のミサ、信仰のミサ、慈善のミサ、ミゼレーレニ短調 (zwv1, 4, 6, 10, 56)


4.分析結果

(A)マーラーの交響曲間の比較

2つの階層クラスタ分析の結果は同一となり、大地の歌、第9,10交響曲の後期3作品とそれ以前の作品で大きく2つに分かれ、それ以前の作品は更に、ソナタ楽章の提示部反復を含む第1、第6交響曲がまず分かれ、残りが更に第2,3,8交響曲と第4,5,7交響曲に分かれる結果となりました。




次いで非階層クラスタ分析ですが、クラスタ数を決めるためのGap統計量は、何回かシミュレーションするとかなりの揺れを示しますが、概ね2,4あたりが常に小さい値となる傾向が見られたため、クラスタ数2の場合とクラスタ数4の場合の2パターンの分析を行いまいした。

クラスタ数=2の場合には、2種の階層クラスタ分析の結果と同様、(1)大地の歌、第9,10交響曲の後期3作品とそれ以前の作品である(2)第1~第8交響曲で大きく2つに分かれます。

      res
ans    1 2
symA 0 4 : 初期(第1~4交響曲)
symB 0 3:中期(第5~7交響曲)
symC 0 1:第8交響曲
symD 3 0:後期(大地の歌、第9,10交響曲)

m1   m2   m3   m4   m5   m6   m7   m8 erde   m9  m10 
   2      2      2      2      2      2     2     2      1      1      1 




クラスタ数=4の場合も2種の階層クラスタ分析の結果と同様の結果となっています。即ち、(1)大地の歌、第9,10交響曲の後期3作品のグループ、(2)第4,5,7交響曲のグループ、(3)第2,3,8交響曲のグループ、(4)第1,6交響曲のグループに分かれています。

        res
ans    1 2 3 4
symA 0 1 2 1 : 初期(第1~4交響曲)
symB 0 2 0 1:中期(第5~7交響曲)
symC 0 0 1 0:第8交響曲
symD 3 0 0 0:後期(大地の歌、第9,10交響曲)

  m1   m2   m3   m4   m5   m6   m7   m8 erde   m9  m10 
    4      3      3      2      2      4      2      3      1      1      1 


上掲のkmeans法によるクラスタ分析結果のclusplotによる表示は、主成分分析での第1主成分を横軸、第2主成分を縦軸としたものですが、主成分分析の結果を方を次に確認します。以下のprcompの結果は、第1主成分軸の正負が逆転しているため、clusplotの表示に対して左右が反転していますが、同様の結果が得られていることが確認できます。


                               PC1     PC2      PC3      PC4      PC5      PC6
Standard deviation       2.0935 1.1922 0.43063 0.09385 0.03863 0.01294
Proportion of Variance  0.7305 0.2369 0.03091 0.00147 0.00025 0.00003
Cumulative Proportion  0.7305 0.9674 0.99826 0.99972 0.99997 1.00000

 主成分分析のサマリーを確認すると、第3主成分までで累積が99.8%であり、それ以下の成分の寄与は実質的にほとんどないことから、以下では第1~3主成分までに絞って見ていくことにします。

 以下の横軸を第1主成分、縦軸を第2主成分としたggbiplotの表示では、時代区分毎に楕円で囲われるため、後期(大地の歌、第9,10交響曲)が比較的均質であるのに対し、初期と中期は第1交響曲、第6交響曲というソナタ提示部反復を持つ作品とその他の作品との距離が大きく、特に7割以上の割合を占める第1主成分側での違いが大きいために、それぞれの楕円は大きく横に広がる結果となっています。総体としては第1・第2主成分の組み合わせによって、中心より左上側に固まっている後期/右下側に広がっている初期・中期というように分類できそうで、この結果はクラスタ分析の結果とも一致しています。
以下は第2主成分を横軸、第3主成分を縦軸にした表示ですが、ここで興味深いのは、割合的には3%程度で限定されますが、第3主成分で初期と中期が中心の下側・上側に分かれる点が興味深く思われます。

上記を踏まえて、各主成分の得点と負荷を確認してみます。

まず得点ですが、第1主成分では大まかな傾向として、+方向の初期、ほぼ0に近い中期と-方向の後期という対照が見られるように思います。但し、第1、第6交響曲はソナタ提示部の反復などから点数が高くなっている点を考慮にいれるべきかと思われます。第2主成分については、第1、6と後期のグループ(+)と第2~5、第7、第8のグループ(-)とに分かれていることが確認できます。割合が小さいため得点の絶対値が小さくなってしまっていますが、第3主成分は、-方向の初期、+方向の中期に対し、後期は作品によってばらつくもののほぼ0に近いと捉えることができそうです。

一方負荷を見ると、第1主成分は、深さによらず状態遷移パターンの多様性が低いものの得点が高くなることがわかります。第2主成分は状態遷移パターンの深さ0から5に向けて負荷が+から-に変化しており、深さが浅いパターンの多様性が大きく、深さが深いパターンの多様性が小さければ得点が高くなることが読み取れます。つまり単純な和音単独の多様性や(前、後)という短い状態遷移パターンでより多様性が大きく、深さが増す(つまり状態遷移パターンの系列の長さが長くなる)に従って多様性が相対的には限定される傾向にあると点数が高くなるということで、多様性が局所的(浅い)なのか、大域的(深い)なのかに関わっているように思います。そしてこのパターンに当て嵌まるのが第1、6と後期のグループであり、第2~5、第7、第8のグループはこれに当て嵌まらない、言い換えれば和音のパターンや浅い部分の状態遷移パターンはそうでもないが、深くなると急激に多様性が増す傾向があることになります。それに対して第3主成分は同様にして、和音単独と深いパターンで多様性が低く、浅いパターンについて多様性が高いものの得点が高くなることが窺えます。

第1主成分得点



第2主成分得点


第3主成分得点

第1主成分負荷



第2主成分負荷



第3主成分負荷


(B)マーラーと他の作曲家の作品間の比較

 続けてマーラーの交響曲と他の作曲家の作品の比較結果を見ていきます。

 最初は階層クラスタ分析です。complete法の結果とward法の結果には細かいところでは差異がありますが、大きく、マーラーが含まれるグループとマーラーが含まれないグループに分かれている点、マーラーが含まれるグループには、フランク、シベリウス、ラヴェル(左手のための協奏曲除く)、タクタキシヴィリが含まれる点は共通しています。ドヴォルザークは第7交響曲のみマーラーが含まれるグループに含まれています。




非階層クラスタ分析のクラスタ数を決めるためのギャップ統計量の推計では、クラスタ数=4が比較的安定してギャップが小さいという結果が得られたため、クラスタ数=4でkmeans法によるクラスタリングを行いました。clusplotによるプロットを見ると明らかなように、後で見る主成分分析における第一主成分方向右から左に以下のように4つのグループが出来ています。第一主成分がどのような特徴を示しているかは、主成分分析の結果で確認することにします。

1:マーラー、フランク:交響的変奏曲、シベリウス第7、ラヴェル:ピアノ協奏曲、ダフニスとクロエ第2組曲
2:タクタキシヴィリ、ゼレンカzwv4,10,56、フランク:交響曲、ドヴォルザーク第7、マーラー第1、6、シベリウス:タピオラ、ラヴェル:高雅で感傷的な円舞曲
3:ブラームス、ブルックナー、スメタナ、ドヴォルザーク第8、ヤナーチェク、シュターミッツ:クラリネット協奏曲第3、フルート協奏曲、ヴィオラ協奏曲、ゼレンカzwv1,6、ラヴェル:左手のための協奏曲、シベリウス第2
4:シュターミッツ:クラリネット協奏曲第10、2本のクラリネットのための協奏曲、ドヴォルザーク第9

               res
ans               1 2 3 4
brahms          0 0 4 0
bruckner        0 0 5 0
dvorak           0 1 1 1
franck            1 1 0 0
janacek          0 0 1 0
mahler-early   2 1 0 0
mahler-late     4 0 0 0
mahler-middle 3 1 0 0
ravel              2 1 1 0
sibelius           1 1 1 0
smetana         0 0 1 0
stamitz           0 0 3 2
taktakishvili     0 1 0 0
zelenka           0 3 2 0

m1        m2        m3        m4        m5        m6        m7 
  2         1         1         1         1         2         1 
m8      erde        m9       m10       ab5       ab7       ab8 
  1         1         1         1         3         3         3 
ab9      ab9f       jb1       jb2       jb3       jb4     cfsym 
  3         3         3         3         3         3         2 
cfsymvar mr_leftpc     mr_pc    mr_vns    mr_dch       js2       js7 
  1         3         1         2         1         3         1 
jsTapiola        ot        lj       dv7       dv8       dv9        bs 
  2         2         3         2         3         4         3 
st3cl    st10cl    stdpcl   stfscgd stt_vacon      zwv1      zwv4 
  3         4         4         3         3         3         2 
zwv6     zwv10     zwv56 
  3         2         2 

主成分分析のサマリーを見ると、第1主成分で76%、第2主成分で20%、第3主成分で3%の割合を占め、この3つで99%以上の割合となっているので、この3成分に絞って調べていきます。以下のprcompの結果の第1主成分、第2主成分のbiplotによる表示、ggbiplotによる表示はいずれも横方向の第1主成分軸(左右)の方向について階層クラスタ分析と同じですが、第2主成分軸(上下)の方向については正負が逆転しています。ここではマーラーは中心から右上隅に集中しており、第1主成分、第2主成分の両方において明確な傾向があることが確認できます。


                               PC1     PC2      PC3      PC4      PC5      PC6
Standard deviation       2.1391 1.0858 0.46827 0.15237 0.05030 0.01415
Proportion of Variance  0.7626 0.1965 0.03655 0.00387 0.00042 0.00003
Cumulative Proportion  0.7626 0.9591 0.99568 0.99954 0.99997 1.00000

ggbiplotでは、緑色から青緑色の楕円がマーラーの作品を表しており、第1、第2主成分でのプロットでは第1象限(右上隅)に固まっていること、第2,第3主成分でのプロットでは第4象限(右下隅)に固まっている様子が窺えます。

そこで主成分得点、主成分負荷について確認すると、第1主成分負荷については、マーラー作品間の分析における第1主成分負荷と正負が逆転しているものの、ほぼ同様の傾向を示しており、特に状態遷移パターンが多様性に富んでいることを示しています。第1主成分得点について見ても、マーラーの作品の部分だけ見ると(正負は逆ですが)同じように後期作品になるとパターンの多様性が大きくなるという明確な傾向が見られます。ただし他の作曲家の作品との比較では、マーラーの作品全体が相対的に多様性が大きいため全てが正の得点を持ち、ブルックナー、ブラームス、シュターミッツ、ドヴォルザーク第8、第9、ヤナーチェクが負の得点を持つのと対照を示しています。

 第2主成分負荷について見ると、こちらもマーラー作品間の分析における第2主成分と似た傾向を持ち(ただし正負の向きは逆)、単独の和音のパターンを深さ=0の状態遷移パターンと見做すならば、状態遷移パターン多様性が、深さが深くなるにつれて増している場合に得点が高くなります。興味深いことに、第2主成分得点について見ると、第1主成分得点では同様の傾向を示していたマーラーとラヴェル、シベリウスの傾向がわかれ、マーラーは正の得点を持つのに対して、ラヴェルとシベリウスは大まかには負の得点を持っており、第1・第2主成分の組み合わせによって特徴づけることができそうです。即ち、

  • 全般に多様・深い程多様:マーラー(特に初期・中期)
  • 全般に多様・浅い方が多様:ラヴェル・シベリウス

という傾向が取り出せそうです。ただしマーラーについては、マーラーの作品間の分析でもその傾向が確認できたように、和音のパターンや状態遷移パターンの浅い部分が単純で、深くなると急激に多様性が増す初期・中期と、そうした傾向が強くは現れない後期の作品に明確に分かれていることも確認できます。シベリウスやラヴェルは、用いられている和音の種類は豊富で多様性に富みますが、状態遷移パターンが深くなる(より長い系列に注目する)とマーラーと比べた場合には、それほど多様性が増すわけではないことが確認できます。

 更に第3主成分について見ると、これも正負の逆転があるのでその点を考慮すると、細かい部分では差異があるもののマーラーの作品間の分析での第3主成分と大まかには似た傾向を示していることがわかります。つまり、単独の和音の多様性と状態遷移パターンの多様性を区別してみたときに、和音も多様で状態遷移パターンの深いところが多様な作品が正の得点を持ち、逆に和音の多様性よりも状態遷移パターンの浅いところの多様性が大きい作品は負の値と持つことになります。割合が3%と小さいため、得点の絶対値は小さなものですが、第3主成分方向に作曲家を分類すれば、大まかには以下のようになりそうです。

  • 和音も多様で状態遷移パターンの深いところが多様:シベリウス、ラヴェル、ゼレンカ、シュターミッツなど
  • 和音の多様性よりも状態遷移パターンの浅いところの多様性が大:マーラー、ブルックナー、ドヴォルザークなど

第1主成分得点



第2主成分得点



第3主成分得点

第1主成分負荷



第2主成分負荷



第3主成分負荷

5.まとめ

 本稿では、単独の和音や状態遷移パターンの多様性に注目して、マーラーの作品間の比較、マーラーと他の作曲家の作品との比較を行いました。その結果として、両方の分析に共通して、大まかに以下のような特徴が取り出せることがわかりました。(正負の向きは個別の分析では逆転する場合がありますが、ここでは個別の場合の向きは捨象して、以下に記載の方向に向きを統一して話を進めさせて頂きます。)
  • 第1主成分:全般的な多様性(+:多様/-:多様でない)
  • 第2主成分:状態遷移の深さと多様性の関係(+:深さに応じて多様性拡大/-:和音は多様だが、深くなっても多様性拡大せず)
  • 第3主成分:和音の多様性と状態遷移の多様性の関係(+:和音が多様で、深い状態性も多様/-:状態遷移の深さの浅い部分の多様性が大きい)
上記の3つの特徴について作曲家・作品についておおまかな傾向を整理すると、マーラーは他の作曲家との比較においては、全般的な多様性(+)、深さに応じて多様性拡大(+)、和声単独の多様性よりも状態遷移の深さの浅い部分の多様性が大きい(-)という特徴により他と区別できると言えそうです。一方で、マーラーの作品間の比較においては以下のように特徴づけられそうです。
  • 全般的な多様性:後期になると多様性が増大する傾向がある。
  • 状態遷移の深さと多様性の関係:第1、第6交響曲と後期作品は和音のパターンや浅い状態遷移パターンが多様であり、状態遷移パターンが深くなっても多様性が更に拡大することはないのに対して、その他の交響曲では深くなると多様性急激に拡大する傾向にある。ただし全般的な多様性との関係から、第1、第6では大規模な反復が存在するせいで深くなっても多様性が拡大しないのに対し、後期は既に和音のパターンや浅い状態遷移パターンで大きな多様性を示してしまっているために、深くなってもそれ以上多様性が拡大する余地がないのであって、第1、第6とは理由が異なる。
  • 和音の多様性と状態遷移の多様性の関係:初期は和音が多様で、深い状態性も多様なのに対し、中期は状態遷移の深さの浅い部分の多様性が相対的に大きい。
 全般として、マーラーの作品は状態遷移の多様性において際立っていますが、更に後期になればなるほど多様性が増大し、深い状態遷移パターンにおいては多様性が極限まで拡大していくという点がユニークな特徴であると言えるのではないかと思います。この点に関して思い浮かぶのは、本分析の背景のところで触れたことの繰り返しになりますが、大黒達也『音楽する脳』の「ベートーベンの挑戦」と題された節(p.123)において、「脳の統計学習の計算モデルを用いて、ベートーベンの『ピアノソナタ』全曲の不確実性(情報エントロピー)を解析した」(同頁)結果が示されていますが、そこでは後期に至って飛躍的にエントロピーが増大するという結果を以て、「昔から新しい不確実な音楽への挑戦に非常に意欲的だったといわれてい」(同頁)るベートーベンが、実際に「生涯、常井新しい音楽を求めて曲を作り続けて来たのかもしれない」(p.124)とされている点です。
 本稿では、多重マルコフ過程としてのエントロピーを計算することはせず、遥かに初歩的なパターンの異なり数集計結果の比較やクラスタ分析・主成分分析という素朴なやり方ではありますが、状態遷移パターンの多様性の比較を通して、マーラーもまた「発展的な」作曲家であったことの傍証となりうる結果が得られたのではないかと思います。
 個別の作品について見ると、ソナタ楽章における提示部反復が存在する第1交響曲、第6交響曲は、マーラーに先行する作品と共通する部分が大きく、「古典的」な傾向を持つのに対して、それ以外の作品は機械的な文字通りの反復を嫌い、有機体的な絶えざる発展を重んじたマーラー自身の意図通りに、その作品における状態遷移パターンは他の作曲家との比較においても極めて多様であること、更に全体として深さが深くなればなるほど(マルコフ過程としてみた場合には多重度が大きくなればなるほど)同一パターンが繰り返し使用される傾向が低くなる度合いが大きいという点において徹底している点が印象的です。しかも、その傾向が創作年代を追う毎に強くなり、マーラーの作品の中ではいわゆる「後期」作品の特徴、最近特に個人的に関心を抱いているマーラーにおける「老い」と関係した、ジンメル=アドルノの言うところの「後期様式」に関わる統計上の特徴が発見できたことは興味深く、正直に言えば、本稿で報告したような、状態遷移パターンの中身には立ち入らない、単なる多様性の分析のみで上述のような明確な結果が得られるとは予期しておらず、率直に言って驚きを感じました。アドルノは特にベートーヴェンとマーラーを対象として後期(晩年)様式について語り、大黒さんはベートーヴェンの後期ピアノソナタを対象にして、その「挑戦」を語りましたが、状態遷移パターンの多様性、エントロピーといった側面から、ベートーヴェンと同様にマーラーもまた「挑戦」を続けたことが示されたと言っていいのではないでしょうか?
 更に言えば、例えばマーラーの作品間、マーラーと他の作曲家の分析の両方において、主成分分析によって得られた上位3つの主成分が似た特徴を持っているという点は、単なる偶然である可能性も勿論否定できませんが、そのそれぞれが何等かの「意味」と関係している可能性も感じられ、更なる考察、分析を続ける価値があるように思っています。(2023.9.3公開, 9.4 主成分第2分析の第2主成分についてのマーラーの作品に関する記述を訂正するなど加筆。)

[付録]ダウンロード可能なアーカイブファイル和声状態遷移パターン数分析.zip の中には以下のファイルが含まれます。

(A)マーラーの交響曲間の比較(フォルダ名gm_sym)

(A1)入力データ
 gm_sym_cdnz.csv:分析対象の
 gm_sym_col.csv:対象作品の作曲家に対応した色(主成分得点グラフで使用)
 gm_sym_label.csv:対象作品の作曲家名ラベル

(A2)主成分分析結果
 eigen.jpeg:固有値のグラフ
 prcomp_T.jpeg:主成分分析(scale=T)結果のbiplotグラフ
 ggbiplot12.jpeg:主成分分析結果(第1,第2成分)のggbiplotグラフ
 ggbiplot23.jpeg:主成分分析結果(第2,第3成分)のggbiplotグラフ
 pr_score-[1-3]T.jpeg:主成分得点のbarplotグラフ
 prcomp_PC[1-3].jpeg:主成分負荷量のbarplotグラフ

(A3)階層クラスタ分析系:
 hclust_complete.jpeg:complete法での分類結果
 hclust_wardD2.jpeg:ward法での分類結果

(A4)非階層クラスタ分析系:
 clusGap.jpeg:ギャップ統計量のシミュレーション結果サンプル
 kmeans2.csv:kmeans法(クラスタ数=2)での分類結果
 kmeans2.jpeg:kmeans法(クラスタ数=2)での分類結果のclusplotグラフ
 kmeans3.csv:kmeans法(クラスタ数=3)での分類結果
 kmeans3.jpeg:kmeans法(クラスタ数=3)での分類結果のclusplotグラフ

(A5)分析履歴
 hist.txt:R言語を用いた分析履歴(Windows版R言語 ver.4.1.0をR studio上で実行)。
 主成分分析結果サマリを含む。

(B)マーラーと他の作曲家の作品の比較(フォルダ名gm+control)

(B1)入力データ
 gm_control_cdnz.csv:分析対象の和音形(maj, maj46, min, dom7, dom9, add6, penta, ganz, ganz-1, ganz-2) の分析対象作品毎の出現割合
 gm_control_col.csv:対象作品の作曲家に対応した色(主成分得点グラフで使用)
 gm_control_label.csv:対象作品の作曲家名ラベル

(B2)主成分分析結果
 eigen.jpeg:固有値のグラフ
 prcomp_T.jpeg:主成分分析(scale=T)結果のbiplotグラフ
 ggbiplot12.jpeg:主成分分析結果(第1,第2成分)のggbiplotグラフ
 ggbiplot23.jpeg:主成分分析結果(第2,第3成分)のggbiplotグラフ
 pr_score-[1-3]T.jpeg:主成分得点のbarplotグラフ
 prcomp_PC[1-3]T.jpeg:主成分負荷量のbarplotグラフ

(B3)階層クラスタ分析系:
 hclust_complete.jpeg:complete法での分類結果
 hclust_wardD2.jpeg:ward法での分類結果

(B4)非階層クラスタ分析系:
 clusGap.jpeg:ギャップ統計量のシミュレーション結果サンプル
 kmeans4.csv:kmeans法(クラスタ数=6)での分類結果
 kmeans4.jpeg:kmeans法(クラスタ数=6)での分類結果のclusplotグラフ

(B5)分析履歴
 hist.txt:R言語を用いた分析履歴(Windows版R言語 ver.4.1.0をR studio上で実行)。
 主成分分析結果サマリを含む。

[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。