グスタフ・マーラー

2020年1月26日日曜日

アメリカの消防士のゴング？：第10交響曲についてのアドルノの言及を巡って（2020.1.28更新）

　アドルノの『マーラー』の最後の章「長きまなざし」の中に、第10交響曲の「プルガトリオ（煉獄）」末尾のゴング（タムタム）に関する言及があるのだが、以前この部分を読んだ時に、「おやっ」と思って記したメモが残っている（実はメモのままこのブログの記事として公開状態にある）。もともとが雑多な覚えの末尾に、その直前のメモの主題とは全く別に、おまけのようにそのことを書き記したこと自体、実は半ば忘却の彼方に去っていたのだが、どなたかがその「メモ」を読んで下さったお蔭で思い出したので、感謝の気持ちを籠めて、些事ではあるけれど備忘としてここで取りあげて置くことにする。

　問題のアドルノの文章は以下の通りである。

(...) Diesem könnte die Geschichte von dem Tamtamschlag des Feuerwehrmanns in Amerika entlehnt sein, der Mahler einen traumatischen Schock versetzt haben soll und der wohl am Ende des »Purgatorio«-Fragments aus der Zehnten Symphonien wiederkehrt; (...)

(…)マーラーに精神的外傷（トラウマ：原文ルビ）のようなショックを与え、第十交響曲の「プルガトリオ」断片の最後に再び出てくる、アメリカの消防士のゴング（タムタム）の音はカフカから引きついだのかもしれない。（…）

Taschenbuch版全集第13巻pp.291-292, 龍村訳 pp.191～192

前後を読むと、ここではカフカについて論じられているのだが、私が気になったのはその本来の論旨から言えば、どちらかといえば些末な事実に関することであった。アルマの『回想と手紙』の読者であれば、否、そうでなくても、第10交響曲についての作品解説の類でも良く参照されるので、それを通じて知っている人も多いだろうが、アルマの『回想』の中にアドルノが言及しているエピソードが出て来はしても、それは厳密に言えば、アドルノが述べている通りではないのである。

　アドルノのモノグラフの全訳としては2つ目の訳業ということになる龍村訳にはかなり豊富な訳注がつけられており、ここの部分にも訳注が付けられているので、それを参照した読み手は、もう一度「おやっ」と思うことになる。そこでは

「アルマ・マーラーによると、第十交響曲の葬送のゴング（タムタム）は、ニューヨークで夫妻がホテルの窓から見た、殉死した消防士の葬儀の印象に由来しているという。」（龍村訳　訳注（VIII　長きまなざし）*8 p.259）

と述べられており、ミッチェル版の『回想』の対応箇所のページ数が記されているのである。つまりこの訳注では、恰もアドルノの言及の通りにアルマが回想で述べているかのように書かれている。

　ところが知っている人は知っている通り、この訳注は事実に反しているのだ。アルマの『回想と手紙』を確認してみることにしよう。私は、酒田健一訳の1973年に白水社から出版された旧版を子供の頃に入手して以来ずっと手元に置いて参照してきたので、それを引用することとさせて頂きたい。それは「新世界 1907-1908年」の章に出て来る、以下のパラグラフのことに違いない。

「若い美術工芸学校の生徒のマリー・ウヒャーティウスが、ある日マジェスティック・ホテルに私をたずねてきた。話しこんでいるうちに、私たちはふと聞き耳を立てた。セントラルパーク沿いの大通りが騒がしい。窓からのり出して見ると、下は黒山のような人だかりがしている。葬式だった―行列が近づいてくる。そういえば新聞に、消防士が一人火事で殉職したという記事が出ていた。行列がとまった。代表者が前に進み出て、短い挨拶をした。私たちのいる十二階からでは、なにかしゃべっているらしいとわかっても、声までは聞こえてこない。挨拶のあとちょっと間をおいてから、おおいをかぶせた太鼓が一つ鳴った。あたりは水を打ったように静まり返り、やがて行列は動き出し、式は終わった。
　この風変わりな葬儀を見ているうちに、私の目には涙があふれてきた。おそるおそるマーラーの部屋の窓のほうをうかがうと、彼も身をのり出していて、その顔は泣きぬれていた。このときの光景は彼によほど深い感銘を与えたとみえて、のちに彼はあの短い太鼓の響きを『第10交響曲』のなかで使っている。」（アルマ・マーラー『グスタフ・マーラー　回想と手紙』,　酒田健一訳, pp.155～156）

このくだりを読んだ人は、まず間違いなく、アルマが参照しているのは、第10交響曲の第4楽章のスケルツォの末尾、第5楽章のフィナーレの冒頭に鳴る、あの忘れ難い大太鼓の一撃であると考えることであろう。勿論、アルマは明確にそこの部分だと指示しているわけではないけれど、それにしても、「おおいをかぶせた太鼓が一つ鳴った。」とあって、それがゴング（タムタム）ではないことは間違いない。念のため対応の箇所の原文をあたっても、

Die junge Kunstgewerbeschülerin Marie Uchatius war einst bei mir in Hotel Majestic. Wir wurden aufmerksam. Auf der breiten Straße, entlang des Centralparks, Getümmel und Lärm. Wir lehnen uns aus dem Fenster, unten eine große Menschenmenge. Ein Leichenbegängnis ― der Kondukt naht. Jetzt wissen wir auch aus unsern Zeitungskenntnissen, es war ein Feuerwehrmann, der bei einem Brand den Opfertod fand. Der Zug steht. Der Obmann tritt vor, hält eine kurze Ansprache, wir ahnen im 11. Stock mehr als wir hören, daß gesprochen wird. Kurze Pause, dann ein Schlag auf die verdeckte Trommel. Lautloses Stillstehen ― dann Weitergehen. Ende.Diese seltsame Totenfeier preßte uns die Tränen aus den Augen. Ich sah ängstlich zu Mahlers Fenster hin, aber da hing auch er weit hinaus, und sein Gesicht war tränenüberströmt. Die Szene hatte einen solchen Eindruck auf ihn gemacht, daß er diesen kurzen Trommelschlag in der Zehnten Symphonie verwendet hat.（酒田訳がそれに基づいている1949年版原書（アンシュルス後、第二次世界大戦中の1940年に出版された初版の、戦後出版された再版）ではp.170、現在入手しやすいと思われるFischerから出ている『回想』部分のみのTaschenbuch版ではp.163）

となっていて、やはりゴング（タムタム）ではないのである。いやこういうのは私だけではない。というよりも私がほとんど反射的に「おやっ」と思ったのは以下の理由による。
　
　これも上記の『回想と手紙』と並んで、子供の頃からの伴侶であった2冊のうちのもう1冊であるマイケル・ケネディの『グスタフ・マーラー』(中河原理訳、芸術現代社、1978年)は、著者がデリック・クックの知己であることもあって、第10交響曲に関する正確でかなり詳細な情報を含んでいるのが一つの特徴となっているが、その第5楽章の紹介のくだりは以下のようになっていて、この件を記憶した子供であった私の中では、アルマの回想が第4楽章のスケルツォの末尾、第5楽章のフィナーレの冒頭に鳴るバスドラムと関連していることは「事実」も同然であったわけなのである。

「これが何を意味するか、君だけが知っている」とマーラーはアルマにあてて、このスコアに書いている。マーラーはふたりがはじめてニューヨークに行ったとき（1907年12月から翌年4月まで）の出来事に触れているのである。このときはセントラルパークを見おろすホテル・マジェスティックに泊った。英雄的な死をとげた消防士の葬列が窓の下にとまった。歩き始めるまえに、覆いをつけた太鼓が短く鳴った。感じやすいマーラーはこれを眺め、涙がほほを伝った。その太鼓がこの終曲を開始し、ニ短調を保ってゆく。（…）
マイケル・ケネディ『グスタフ・マーラー』(中河原理訳、芸術現代社、1978年、p.233)

アドルノの側について言えば、彼自身は、例によってこういう側面の参照に関してはその典拠についての注をつけていないので、確実にアルマの回想の上掲のエピソードを参照しているという証拠があるわけではないとはいうものの、他にこれに替るドキュメントがあるものか、寡聞にして知らない。もしアドルノが言及している通りの、ゴングが鳴り響くアメリカの消防士に関するエピソードというのが別にどこかにあるのをご存知であれば、是非ご教示頂きたくお願いする次第である。

　ちなみにこの第10交響曲がマーラーの早すぎる晩年に訪れた、一般的には家庭内の不和ということになるであろう出来事に関わることは良く知られている。ケネディの評伝は伝記と作品解説の2部に分かれるが、そのいずれにおいてもこの点について、しばしばアルマに対して批判的なトーンを交えて言及している。私見では、それは全く正当な態度だと思われるが、その一方で私が第10交響曲を聴きながら最近感じるのはそれとは別のことである。作品とその作品を産み出す背景となった伝記的事実とは一先ず区別して考えるべきであり、私のそれは寧ろマーラーその人の経験の側についての思いに過ぎないのだが、マーラーのような性格の人は、この時期に、自分が気付かずに、時として無意識に、或る時にはもしかしたら良かれと思ってやった数々のことが、他人にとっては迷惑な、不快ですらあることに思い至らなかったことについての果てしない慙愧の念を感じていたに違いないということだ。誤解のないように繰り返して言うが、第10交響曲がその慙愧の念を表現していると感じたということではない。それとはいっそ無関係に、だが、背後にそうした悔悟の念、自分が意図せず独善的でしかなく、他人にとっては迷惑な存在であったこと、自分がどんなに願ったとしても、他人のために何かをすることにおいて、自分が不十分な存在であり、常にではなくても、最終的には力及ばないこと、そしてその時に気付いた時には最早手遅れであって、自分がやってしまったことについては最早取り返しがつかないのだという認識、或る意味ではあまりに平凡で取るに足らないと言われもしよう認識に直面したときの絶望感というものが潜んでいるような感じがしたということに過ぎない。そしてそのことをふと、上記のエピソードを引用しつつ思っただけではあるのだが、こと私個人に関しては、こうした「人間的な、あまりに人間的な」地平がマーラーへの共感の背景となっていることが否定しがたいことのように思われること、そして一見無関係に見えたとしても、アドルノの了解との隔たり（とはいえそれは対称なものでは全くなく、こちら側はごく私的な感じ方の根拠に過ぎず、何ら一般性な価値を有するものではないのだ）が、もしかしたらこの辺りに存するかも知れないと感じたこともあり、敢てここに追記しておくことにしたい。

　アドルノが第10交響曲の補筆に対して否定的な見解であったことは、龍村訳に収められているモノグラフ第2版へのあとがきからも窺えるが、これまた周到にも龍村訳の訳注で言及されている通り、»Fragment als Graphik«というタイトルの論考を後に書いてもいて、実はそこでももう一度、第3楽章について言及しているところで、

(...), obwohl der berühmte Tamtamschlag am Ende, den Alma Mahler mit einer biographischen Episode in Zusammenhang brachte, immerhin auf eine inkommensurable musikalische Situation deutet. (Taschenbuch版全集第18巻, Musikalische Schriften V, p.252)

(…)、とはいえ、アルマ・マーラーが伝記上のエピソードに関連付けた末尾のタムタムの一撃は、少なくとも計り知れぬ音楽的状況を示している。（引用者による試訳）

と記しているのであって、少なくともアドルノ自身の中では一貫した主張だったようである。上掲の»Fragment als Graphik«は1969年の日付を持つ文章のようだが、これはまさにアドルノの没年にあたっているから、アドルノが生前一貫して持ち続けていた信念だったと言って良いだろう。

　ここからは私の想像になるが、アドルノは既に戦前の1924年に出版されていたファクシミリには当然目を通していただろうし、同じ1924年秋の演奏も、或いは聴いていたかも知れない。また1951年に出版された所謂クシェネク＝ヨークル版（これには第1楽章と第3楽章が収められている）も知っていたに違いないけれど、第4楽章・第5楽章の草稿を精査したことはなかったのではなかろうか。

　一方、クック版の補筆作業とその成果に基づく演奏については、演奏こそ、ゴルトシュミット指揮によるクック第1稿の放送初演が1960年12月19日にBBC放送であり、クック第2稿の初演は1964年8月13日、ロンドンにおいてであるが（なお、いずれについても今やＣＤで聴くことができる）、これらを補筆に対して否定的であったアドルノが聴いたことがあったかどうか？更にクック版の楽譜としての出版はアドルノの没後の1976年まで待たなくてはならないのである。アドルノが、同じシェーンベルクのサークルのメンバーであったクシェネクや自分の作曲上の師であったベルク、シェーンベルクの師であったツェムリンスキーが関わった1924年版の作業は勿論として、その後のクックによる補筆の動きを知っていたことは、モノグラフ第2版へのあとがきから状況的には疑いないが、実証的な観点からすれば、わざわざ大太鼓が打ち鳴らされる箇所が別にあるのを知った上で尚、第3楽章末尾のゴングの一撃とアルマの回想のエピソードを結びつけるとも思えない。というわけで、アドルノが第4楽章のスケルツォの末尾、第5楽章のフィナーレの冒頭に鳴る大太鼓の一撃を知らなかったのではという見解に傾くのである。尤も、アドルノは必ずしも実証を重んじるタイプではなかったかも知れず、従ってこれ以上についてはアドルノを研究されている専門の研究者の判断を俟つしかなく、素人の憶測は慎むこととしたい。

　だが、斯く云う私も、上記のことに気付いた時にさえ、アドルノの主張の本筋の是非については別の問題であると思っていたし、その点の認識については基本的には現時点でも変わりはない。第10交響曲の「ゴング」と消防士に関する事実がどうであれ、「プルガトリオ」を閉じるゴングは、「プルガトリオ」が典拠としている歌曲『この世の営み』や歌曲『魚に説教するパドヴァの聖アントニウス』に基づく第2交響曲第3楽章の末尾同様、死後の世界への到着を告げる（『この世の営み』については歌詞の物語る通りだし、「プルガトリオ」の後には「悪魔が私と踊る」第4楽章が続き、第2交響曲第3楽章の後には、あの歌曲『原光』そのものである第4楽章が続く）ものではあるだろうから、アドルノの指摘それ自体は問題なく、誤っているのは消防隊の連想と、事実関係の誤認の点のみに限定されるだろう。

　いや正確に言えば、「プルガトリオ（煉獄）」とはこの世の営みの終焉とと天国への到着との間にあるのだから、死後の世界への到着を告げるゴングが曲の末尾に鳴るのはズレているだろう、という指摘はあるかも知れない。この点に関しては文字通りには反論の余地はないが、だとしたらそれは標題から逆に音楽に辿ろうとするが故に発生する問題だと返すことはできるだろう。「死後の世界への到着を告げる」という言葉がもたらす歪みが問題だというなら、或る種の相転移のポイントの通過を表すというように言い直しても良い。そもそもがそのようなゴングの音の象徴学に拠るならば、曲頭からゴングが鳴り響く葬送の歩みのような『大地の歌』の「告別」は、既に「死の世界」だということになるだろうが、それでは「告別」の中間部分の器楽による「葬送行進曲」はどうなる、といった疑問が出て来ることになるだろう。こんな議論を追いかけていけば、そのうちに当の音楽からどんどん離れて行ってしまう。要するにこうした標題的な詮索は、音楽に対して言葉の持つ歪みを押し付けているに過ぎないし、音楽は出来事を文字通り「物語る」のではないのであって、寧ろ「時間性の様態のシミュレータ」と見做すのが適切なのだが、このことは別に書いたのでここでは繰り返さない。

　ただ、その上でアドルノがかくもこだわった第3楽章末尾のゴングに関して確認してみたいと思うことがある。それはそのゴングを、クシェネク＝ヨークル版に従ってフォルテで鳴らすべきか、それともクック版におけるように小さく鳴らすべきか、いずれが妥当かという点である。最初はFM放送で（諸井誠さんによる解説に導かれて）レヴァインの録音を聴き、しばらくはインバルがヘッセン放送のオーケストラと録音したものが私のリファレンスだったのだが、メモを記した当時私が良く聴いていたのはクルト・ザンデルリンクが旧東ドイツのベルリン交響楽団（現在のベルリン・コンツェルトハウス管弦楽団）を演奏した全曲版だった（やはり旧東ドイツのドイツ・シャルプラッテン・レーベルから出ていた）らしく、メモにはこの演奏への言及もある。これも良く知られていることだろうが、ザンデルリンクはクック版に基づくとはいえ、器楽法上は独自の変更をかなり行って演奏をしているのだが、プルガトリオ末尾のゴングの一撃もまた、当時の私がクシェネク＝ヨークル版を参考にしたかと思ったくらい、はっきりと鳴らされている。アドルノへの問いに戻れば、クシェネク＝ヨークル版にせよクック版にせよ、ここの部分については「補筆」であるには違いなかろうから、アドルノは、第10交響曲の演奏そのものに否定的であった原則に立ち戻って、そんなことはマーラー自身でもなければ答えられない、というようにこちらの問いを切って捨てそうな気がするのだが、それでもなお問いかけてみたくなる程度には、アドルノの「アメリカの消防士のゴング」への拘りに対して、私自身の方がひっかかりを感じているということなのであろう。

　私は、別のところで何度となく記している通り、第10交響曲をアダージョのみから捉えるのではなく、全5楽章の交響曲として捉える立場に与したく思っていて、クックの補筆は、私のような単なるアマチュアの愛好家にとっては十分過ぎる程に、マーラーの意図を捉えたものと感じている。恐らくはこの点こそが分岐点なのだろうが、そういう私にとってはアドルノの本件についての了解、つまりゴングと大太鼓の間の「ずれ」は、単に第10交響曲が未完成であるという事実に即した是非の議論に留まらず、第10交響曲を含めた、もっと言えば、曲毎に発展し続けたマーラーの創作活動にあって、それをあり得たかもしれない全作品の頂点として捉えるような位置づけに基づいてマーラーの作品全体を考える立場からすれば、或いは決定的かも知れない認識の相違に通じているのではないかという気がしてならないのである。

　スタニスワフ・レムの『ビット文学の歴史』における、ドストエフスキーの『未成年』と『カラマーゾフの兄弟』の間に横たわるミッシング・リンクにあたる作品のAIによる仮構やカフカの未完成作品『城』の補完の（こちらは実は失敗に終わることが、その理由の示唆的な説明とともに語られる）エピソードを、マーラーの第10交響曲の場合に突き合わせてみることは極めて興味深い。ネットワークやデジタルメディアの発達に伴う「創作」、「創作物」の概念の変化に加えて、AIによる文学作品、美術作品、音楽作品の「創作」というのが一気に現実味を帯びるようになった今日、未完成であるが故に、ありうべき存在という様態でした存在しえない「幽霊的」な存在である第10交響曲に対してどのように向き合うかということは決して些末な問題とは思えない。AIが第10交響曲を補完することは、仮にやったとしても（レムがカフカの『城』について示唆したのと、或る部分では全く異なる―寧ろその点についてはブルックナーの第9交響曲のフィナーレの方が『城』のケースには近い―だろうが、大枠としては同じような理由で）必ずや失敗に終わるであろうと私は思っていて、そのことはそう考える理由とともに別にところに記した通りだが、そのことが結局は（それこそカフカの地下茎の迷路の如く）アドルノがカフカを引き合いに出したことの背後にある認識の正しさを裏付けていることに通じている点を認めるには吝かでなくとも、こと第10交響曲に関しては、アドルノの認識を今日我が事として引き受けようとしたときに、彼の立場を離れることが寧ろ必要なことのように感じられるのである。彼と共にプルガトリオ末尾のゴングの響きの前で立ち止まるのではなく、本当はそうであった筈の、未聞の、未成のバス・ドラムの一撃をこそ受け止めるべきなのではなかろうか？

　我々が第10交響曲を聴く準備はまだ整っていないとシェーンベルクが述べてからもう1世紀が経過したが、恐らくその準備は未だ出来ていないと言うべきだろう。だがそれは、その準備をまだ進めなくても良いということでもないし、そうした準備が最早不要のものとなったということでもないだろう。寧ろ今やそれを準備すべき時に至ったという認識を持つべきなのではなかろうか。
　
　いや、シェーンベルクがプラハ講演で第10交響曲に言及した、そのもともとの意図に沿うならば、それはそもそも時代の問題ではないのだ。1世紀の歳月は第10交響曲に関する展望を変えてしまった。シェーンベルクが第10について「ほとんど知ることがないだろう」ということの半面においてはまさしく、事実としてそうだろう。講演末尾の「まだわれわれに啓示されていない」という言葉もまた、その限りにおいては今日には最早相応しくないものかも知れない。だが、もう半面は？もう半面は、未だシンギュラリティの手前にいる以上、シェーンベルクが語った時と今とで何ほどの違いがあろうか。なおそこで例えば、マーラーの生命を奪った病は程なくして治癒可能なものとなったことを指摘する人はいるかも知れないし、事実としてそれは決して間違いではない。だがそれが「極限」の向こう側についての何かを授けるのであるとすれば、そのことの意味はシェーンベルクが語ったような水準では、限定的なものに留まるだろう。

　だが一方で、我々は第10交響曲について何某かのことを知ることになったのだし、そのことを恰も無かったかの如き態度をとることは最早許されまい。のみならず、シンギュラリティについて、つまり総じて100年前に既に先取りするようなかたちで予感されていた領域についてもまた、かつてとは異なる切迫の下で論じられる時代となったことは抗いがたい事実であろう。とあるとするならば再び、寧ろ今や第10交響曲を聴く準備をすべき時に至ったという認識を持つべきなのではなかろうかと感じずにはいられない。たとえその準備が私の生きている裡には終わらないとしても。そもそも私にはその準備を成し遂げるだけの能力も時間も遺されていないとしても。マーラーの最後の同時代者かも知れない一人として。その音楽を受け取ってしまった者に課せられた義務として。（2020.1.18初稿公開、2020.1.26-28加筆, 2024.8.11 「グラフィックとしてのフラグメント」の引用に試訳を追加。）

2020年1月20日月曜日

MIDIファイルを入力とした調性推定についての注記：とりあえずの「まとめ」に替えて(2023.7.10更新)

[はじめに]　本ブログの記事「MIDIファイルを入力とした分析の準備：調性推定と和音のラべリング」(https://gustav-mahler-yojibee.blogspot.com/2019/12/midi.html）にてその結果を公開した調性推定について、それをマーラーに適用することに関して、複数の専門家（作曲家、音楽学者）の方から厳しい批判を頂戴しました。
　頂いた批判の骨子は、一つにはマーラーの音楽については、基本的にこのような分析手法を適用しても得ることが少なく、伝統的な分析による方が結局近道であること、もう一つにはこのような手法の適用結果を利用するにあたっては、前提として伝統的な和声学に基づく分析に基づいた批判的な見方ができなくてはならないということに存すると認識しています。
　既に報告した通り、MIDIファイルの内容の正確さついての検証を行う必要が生じ、そのための時間的な余裕がないことから、これ以上この試行を継続する意義は薄れてしまっていますが、いわば顛末書のようなものとして、頂いた批判に対する私の見解を、批判を頂けたことに対する感謝の気持ちとともに、以下に記録しておくことにします。
　応答を残すことは、このようなアマチュアの拙い試みに対してまともに向き合って頂けたことに対する或る種の義務のようなものであると考えるからであり、やったことを振り返った上で区切りとしたいからでもあります。更に言えば、公開したデータというものが専門的な観点からはどのように受け止められるか、どのような点に限界があるのか、どのような点に留意して制限して利用すべきかに関して、利用される方に知って頂くことが必要とも考えました。
　なお、以下の内容を踏まえた上で私の宿題（ただし私には最早それを解くことができないことが判明したわけですが）として残っているのは、以下でも触れている、アドルノのモノグラフにおける主張（つまり、その冒頭での楽曲分析の限界の主張や、カテゴリやキャラクターといった概念装置の導入、そしてマーラーの形式の「唯名論」的性格の指摘など）をどのように受け止めたら良いのかということです。クラムハンスルの手法に色々な制限があることについては異論はありませんが、数理的な手法のマーラーへの適用が不適切である理由が、単にクラムハンスルの手法の個別的な制限故であるのか、そうではなく伝統的な楽曲分析ではない、数理的な手法一般の問題なのかによって展望は大きく異なってくるように感じます。
　しかし最早この点についての議論を、それをする資格のない私が行う越権をこれ以上続けることは慎むこととして、（私にとってはまさにそうであるので）「未解決問題」として残し、それを論じ、解決する資格のある方々が解決してくれることに期待して筆を擱く他ありません。そして文字通りのアーカイブとなるこのブログの記事が、単なるきっかけ、しかもそれが不完全であるという否定的な様態でのきっかけとしてであれ、そうした解決に対して何某か寄与することを願わずにはいられません。(2020.1.20-22記)

*　　　*　　　 *

確実なデータがあるもっともシンプルかつ小さな作品を分析してみて、まず機械がおかしな答を出さないかどうかの確認をし、分析の精度や利点、弱点などを明らかにした上でやるべきで、マーラーの分析はそれらをやった後のずっと先にようやく見えてくるものなのに、何故いきなりマーラーのような複雑なものに飛びついたのかについて、まず述べることにします。

（［2023.7.10補足］ところでここで、「確実なデータがあるもっともシンプルかつ小さな作品」というのを、マーラーの作品の内側に限定すれば、実は私は、まさに指摘されたような手順を踏んで分析を進めています。これは偶々最初がそうだったので、その後も踏襲しているのですが、新しい分析・集計方法を思いつくと、まずそれが期待した通りになりそうかを検討し、その検討にパスすれば、今度はプログラムを書いて実際に動かしてみるのですが、その際には、『リュッケルト歌曲集』の1曲、「私はやわらかな香りをかいだ」(Ich atmet' einen linden Duft)）のMIDIファイルのあるバージョンを用いてテストをするというのが標準の手順になっています。（実際、ここで問題になっている分析に先立つ報告「MIDIファイルを入力とした分析の準備作業：和音の分類とパターンの可視化」において、この作品をサンプルとして提示したこともあります。）40小節に満たないこの小品についてなら、あるMIDIファイルが楽譜通りに入力されているかの確認もできますし、プログラムの出力が意図した仕様通りのものであるかどうかについての確認も、各小節毎・各拍毎に行えますし、やろうとしている分析の精度や利点、弱点などについてもある程度は見当をつけることができます。こうした点は、エンジニアリングの観点でごく当たり前のことであり、寧ろ指摘の通りに考えて実際にやっているからにはこの点については指摘に対して異論があろうはずがありません。従って以下の弁明は、ここで「確実なデータがあるもっともシンプルかつ小さな作品」というのが、実質として、例えば古典派のシンプルなピアノソナタの楽章のような、単に小さいだけではなく、用いられている和声の種類が限定され、拍節構造もシンプルなものを含意していて、マーラーに取り組む前にそうしたもので検証を行わないのか、という含意を持っているとしたら、という点についての弁明になります。エンジニアリング的な観点からのトリヴィアルな弁明ということなら、「確実である」ことは「小さい」ことで検証の被覆率（カバレッジ）をあげる―ーあわよくば100%にするーーことができれば良く、マーラーの中で実際にこれができる作品があるので、それを取り上げれば十分である一方で、「シンプル」という点について言えば、例えば和声的な多様性（転調のパターンのそれを含む）ということについて言えば、古典派の中でもシンプルな作品だとパターンが限定され過ぎて却って網羅性の点で問題が生じる懸念があるし、マーラーの場合には珍しくない拍子の変化についてはプログラムの検証上無視できないでしょう。勿論だからといって「私はやわらかな香りをかいだ」(Ich atmet' einen linden Duft)）1曲で必要十分であるという訳ではないのですが、そうした条件を考慮した上での、或る種「現場」でのノウハウの如きものとして、この曲が選択されたというのが弁明になるでしょうか？とは言うものの、この点について明示的に言及することなしに以下だけを述べるのは明らかに説明不足であるため、その点をお詫びして補足するとともに、以下のコメントは、ここで述べた点を踏まえた上での更なる弁明ということでお読み頂けるようお願いする次第です。）

なぜ手順を踏まなかったかについて言えば、クラムハンスルの手法を、作品がどのように出来ているのか、楽曲分析したらどのように分析できるかとは基本的に関係なく、調性音楽に親しんできたけど専門的な訓練を受けた「エキスパート」（アドルノの聴取の類型論を思い浮かべて頂ければと思います）ではない人間が聞いたらどう聴こえるかについての非常に肌理の粗い、単純なモデルでしかないという了解に基づき、そのようなアプローチでの調性推定に関する限りにおいては、伝統的な楽曲分析においてそれが複雑であるかどうか、伝統的な楽曲分析において難しい対象であるかどうかはあまり関係ないと思っていたというのが正直なところです。

複雑で長大だから精度の高いデータを作るのは難しいというのは別の問題ですし、調性推定一般がそうだということもありません。例えば伝統的な楽曲分析でいう調性の推定は、私の知る限りでもそうではなさそうに見えますし、統計的なデータに基づかない推定であれば、プログラムによる推定でも、ここでの手法とは特性が全く異なります。そして、そうした手法を試行して後にこのような統計的な手法を用いるべきではないかということが主旨であるとするならば、その限りでは、マーラーの分析をやる前にやらないとならない手順があるというご指摘には異論はありません。

ただ、こういう発想は、それ自体、伝統的な楽曲分析の観点からは許容しがたいのかも知れませんが、ことによったら訓練されていない聴き手の耳は寧ろ、まさにそのような許容しがたいものであるということはないのだろうかとも思います。

というよりも素直に考えて、私は例えば、三輪眞弘さんの作品もパレストリーナも、ヴェーベルンもクセナキスも、或いは能楽の囃子のようなものも皆等しく「音楽」として聴いている、そういう水準が間違いなく存在すると感じているのだと思います。そして少なくとも私の中では、そのような中にマーラーが位置づけられている。恐らくはそれはマーラーを正しく聴くには不適切なのかも知れません。そういう聴き方ではマーラーを正しく聴くことはできないかも知れませんが、遺憾ながらそれが私の現実なのです。

勿論、言語におけるコードスイッチングのように狭義の調性音楽固有の聴き方というのがあって、対象に応じて聴き方を切り替えているといったことは実際に起きているだろうと思いますし、調性音楽固有の領域で繊細で微妙な問題がたくさんあって、それこそが本質的であるということに私も同意したく思いますが、前者はそれこそ程度の問題だし、後者は事実上は別としてそれが権利上、特権的なものだとは思わないのです。

一方、事実としてはそれは特権的かも知れません。例えば私は能楽の微妙な部分について聴けていないと思いますし、「ありえたかも知れない音楽」であり、伝統自体をいわばその都度仮構する三輪さんの音楽についてはとりわけそうだと思います。言語における母語とそれ以外のような質的な差になっているかどうかは措いても、総じて西洋の調性音楽を聴く頻度に応じた分だけは事実として特権的な扱いを受けるように脳内のネットワークが形成されているように思います。とはいえ、だからといって伝統的な西洋の調性音楽について専門的な訓練を受けているわけでもなく、結局どれについても私の「耳」（それには理論的な知識も含まれますが）は訓練が足りないが故の限界を持っているという自覚もまた、あります。そうでありながら、或る種の成り行きで、基本的には西洋の調性音楽をベースとした（但し精度には甚だ問題のある）「耳」を備えるようになり、それでもって狭義の調性音楽でないものをも聴いている。こうした条件にいるからこそ、クラムハンスルの統計を用いた相関のような仕方で調的推定をやる意味があると感じた、そして伝統的な調性音楽の分析においては、常に逸脱という仕方でその特性が測られているように見えるマーラーのような対象こそ、寧ろ対象としてふさわしいと感じたということなのだろうと思います。

しかし実際にやってみると、どうやらマーラーのMIDIデータの信頼性が思った以上に低いらしいことがわかってきた以上、確実なデータがあるもっともシンプルかつ小さな作品を分析すべきというのは、結果的にご指摘の通りなのだと思います。少なくとも個別の結果についての調査を行い、結果が想定されたものにならない理由を一つ一つ明らかにする必要があると認識しています。単なる入力ミスなのか、データの欠落なのか、作成方法に由来するずれのような問題（DTMの領域では「クオンタイズ」の対象とされるもの）なのか、はたまたMIDIデータ作成に許容されている大きな自由度故に、プログラムが想定していない設定がされているために正しくデータが読めていないためなのか、或いは単にプログラムの不具合なのかの切り分けをして、一つ一つ解決する必要があります。そもそもその全てのケースを想定した解析プログラムを書くことが事実上困難であるとすれば、データの信頼度を考慮しつつ、対象とするデータを限定して、その範囲では正しく解析できるプログラムにするという妥協点を見つける必要があるでしょう。そしてこれらの作業は、最終的にマーラーの作品が対象なのであれば、シンプルで信頼できるデータを対象にしていたらできません。例えて言えば、マーラーの作品の実演においても必ずしも楽譜通りになるとは限らない、特に長大で複雑で難しいが故に、ミスがつきものであるのと同じこと、現実のデータというのはこうしたものなのだと思います。

一世紀の校訂作業と実際の現場での利用を経て極めて信頼性が高くなっているであろう楽譜であっても現実にはミスプリントが皆無ではない可能性については今は措きます。それを言えば、そもそもMIDIデータの入力がどの版の楽譜を基に行われたのかも問題になりえますが、現在私が直面しているのは、そのような高水準の精度の問題ではなく、現実に起きているMIDIデータに固有の様々なタイプの問題だからです。それは寧ろ、データ分析において常に直面するデータクリーニングのような前段階に近い性質のものであるという認識を持っています。

その反面で、分析結果がどうなりそうなのかについて、私は予断を持ちすぎていたのだという点も感じます。つまり分析の前提から、精度や利点、弱点などは、やる前からある程度想像がつくと思ってしまっていて、それ故に、伝統的な楽曲分析の基本と応用の切り分けと、このようなタイプの分析の得意・不得意にずれがあることも当然のことだと思っていました。けれどもだからといって、伝統的な和声学に基づく分析に基づく批判的な検討を抜きにすることは正当化できないということは認めざるを得ません。

*　　　*　　　 *

まず、和音のラべリングの結果を後から追加して、調性推定の結果と並べてしまったことが誤解を与えてしまったかも知れません。

和音のラべリングと調性推定は手法上独立で、関係ありません。そもそも分析に使っている対象のデータが、前者は拍なり小節の先頭に鳴っている和音であり、後者は拍内、小節内に鳴っている全ての音の各音毎の持続時間のデータであって、全く異なりますから、単純な比較はできません。そして関係がない別々のやり方だからこそ、並べて眺める意味があると思って追加したのであって、和音のラべリング結果と突き合わせて調性推定が妥当かどうかを検証する目的ではありませんでした。勿論それもまた、或る種間接的な参考にはなりえるでしょうが、上記の理由から直接的には間違いですし、そのことには結果報告のブログの記事中でも言及していますが、結果データのみを手にしたときに、あたかもそれを意図しているかの如き構成になってしまった点は反省しています。

一方、古典的な作品の和声の分析結果と照合することで分析の精度や利点、弱点を確認するということの意義について言えば、機能和声に基づく分析と、クラムハンスルの調性推定の比較を行うという観点では意味のあることかと思います。しかしそれを除けば、和音毎に一つ一つ人間が分析しながら見ていくアプローチを取るのであれば、まさに正統的な楽曲分析をすれば済むことで、あえてここで試みたような別の方法で調性推定をする意味が私には判然としません。

繰り返しになりますが、ここでは小節を区間とした推定を行っています。拍毎の推定も出していますが、それもまた、小節内で鳴っている音がだんだんと累積されていくので、拍毎に和音を同定して、非和声音が含まれているかを分析して…というのと同一のことをやっているわけではありません。

勿論、純粋に拍毎に鳴っている音に限定して拍毎に独立に推定を行うことも、プログラムを少し修正すればできるので、古典派のシンプルな作品についてその結果をお送りすることは可能です。ですがクラムハンスルが実際にやった推定実験を見る限り、また理屈の上でも本筋は逆に見えます。寧ろもっと長い区間で推定すべきなのでは、と思います。なぜならここでやっているのは、個々の和声の機能分析ではなく、調性推定だからで、一般には調性が確立するためには単一の和音ではなく、和音の系列が必要と考えるのが自然だからです。

例えば或る小節の中がある調のドミナントと機能分析される和音のみで占められているとした時、その小節を1区間として独立に調性推定したら、転調先のトニカと見做して調性推定をしてしまうことが予想されます（結果を確認すれば、実際そのようになっている部分があるかと思います）。そしてそれが転調先の調性のトニカでなく主調のドミナントなのは周囲を見たらわかることです。だとしたら、この調性推定のやり方に限っては、推定対象の区間を拡げるべきなのです。

それでは区間どれくらい長ければいいのか？というのが難問です。人間には簡単でも、機械に自動判定させるのは難しく、逆に調性推定の結果をもとにして区切りを推定することになるかも知れないとも思います。私はといえば、次のステップとして（自動処理に拘ればズルをすることになりますが）フレーズの区切り、楽段の区切りの情報を与えて、その区間内で推定させるということを考えていました。

更に、それでは上記の例のような調性推定結果をどう受け止めるべきかと言えば、和声の機能分析の観点から見て間違いなので、こんなものは使えないと判断するよりは、そのことが和声の機能や調性の確立について告げているものを受け止めることの方が興味深いように思えました。そしてもしこのレベルの検討が必要であるというのであれば、それは現実の作品を分析するのではなく、ここでの例のような更に単純な例を構成すれば良く、かつそれはわざわざプログラムを書いてやってみるまでもなく、机上で分析可能なことのように思われたのです。

他方でマーラーの作品のように、和声の機能分析が困難で、エキスパートのみがそれを行うことができるような対象であれば、いわばトンネルを反対側から掘り進めるようにして、このような単純な手法による結果からでも浮かび上がってくる何かがあるというように思って試行してみたのです。

しかしことマーラーの作品に関しては、その作品の成り立ちからしてそのような発想は誤りで、逆にこちらこそ試してみるまでもなく、やることの意義はなく、和声の機能分析が一番の近道とのことで、見当外れのことをやっていたことになり、この点は不明を愧じる他ありません。

*　　　*　　　 *

これは分析というよりプログラムの作成のディティールの話になりますが、機械がおかしな答を出さないということについては別の話になります。具体的な個別のプログラムそれぞれについて言えば実は基準は明確です。

和音のラベリングでは、ラベリングの手順が決まっていて、ルールが決まっていて、その通りに動けばプログラムとしてはOKです。そしてこのレベルの確認、つまり普通のプログラムとしてのテストはそれなりに行っています。古典的な作品のMIDIデータも用意しましたし、マーラーでは重心計算以来、まず規模の小さな歌曲（記事でもよくサンプルとして出す「私はやわらかな香りをかいだ」）で確認するということをずっと行ってきました。ただ小さなデータでは出現しない条件もあります。なので一方では、マーラーの作品の全てのMIDIデータを通してみるということもやっています。そしてもともと最終目的がマーラーの作品についての結果を得ることであれば、極論すれば、他の作品のMIDIデータでうまく動かなくても支障はないという考え方もできます。実際、MIDIデータの作り方は様々で、恐らくは作成に用いたシーケンサ依存の部分があり、その全てのケースに対応したプログラムを作成を目指したわけではありません。実際、幸いマーラーのMIDIデータには一つもなかったのですが、他の作品のMIDIデータではMIDIファイルからデータを抽出する最初のプログラムが異常終了するケースもありましたが、上記の理由から、これには対応しませんでした。

ただご指摘はこのレベルでの検証に対するものではないと思います。そしてこのレベルで「正しく」動くことが確認できた上でも、調性推定にしても、和音のラベリングにしても、でも現実に動かせば、間違いなくエキスパートが見れば「変な答」を出すことがあるでしょう。

それは一つには、もともとのデータ(MIDIファイル自体)がおかしい場合で、これは事前にわからないし、どうしようもないです。一つ一つ確認して元のMIDIデータの方を直すしかない。そしてマーラーに適用した今回のケースでは、この点が現実的なネックとなって、先に進めることの意義が薄れてしまったと認識しています。

もう一つは手順そのものに不足がある場合です。こちらは或る意味で初めから想定済です。そしてその限りでは、できないものははじめからできないので、MIDIファイルの大きさや作品の複雑さは実は関係ないのです。意地の悪いひっかけ問題も意味がなく、やる前からできないことは仕様上明確で、できるようにするには、仕様を変更し、手順を追加しなくてはいけません。

和音のラベリングのパターンの種類については、別に報告している通り、百通り以上のパターンを分類できるように用意していますが、調性推定結果とともに表示することにした和音のラベリングは、そのうち頻度が高くで先行文献等でも扱われている十数種類に限定しています。出現頻度が稀になるとその和音に名前がないし、曲によっては百通り以上用意しても100%にはならなかったからです。そしてそれがMIDIデータの誤りに由来する可能性が出てきたため、パターン数を増やすのは一旦中断しています。そういうわけで対象となっているMIDIデータに限定しても網羅性には欠けるという中途半端な状況になっています。（なお、このレベルの網羅性については、データ自体の公開は目的から外れるため行っていませんが、報告の文章の中には、マーラー以外の作品の場合にどうであったかについて、ごく簡単にではありますが触れた箇所があると思います。）

ただしMIDIデータの誤りは別として、それは別にプログラムの問題ではなく、理論が興味を持たない和音というのがたくさんあるということの結果に過ぎないようにも思います。或る珍しい和音に意味があるのかないのかというのは結局のところプログラムにはわからない（これは機械学習のプログラムでも同様です）。基準は結局人間が与えているに過ぎません。プログラムとしてどこまで自動化されているかどうかは、プログラムを作っていて、その動作を理解している製作者でもある私の立場からすれば枝葉に過ぎないと思います。機械の分析対象外のケースについては、それが人間の扱える程度の量なら手作業でやってもいいわけですし…寧ろ難しいのは、特定の和音が重要であるかどうかを判定する能力です。それは単なる出現頻度だけでは測れない筈で、簡単なやり方では外れ値との区別がつかないでしょう。そしてそれが統計ベースの手法の限界であると思います。

調性推定の場合には少し事情は違いますが、プログラムとしてOKかどうかは、或る意味で和音のラベリングよりもっと手前の問題です。ここではMIDIデータの方の信頼性とは別に、推定の根拠となっているクラムハンスルの調性とピッチの出現頻度の統計データの側の持つ限界が一つと、統計的な手法が持つ限界というのがもう一つ出てくるからです。そしてこちらについては意地の悪いひっかけ問題は一定の意味を持ちます。工学の分野ではある手法の理論的限界を明らかにする「騙し問題」というのがありますが、それに相当する役割を期待するわけです。ただ、今回のプログラムは、機械学習のような「やってみないとわからない」部分は少ないので、理論的な興味は薄いかも知れません。

*　　　*　　　 *

次いで、敢えて通常の楽曲分析ではなくこうしたプログラムを使おうとしたのはなぜかについて言えば、私個人についてはそうしたくなる明確な動機が幾つかありました。

ことマーラーに限れば、程度は様々ですが楽曲分析というのにも幾つか接しています。でも複雑な大曲であるが故か、非常に大まかな楽式レベルの分析か、逆にミクロな、非常に範囲を限定した分析しかない。その一方で、マーラーの作品の一般的特徴のようなことが、具体的な裏付け抜きで言われたりして、それに説得力を感じたり感じなかったりするわけです。その根拠を確かめようと思っても確かめる術がない。更には楽曲分析の結果がしばしば一致しないのも困惑の種で、そうなると自分なりに判断根拠が欲しくなります。結局のところ、他の作曲家の作品ならいざ知らず、マーラーは（所詮程度の問題に過ぎないとはいえ）私が最も良く知っていて、あそこの部分がどうなっているのか？誰かがこういうことを言っているが、そこはどうだったか？といった具体的に確認したい事柄が山程あったからというのが理由なのでしょう。更に言えば、アドルノが通常の楽曲分析でマーラーを理解することの限界を述べていますし、繰り返しになりますが、多くの場合、音楽学の領域での分析のほとんどは規範的なものからの逸脱によってマーラーの独自性を測ろうとする。それではアドルノいうところの「唯名論的」な性格は捉えられないので、それならば寧ろ、データに即したボトムアップな見方、伝統的な見方ではない見方にも可能性があるのではないかと思った、というのもあります。

クラムハンスルのモデルがそうである訳ではないけれど、そこから出発して、例えば相転移や自己組織化のような現象や分岐現象がみられたり、（疑似）カオス的な挙動をする系とのアナロジーが抽象度を上げたあるレベルで成り立っているというような見方に展開していくことはできないか、それが優れて「人間的」な時間、またしてもアドルノを参照すれば「小説」的な時間性を備えたものであり、通常の数理モデルでは扱い辛いものであるとするならば、音楽を「時間の感受のシミュレータ」とする立場から、生命や意識に対する複雑系的なアプローチを援用することによって捉えることなら可能ではないだろうか、というような発想にも繋がっていきます。但しその時には、具体的な楽曲分析の対象としての狭義の「調性」の推移ではなく、より一般化された或る種の特徴の軌道が記述対象となるのものと考えるのが自然に思われます。もっとも最後の部分については、それが今実現できる見通しがあるわけでもなく、いずれそのようなことが行われることを夢想しているに過ぎないのではありますが…

いやそうしたことを持ち出すまでもなく、マーラーの音楽を聴いて受け取る「感じ」の根拠を、その一部でも一面でもいいので知りたい、或いは自分なりの納得のいく理由を探したいということが根っこにあります。更に言えば、色々な文献を読んだりして、知識のフィルターを通して眺めることもできる今の状態でなく、出会った時の「子供」が受け取ったものの根拠が知りたい。ある音楽が、他の音楽では見ることのできない風景を見せてくれるとしたら、その風景が忘れられないものだとしたら、その音楽のどこに秘密が隠されているのか、知りたくなるという、ごく単純な話です。そしてマーラーについては、これは謂われない話だとは思いません。マーラーについてのモノグラフの最後の章で、アドルノは「子供」について語っていますが、素朴なレベルでは、それと私のようなアマチュアの思いと通じる部分があるのではと思い、また、あって欲しいと思っています。

私の耳は専門的な訓練を受けているわけではない。そういう意味では分析の難しさからは上級編で、エキスパートでないと手が負えないようなマーラーの音楽を、私が論じる資格はないのだと思います。私の立場は単なる「聴き手」としての「子供」に過ぎません。「子供」は、アドルノがそう書いているように、大人だったらしないような思い込みをしてしまうかも知れない。でも、そうした思い込みをさせてしまうのがマーラーの音楽の力であるとしたら、そうした「勘違い」が起きる理由も併せて私は知りたいのです。

例えばですが（実際そういう主張を見かけたのですが）ある音楽学者が、他の説は間違っている、自分の説が正しいのだと主調しているところで、私は以下のようなことを思ってしまいます。「そうかも知れないけれど、それならそれで、なぜ間違っているかだけではなく、なぜそのような間違いが起きてしまうのかということも含めた説明であるべきなのではないか？」と。よく「意識」は迷妄だ、虚像であり実在しない、という消去主義の立場がありますが、これも全く同じで、そのような「錯覚」が起きること自体に問題を解く鍵があるのでは、と思うわけです。

そして「聴き手」としての「子供」という立場に立って、マーラーの作品の調的な推移を眺めようとしたとき、その文脈の「主音」「調性」を知る必要がある、というのが今回の調性推定やら和音のラベリング作業の出発点でした。誰かに（謂わば「天下り式に」）教えてもらうのではなく、作品をそのものから「主音」「調性」はどうやったらわかるのかを調べてみた結果としてわかったのは、それを判別する手法がアルゴリズム化できてプログラムにできるような一般に共有されている定義はなさそうだし、そもそもが調的感覚というのは、文化的・社会的に形成されたものであるらしいということでした。だとしたら「「主音」「調性」はどうやったらわかるのか」という問いを「聴き手は「主音」「調性」が何と認識しているのか」にずらすという発想の方が適切かも知れないと考えたわけです。そして辿り着いたのが、そうした「文化的・社会的形成物」を実験により求める音楽に関する認知心理学の成果だったということです。

*　　　*　　　 *

ここで試行した調性推定の手法は枠組みとしてはシンプルです。クラムハンスルの統計を用いた相関は、作品がどのように出来ているのか、楽曲分析したらどのように分析できるかとは基本的に関係なく、調性音楽に親しんできたけど専門的な訓練を受けたプロではない人間が聞いたらどう聴こえるかについての非常に肌理の粗い、単純なモデルでしかないのです。その限りで、調性推定に限ればここでやっていることはエキスパートがやっている高度な楽曲分析の自動化でもその代替手段でもありません。或る作品がどのような原理で出来ているかとは無関係に、指定区間が24のどの調性に聴こえるかを統計的に推定しているだけなのです。

それは伝統的な機能和声に基かない作品、例えばクセナキスのピアノ曲についても行えます。もっとも、集合論的に音群を操作する「ヘルマ」については、調的感覚がそもそも考慮されていないので無意味かも知れません。一方で調的構造の一般化とでもいうべき、いわれるところの「篩の理論」を背景に持つ「エヴリアリ」については必ずしも無意味ではないように思います。（所詮は西洋音楽のある時代固有のシステムである24の短調・長調に対する相関であるとしたら、結局、関係ないのはどちらの場合でも一緒ではないかという意見もあるかも知れませんが。）

全ての音の出現頻度が同じだと相関は計算できませんので、現実にある区間で完全に調性が無ければそもそも分析はできないのですが、調性感がなくなるすれすれで、しかも伝統的な機能和声に従って書かれていないので伝統的な分析が行えない作品がどの調性に聴こえるか？という問題設定なら選択肢として有力かも知れません。(そういう分析をやること自体の意味についてはまた別に議論があるでしょうが。)

拡張されているとはいえ、基本的には伝統的な調性音楽を基盤としているマーラーについては、このような手法で得られるものは限定的で、伝統的な楽曲分析の方が結局は近道であり、適用対象として不適切であるなら（ただもしそうならば、既述のアドルノの主張や提案はどのように受け止めたらいいのかという問題は残りますが、今は措きます）、他の何かでも構いません。例えば三輪眞弘さんの新調性主義の作品ではどうでしょうか？三輪さんが新調性主義に属する或る作品のノートに「変化を続ける音型パターンに対して、繊細にそして「機械のように」反応するしかない」と記している、聴き手の側で起きていることを、それは浮かび上がらせるでしょうか？その結果をどのように受け止めたらいいのでしょうか？或いはそれは「機械のように」反応する人間ならぬ、文字通り「機械」が聴いた反応と考えるべきなのでしょうか？そして、これはやってみる意義があることでしょうか、それともそうではないのでしょうか？

三輪さんの新調性主義の作品を例に出しましたが、つまるところ対象はパレストリーナでもヴェーベルンでもクセナキスでもいい。完全に旋法でてきている音楽に適用することの意味は自明ではないでしょうが、マーラーのように基本的には調性音楽だが、旋法的な部分がそこかしこに出現する、或いは特に晩年に向けて、調性感が希薄になるようなケースについてなら、狭義の調性音楽に親しんだ人が聴いたらどう聴こえるかということの粗い近似にはなっていると言えないでしょうか。それをやることに意義を認めるかどうかは立場と目的によるでしょうが。

一方でミルトン・バビット式のトータルセリー的な方向性は、作品を構築する論理とどう聴こえるかが乖離しているといったような批判があると思いますが、そういう観点では、実際にどう聴こえうるかを推定する手掛かりになると思います。私は詳しくないですが、ベルクの音楽は同じ十二音でも、調的に聴こえる部分が多いというような話にしてもそうではないかと思います。

繰り返しになりますが、ある区間で本当に12音の分布が全て均一であるならば、相関は計算できないですから、逆にこの手法が成り立たないような作品は調性から自由になったということになるかと思います。そのことの価値はまた別の問題で、事実してそうであるということです。もっともこれも「自由」の定義に依存するのでしょうが…

それを考えれば、クラムハンスルが「正解当て」の問題のようにして調性推定を検証に用いたのは、検証としては勿論間違っていないでしょうが、手法そのものの持つ意味合いを考えれば、誤解を招くような使い方であったという見方ができるのかも知れません。本来、そうした「正解」を云々することがそもそも不適切な対象であるからこそ、相関をとることの意義が生じるのではないかと思われるからです。

繰り返しになりますが、伝統的な調性音楽の拡張した形態であるマーラーのような作品の場合、部分によっては調性感が希薄になったり、揺らいだりということが起きることがありますが、それに対して素人は何調と何調との間で揺らいでいるというのを自覚的には言えないかも知れません。そういう場合にもこの分析によってそれが浮かび上がってくることが期待できるように思えます。それは伝統的な楽曲分析と合致するかも知れないし、合致しないかも知れません。でも仮に合致していない場合、だから間違いなのでしょうか？いや伝統的な和声学の基準に照らしてそれが間違いだとして、でも、素人の耳にはそう聞こえてしまうという事実を示唆しているということはないでしょうか？勿論モデルとしての近似の精度が甘くて聞こえている通りに結果が出ないということはあるかも知れませんが、それは別の問題で、ここで確認したいのは、基本的な枠組みとしてこのような手法で調性推定を行うことが何をしていることになるのかという点です。

私はこれを或る種の事実として受け止めるべきではと考えました。調性音楽に親しんだ人の調性とピッチの出現頻度の統計データを使うと専門的な観点から見てうまく行く部分もうまく行かない部分もひっくるめて事実としてこうなるということです。理論的な分析の結果ではなく、寧ろ分析の対象となる事実の一部、楽曲そのものではなく、楽曲の聴取の水準でこのような地形が形成されているのだということを事実として眺める方がいいように感じました。逆に、それ以外には使い道はないかも知れません。それもあって、解釈とかはできるだけ加えずに結果を公開したのでした。

関連して、この手法が音響物理学的に有意味なのか、それとも調性音楽的に有意味なのかについては、調性音楽が音響物理学的にも一定の合理性を持つ限りで前者とも無関係とは言えないでしょうが、一般論として前者ということはなく、後者だろうと思います。なぜならこの推定のベースとなっているクラムハンスルの調性とピッチの出現頻度の相関の統計データは調性音楽に慣れ親しんだ人間を対象とした実験の結果だからです。

*　　　*　　　 *

実は一番最初は紙に五度圏の丸を描いて調性の変化を手書きで書いていたのを見かねて、今ならMIDIデータを解析することもできると教えてくださった方がいたのがそもそもの始まりでした。そして優秀な学者が膨大な時間をかけて、マーラーの作品のうちの一つの、ことによれば更に一部を楽曲分析する、あるいは横断的に眺めるかわりに、個別の作品については「摘まみ食い」になるという現実を目の当たりにして、自分の能力と自分に遺された時間を考えた上で、マーラーの作品の全体を薄く広く眺めるというのを、自分にできる範囲で一旦はやっておきたいと考えたのでした。

ということで公開したデータは撤回せずにそのままにしたいと思っています。勿論、こんなことには価値はないかも知れません。知る限り、私が今公開しているような結果が別に公開されていることはないようですが、そもそも他の誰にとってもこんなデータは意味がないかも知れない。どの程度の価値があるかはわからないし、それを自分で独力で1つ1つ確認する時間はとれませんが、他の誰かがやってくれる可能性もあり、あるいはもっと精度の良い、価値のあるものが出てくるきっかけになるかも知れないという淡い期待にすがりたいからです。

私には価値のあるものを後に残すことはできないので、このレベルのものでさえ、主観的には大事なのです。それゆえ既にやってしまった「暴挙」については、いわば沈みかかった船から投じられた投壜通信の如きものとして、大目に見て頂きたくお願い致します。(2020.1.19執筆、20公開, 22, 27, 28, 2.1加筆. 2023.7.10補足追記)

2020年1月4日土曜日

物語論的分析をする音楽学者と音楽を聴く「子供」とAIを巡る断想(2020.1.4改訂)

　マーラーを対象とした分析の中には、特に物語論的分析と称するものがあって、以前より手元にあったVera Micznikの論文 Music and Narrativity Revisited: Degrees of Narrativity in Beethoven and Mahler (2000) の再読を出発点に、Micznikが参照されている論文を中心に幾つか入手できた（無料で入手できるものだけですが）ものを一通り読み終えて感じたことを備忘のために書き留めたものを公開しました。(マーラーの交響曲の物語論的分析に対する疑問についてのメモ）

　人間が「物語る」存在であることと、人間が「うたう」存在であることとの間には深い関連があると考えますが、文学の一ジャンルである「小説」のアナロジーから、いわば逆立ちするようにして音楽にアプローチするにあたって、前者の媒体である言語の持つ性質を、強引に音楽にごり押ししようとする記号論ベースのアプローチではうまくいかないように感じます。それと同時に、ある時代に確立した制作のユーティリティとしての規範やら、シェンカーの図式のような、これまたある時代の作品を分析して得られた規則性を基準に、そこからの逸脱の距離の大きさで「物語性」の程度を測るというのも、如何にして「音楽」が「物語る」ことができる（かのようにみえる）のかについての説明としては適切でないように感じます。

　その不自然さを言い当てようと考えていて、ふと「子供」がマーラーに接する、（シュトックハウゼンがド・ラ・グランジュのマーラー伝の序文で登場させた「宇宙人」でも良かったのですが、当世風には）AIがマーラーに接するという状況を考えることを手掛かりにできるのではないかというように思いました。

　Webでは英米系のものが入手しやすいのでどうしてもそっちに偏ってしまいますが、マーラーの楽曲分析について言えば、知る限り、シェンカー分析を何等か適用したものと物語論的分析が多いように感じます。前者はもともとはコンピュータを用いた分析を進める方向性が掴めたらという思惑があって読み始めたのですが、結局ところあくまで人間が分析をするためのツール（単なるツールであるかについては、シェンカー自身の思いはまた別にあったようですが）であり、コンピュータを用いた分析への適用は難しそうに見えるのと、分析結果がかなり恣意的に見えたり（シェンカー自身の元々の意図から考えれば、結論ありきであったり）、トリヴィアル（別に難しい分析を経なくてもわかること）に思えたりで、なかなかしっくりきません。後者は領域横断的なものになりがちなので種々雑多ですが、個人的にはやはり音楽自体の構造の分析に基づくものでないと意味がないと考えているため、そういうものを期待して読むと、結局のところ音楽において「物語性」を成立させているものが具体的に何なのかについては、明確とは言い難いような印象を持ちます。

　そもそもが言語を範例とする「記号」として音楽を扱うということ自体に理論的には無理があると思うのですが（音楽が「記号」としても機能しうる点を認めるに吝かでないですが、それはまた別の話）、そこを強引な（にしか見えない、もっと言うとナンセンスに近い気さえする）アナロジーで対応づけるか、それをあっさり放棄して、音楽の「実質」を抜きに、領域横断的な話題に終始するかのいずれかであるように感じてしまい、違和感が募ることが多いのです。そもそもが規範との差分であったり、過去の楽曲、更には他のジャンルの作品との関係に基づくアプローチというのは、そうしたアプローチを提唱し、実践する当事者たる音楽学者の厖大な学識と、高度な分析能力を前提したものであり、例えば私自身がマーラーの作品を聴くときに、彼らの要求するような水準の聴取が出来ているとは到底思えないですし、マーラーに初めて出会った時の「子供」であった私の経験を、彼らの分析は少しも説明してくれない。勿論、高度な分析が、自分が気付かなかったようなマーラーの作品の秘密を明らかにしてくれることを否定するわけではなく、私のような愛好家はそうした分析の恩恵を最も被っているに違いないのですが、それでもなお違和感が残ります。そしてその由来を端的に述べれば、マーラーの音楽を聴く時には、確かに高度な記号操作が行われているには違いないのでしょうが、その背後で起きていること、音楽が人を惹きつけ、感動させ、或いは世界の見方を変えさせさえするといった側面については、そうした分析が語ることが余りに乏しいことに存するように思えます。そして私が知りたいのは、寧ろ、背後で起きていることの側であり、それが起きるメカニズムの側なのです。

　背後で起きていることは、一般には心理とか情動という言葉で語られ、そうした側面についての研究も行われていますが、それらの多くは、あえてやや戯画化した言い方をすれば、何種類かの作品を与えて、何種類かの感情なり、情動なりのタイプを事前に決めておいて、その間の対応づけを行うといったレベルに終始する限り、余りに肌理が粗すぎて、ここで私が知りたいことに対する回答はおろかヒントさえ与えてくれるようには思えません。せめてよりミクロな音楽の脈絡に応じて、聴き手の「心」の内部で起きていることに対して、例えば今日ならば脳の働き方を測定することによって探りを入れるようなものであるべきだろうと思います。勿論、そうした実験結果から言いうることと、ここで私が知りたいと思うこと間の径庭は大きいと思います。例えばデリック・クックが『音楽の言語』で試みたようなアプローチを考えてみると、今や辛うじてながら、それでも異なる文化的伝統を身体化している極東に住む我々から見れば、そこで試みられている音型と情動の結び付けは、全く恣意的ではないとはいえ、非常に多く文化的・社会的な文脈で形成されるものであることは間違いなく、他方でそうした我々が、クックが解明しようとした伝統に属する音楽を「聴く」ことができるからには、文化的・社会的決定論というのも誤りで、その結び付けが学習によって後成的に形成可能であることもまた、明らかであるように思えます。であるとするならば、その結び付けの手間で、そこに辿り着く前に音楽の構造の側でやれることはたくさんある筈です。

　批判ばかりしていないで、では具体的にどうすればいいのかについて述べるべきとは思いながら、漠然とした予想めいたものを書き留めることしかできないでいることは上記のメモ書きの末尾に記した通りですが、それでもこれまでデータ分析の準備を進めてきた中で、具体的なあてが全く見つかっていないというわけでもありません。MIDIデータから抽出したある時点なり時区間毎に鳴っている五度圏上の音名(ピッチクラス)の集合を12音各音を1ビットとする12ビットのベクトルで表現すれば、このベクトルのビットの遷移パターンの力学系を考えることができるでしょう。遷移規則も伝統的な和声学や対位法、楽式論のような既成の規範に基いて天下りに与えるのではなく（そうしてしまうと規則からの逸脱を測るといった発想から逃れることは困難です）、実際の作品が描き出す軌道から法則性を抽出するといった方法をとることができるでしょう。この枠組みだと機械学習で規則を学習させるというのも可能でしょう。ただしこのアプローチで大規模で複雑な作品をどこまで分析できるかはわかりません。伝統的には和声の遷移パターンに帰着できる側面に限定すれば、モデルは単純化できるでしょうが、何よりも「うたう」ことを念頭に置いた場合、旋律と旋律の複合としての対位法がマーラーの場合には特に重要なのは明らかで、調的な図式を抽象した分析ばかりをやっていては取りこぼしてしまうことがあまりに多く、さりとてそれを回避すべく、いわゆるセカンダリー・パラメータと呼ばれる特徴量をきめ細かに捉えようとすると、次元は瞬く間に大きくなり分析は困難になることが容易に予想できます。

　これを裏返してみると、「子供」が音楽を聴く時どんなに複雑で精妙な情報処理が行われているかということに他なりません。そこで起きていることをコンピュータ上の分析に置き換えることを考えようとした途端、まず直ちにその事実に圧倒されてしまいます。他方、記号処理のレベルでは、個別の分析に限れば（アドルノのような）博識で怜悧な音楽学者の分析に負けず劣らずのレベルにAIが達する可能性だってないとはいえないかも知れませんが、「うたう」ことの基層の「共感」の次元、歌うこと、聴くこと、創ること、分析することの基層にある衝動の次元は、生物としてのヒトの進化の（最大限に譲歩して、ピンカーのいうようにパンケーキに過ぎないとしても）副産物であり、まずこのレベルでAIには無縁のものです。勿論、人工生命のようなアプローチで進化の過程をシミュレートするアプローチは可能ですし、その意義を否定する訳ではありませんが。

　更に「物語る」ことについては、まずは獲得された言語との共進化の産物であり、これまた社会的・文化的進化の産物であるという側面を持ちます。更に加えて「物語る」ことは、反射的な衝動ならぬ精緻な目的論的図式の獲得と密接に関わります。この水準においては、何のために歌うのか、何のために聴くのか、何のために分析するのか、そして究極には何のために創るのかを問うようなフレームをAIが自らの中に持たなければ、AIがそれらを「する」とは言えないことになります。「芸術」の領域においては、この違いを素通りしようとする研究は、「芸術」というものに取り組もうとしていないという点で不毛であると私は考えます。適用分野は異なりますが、詩歌や小説をＡＩに生成させる試みは古典的なテーマであり、かつ簡単なプログラムであれば作成は難しくありません。仮にそこで、ボルヘスの『伝奇集』の中の一篇、「ドン・キホーテの作者、ピエール・メナール」のように、一字一句本物とと区別がつかない作品をＡＩが生成したとして、工学的な意味合いでは合格するでしょうが、こと「芸術」に関してはそうではない。ピエール・メナールの場合であれば、彼自身が再創作をする衝動を持って自らそれを行ったわけですが、ＡＩの場合には、ＡＩのプログラムとプログラムを作った作者に分裂していると考えるべきであり、その両者を包含する「システム」全体が「芸術」に関わっていると見做さなくてはなりません。ＡＩを研究する工学者の中にはその点を意識してかせずか、敢て無視して「ＡＩには創作する意志などありません」といったことを言う人もいますが、これは一見否定的な表現を使って逃げ道を確保しつつ、ＡＩに主体性を密輸して仮託させることになっていて、控え目に言ってもミス・リーディングな言い方であり、強い抵抗感を私は感じます。一方では、そうした点を正確に踏まえて、人工生命系を用意して、その中のエージェントに嗜好を与えるところから始めてボトムアップに「芸術」の生成に至ろうとする研究の方向性もあり、こちらは大いに注目すべきであると考えます。しかし仮に人工生命的なアプローチで生物学的水準のシミュレーションができたとしても、「芸術」が成立するのは更に異なる階層の話であり、確かに生命的・生物的な基盤を持つとはいえ、その進化のプロセスの果て、もしかしたら或る種の行き止まり、袋小路であるかも知れない、マーラーのそれのようなロマン派の末端に位置付けられる音楽を「聴く」ことをシミュレーションするのは、目も眩むような企てに感じられます。「作曲することは世界の構築に他ならない」というマーラーやシュニトケの発言は、この文脈においてこそ、文字通りに受け止められるべきなのです。

　というわけで、音楽を「歌う」「聴く」「分析する」「創る」ことをAIにやらせるという構成論的アプローチは端から諦めて（それは他の若くて優秀な人々に相応しい課題でしょう）、せめて音楽が「物語る」ことを可能にするメカニズムを音響態としての楽曲の分析によって探るアプローチの方をわずかでも進めることができないだろうか、そしてあわよくば、そうした（人間が分析主体の）楽曲分析と、楽曲のデータを入力としたコンピュータを利用した分析との橋渡しができないか、というようなことを考えているような次第なのです。（2019.11.6初稿を別のブログに公開、11.10一部改訂, 12.24改訂の上、本ブログ上で再公開, 1.4加筆）

2019年12月22日日曜日

マーラー作品のありうべきデータ分析について：調性推定を巡る対話

　以下の文章は、以前に書いた記事「MIDIファイルを入力とした分析の準備」https://gustav-mahler-yojibee.blogspot.com/2019/12/midi.html に対してお寄せ頂いた分析手法に関する疑念に対する私の「応答」です。疑念は、いわゆる音楽学の立場からの極めて正当なものであり、多くの方が多少なりとも同じような疑問を抱かれていると想像されること、そして個人的には頂いた質問に対する答えを記す過程で、クラムハンスルの手法の適用のどこに私がひっかかっていたかが明確になったことから、その内容を、私なりに整理・編集した上で以下に公開します。問い・応答のいずれも元のままではなく、いわば仮想的に再構性された「対話」であることにご留意頂けますようお願いします。

* * *

1.調性音楽は文化的な構築物であり、かつ言語のように階層的な構造を持つ。喩えてみれば、語以上のカテゴリの問題を、音素レベルで分析するようなもので、要素に還元していく自然科学的なアプローチには限界があるのではないか。

まず、誤解はないと思いますが、私もさすがに区間内の音の頻度の分布で調性が完全に説明できると考えてこの分析をやっているわけではありませんし、それはクラムハンスル自身も同じだと思います。ご指摘の点は、事実としてまさにその通りであると私も考えています。また、音楽情報処理の分野でも、自然言語のアナロジーで音楽を分析するアプローチも行われています。調性の推定に関連したところでは、例えば　Fred Lerdahl の Tonal Pitch Space, Oxford University Press, 2001　では、著者が言語学者の Jackendoff と構築したGTTM（Generative Theory of Tonal Music 生成音楽理論）に基づく分析アプローチが提案されています。

　ただし、自然言語に比べると音楽の統語論に相当するものは、遥かに自由度が大きいこと、その一方で、自然言語ではいわゆる「文」のレベルがあり、その上に「テキスト」の階層があってその区別が明確なのに対して、音楽の場合にはその区別が必ずしも明瞭ではなく、いわゆる楽式に相当するレベルについて、自然言語の単純なアナロジーが通用しなさそうな点など、類似している点がある一方で、相違点もまた大きいようです。私見ですが、言語の場合には、書き言葉と話し言葉の区別がありますが、音楽は、情報処理上の観点からすると後者に近く、更に文字言語と音声言語の区別についても後者に近いではないかと思います。

　そして実を言えば、私のように旧世代のAI研究を齧ったことがある人間が、今日の統計処理ベースのAIに対して抱くのは、まさにご指摘のような点なのです。（ちなみに付言すれば、近年のAIの得意・不得意ということがだんだんと整理されてきていて、どうやらやっぱり「言語処理は不得意」という、至極まっとうな結論が共通認識になりつつあるようで、ある意味ほっとしています。そしてその理由を突き詰めれば、ご指摘のような性質が、現在注目を浴びている手法に適していないということに繋がります。）

　ですから、これでマーラーの作品が分析できた、とは全く思っていません。対象を調性の推定に限定しても、ここでやっている処理は、人間のやっていることのほんの一部だけを取り出していることは明らかですし、得られた成果はと言えば、分析のための素材が一つ手に入ったくらいにしか考えていません。あくまでも分析の準備であって、分析そのものはこの先にあるものと思っています。
　
　あえてオリジナルな改良とかをせずにクラムハンスルのアルゴリズムをそのまま用いたのは、それなりに知られたもののようなので、それをマーラーの楽曲に適用したことが（他に既に行われていれば全く価値がなくなりますが）、一般的な資料としての価値を持つのでは、というような発想によります。もう一つ言えば、この手法は非常にシンプルですから、或る要素だけでどこまで行けるかということを、これまたマーラーのケースについて確認することに意味があるのではなかろうかと考えた次第です。

2.調性音楽の階層的な構造やその構造に基づく規則は、聴き手にも共有されており、それを前提にしてはじめて暗示とアイロニーのようなものが成立する。そうした前提なしに、音楽が多義的であったり曖昧であったりといった側面を捉えることはできないのではないか？

こちらもご指摘の通りだと思います。但し、ルールの共有の程度は様々だと考えます。作曲者や優れた音楽学者と経験のない子供では差があって、私のような、マーラーを聴いた回数だけは多くても、きちんとした楽理の教育・訓練を受けていない聴き手は、更にまたちょっと違うかも知れません。そして私は、どちらかといえば、子供の立場で眺めたいと思っていることは、既に別に記載した通りです。無意識にルールを学習可能、ないし、或る程度学習しているけど、ルールを「理解」できているわけではない聴き手にとってどう聴こえるのか、自分がマーラーの作品の調的過程をどう感じ取っているのかの近似値のようなものを取り出せないか、と思っています。上掲の Lerdahl の分析とかもそうですが、多くの分析は、楽典の知識を前提とし、例えばある区間の調的文脈が別途分析によってわかっているものとして（つまり推定の入力として）いる場合が多いように思います。しかし或る意味では楽典の知識を駆使した分析は、ここで想定している現象学的な問題設定に対しては、先回りしていることになるように私には思われます。またこのことは、創作の水準での分析か、聴取の水準での分析か、ということにも関わると思います。例えば、Timoczkoは、自分の理論が創作の側の理論であることを明確に述べています。しかしここでの関心は、聴取の水準なのです。従って、理論はできるだけ前提としないで、聴こえる音のみから分析するというのが（現実には完全にそうであることは不可能にしても）、理念的な原則となります。

（もっとも、実際問題としては、楽典の知識を全体とした分析をやろうとしたら、私の能力では、余りに手間のかかる作業となって、ちっとも結果が出ないことになりそうですし、マーラーという特殊な事例研究でなければ、実はＡＩの分野では、既に半世紀前に、非常に有名なウィノグラードの研究があって、楽典の知識を総動員したらどこまでやれるかについては、既に、最初の段階で天才がやりつくしてしまっているというのもありますが。）

　上記を踏まえた上で、マーラーに関して、クラムハンスルの調的階層を用いて調性推定をやることの意味に戻りますと、以下のようになると考えます。

　まず、クラムハンスルの調的階層というのは、ある意味ではどっちつかずのものだと考えます。つまり、ある意味では、還元・再合成という操作でありながら、それをやる際に
認知心理学的な実験の結果に依拠するので、ある文化的な構築物のルールをある程度共有している平均的な「聴き手」を想定していることになります。これは科学的アプローチを文化という名の「予見」を排したアプローチと捉え、人文系的な文化的な構築物についての知識（＝解釈学的には「前了解」とされるもの）を前提としたアプローチとの対立を厳密なものと捉える観点からは、科学的アプローチの中に人文学的アプローチを（統計情報という形でですが）いわば「密輸」しているとも言えるかと思います。

　科学的アプローチで行くなら、そうした「密輸」はやらないで、とことん予見を排したアプローチをすべきであり、調性の推定を、例えば音響に関する法則のような、文化非依存のものだけに依拠してやればいいのですが、私はそもそも音楽というのは物理法則のようなものではなく、文化的な構築物だと思っているので、それには原理的な限界があると思っています。（何しろ、意識のような一般的にはそうでないと思われているものについても、ある程度は文化的・社会的な構築物であると思っているくらいですので…）従って、科学的な還元主義的な発想からは循環に見えても、それは事柄の性質上、寧ろ当然だと考えています。（これも「補遺への追記」に記載した通りです。）まさに解釈学的な事柄に付きまとう循環だと思います。

　「マーラー作品のありうべきデータ分析について：補遺への追記」（https://gustav-mahler-yojibee.blogspot.com/2019/12/blog-post_12.html）の中で検討したのもまさに上記の点で、実はその点が明確になっていないと感じて、公開後に追記を行っていますが、それよりも、替りにその末尾を以下に自己引用することで、私の立場の再確認をしたく思います。

「データに基づく分析をやろうとすると、優れた音楽家や音楽学者でない、平均的な聴き手が無意識に行っている情報処理ですら、その複雑さに圧倒されてしまいます。更に言えば、（それ自体が優れた研究者が苦心の上に編み出したものであって、そこでの捨象の操作の背後にある情報量の大きさに留意するのは勿論ではありますが、その一方で）認知心理学実験で用いられるような単純化されたものではないマーラーの作品のようなものを「聴く」時に背後で起きている情報処理のプロセスの複雑さは、途方もないものだし、そのプロセスを支えているシステムの複雑さ、生物としての、社会的存在としての、美的主体としてといった階層の深さには目眩さえ感じます。ましてや優れた音楽家や音楽学者が直観的に掴み取る、ある作品の特徴を機械に取りださせるというのは途方もない企てに感られます。（そういうことからも、AIと音楽との関係におけるチューリングテストは、人間が聴いてそれっぽい音響を自動生成することがでるかどうかといったレベルにはなく、音楽を聴いて、それに感動したり共感したりすること、その感動や共感について分析できることのレベルにあるのではと思えてならないのです。）その全てを踏破することなど思いも及ばぬことですが、それでもなお、そうした企てへの第一歩と呼べるようなものでなくても、そうした歩みへのせめて呼び水となることを願って、今後も少しずつ手を動かして、その結果を公開していきたいと考えているような次第です。」

　更に言えば、データに基づく分析というのは、あくまでも「ここでの」立場に過ぎず、それが私の通常の聴取の態度というわけではありません。実のところ、私は常にはもっと「情緒的」に、或いは「生理的」に、精神的なバランスをとるための或る種の「治癒」として音楽に接しているような気がします。何しろ私の場合には、色が見えたり、風景が見えたり、臭いや湿度を感じたりといった「クオリア」の印象が圧倒的です。この点では、残念ながら、アドルノの『音楽社会学』における聴取の類型論上、あまり褒められた類型には属さない、結局のところ創作者や知識ある分析者の立場では聴いていない自分の聴き方を確認したいということなのかも知れません。

　ただ、マーラーに関して言えば、伝統的な図式では説明できない側面があり、アドルノがDurchbruch / Suspension / Erfuellung といった類概念を持ち出し、自ら「小説」に類比した独自の時間的構造にアプローチしようとしているという消息もあり、伝統的な楽曲分析とは違った分析のツールが必要ではないかと感じていることは、これまで繰り返し記述している通りです。まだまだ先は長いとはいえ、そうしたアプローチの一つとして、データに基づく分析というのを位置付けているという点も付言したく思います。つまり、調性音楽の理論があまりに高度に完成され、合理的にできているが故に、その末期に出現した（かつては病的と言われることもあった）マーラーのような事例に接するためには、一旦遠回りをしなくては見えて来ないものがあるのではないか？というように思うのです。

　最後に、音楽理論にしても伝統的な調性音楽の聴き手の統計的平均像にしても、それ自体抽象物には違いありません。しかも科学的に要素から組み上げられたものではありません。寧ろ、ブリコラージュの過程で少しずつ理論化されたものと考えた方がいいように思います。そして別の文化的社会的文脈では、別の音楽があり、やはり理論があって聴き手がいます。ガムランは、倍音列について「合理的」なアプローチをしない、結果として完全五度音程を基礎としない稀なシステムを持っているようですが、それさえも、異なる伝統に属する人間にとって（誤解はあるかも知れませんが、ある程度は）、理解不能ではなく、「音楽」として「了解可能」です。そういった点を踏まえ、自分がそもそも100年後の地球の反対側、「仮象」たる「中国」の更に向こう側に棲んでいる子供としてマーラーに出遭い、（実はこちらの方が時間的には後なのですが）能楽のようなものにも継続的に接し、更には「トータルセリー以後の音楽」に接しつつも、今なおマーラーを聴いていることを思えば、完全には無理でも、せめて異文化接触という現実の状況に即して、できるだけ調性音楽固有の文脈や内部の論理に依存しない形でマーラーの作品を眺めてみたいというのもあります。近年しばしば「ビッグデータ」の時代ということが言われますが、或る意味では「ビッグデータ」に蚕食された世界に生きる者ならではの発想で、（何なら、その「症例」の一つとして、）こういう分析が、それとは最も隔たっていると通常は考えられているマーラーの音楽のような対象に対して行われる、ということでもいいように感じています。

要約すると、ご指摘の点について異論がないにも関わらず、なぜあえてデータ分析のようなことをやるのかと言えば、

理論の知識なしで何が聴こえるのかをシミュレートしたい
規範的な理論からは逸脱と見做される現象の背後にある論理を捉えたい
文化的文脈の外部を意識して、文脈依存性の少ない見方をしたい

ということになるでしょう。そして得られたものは分析そのものではなく、あくまでも分析のための素材である。ということになるでしょうか？

3.調性音楽の意味は時間の中で開示されていくものであり、ここで実施されたような計量的な分析は、多かれ少なかれ時間プロセスを捨象したものではないか。

このご指摘は非常に重要な点かと思います。何しろもともと、これら一連の検討・分析は、その出発点を記した記事、「MIDIファイルを入力としたマーラー作品の五度圏上での重心遷移計算について」（https://gustav-mahler-yojibee.blogspot.com/2019/09/midi.html）でその目論見を記載した通り、時間性の分析をするのが最終目的ですので。実際の分析が懸念に十分にお応えできているかは議論の余地があるかと思いますが、この点は今回の分析では、それなりには配慮したつもりです。

　今回の分析では、拍内で鳴る音については鳴る順序はつぶれてしまい、持続（音価）のみを扱い、或る拍が「何調」に聞こえる、というのを平均的な聴き手の判定の情報を基にして計算します。従って、この点ではご懸念の通りではあります。一方で、次の拍では、一つ前の拍と現在の拍の2区間の情報で計算をします。そしてこうした時間の推移による情報の累積を1小節の区切り迄やります。次の小節に入ると、前の小節の情報は忘れて、同じことを、曲の終わりまで繰り返します。結果的に、小節単位にその小節は「何調」に聞こえるか、というのを順番に求めていることになります。小節内でも前の拍で鳴った音も含めての分析となっていますし、クラムハンスル自身の実験とは異なって、小節毎の推定を、一貫した調性に基づいた作品の冒頭についてのみ行ってその曲の調性を推定する目的で行うのではなく、発展的調性を持つ、曲頭と曲尾が必ずしも同じ調性でない作品の全体に対して行うことで、調的な中心の軌道や、その安定性の変化をトレースしてみようという目的で行っています。推定に用いる情報をローカル（ここでは小節単位）なものに限定しているのは、調性音楽の中でも古典的な作品を範例とした分析ではしばしば前提とされる大域的な調性の枠組みの前提を、ここでは一旦外したかったというのもあります。

　勿論、より多くの情報を見るように、或いは区間内でどういう順番で音が鳴っているのかも見るように、など、色々と改善の方向は考えられますし、区間についても機械的に1小節で区切るのではなく、もっと意味のある単位で、或る時には1拍が単位になり、或る時には数小節が単位になるように区間を適切に変えてやるべきなのでしょうが、これはまた別の問題を解くことになります。即ち、それを機械にやらせるときに、外から「区切りはここ」というのを別途教えるのではなく、入力として受け取った音の情報だけから、自動的に区切りを見つけて、その区間で調性を判定させるようにするにはどうしたら良いか、という問題を解かなくてはなりません。

　というわけで前途遼遠、課題は山積ですが、とにかく最初は機械的にやってみたらこうなりました、というのを公開したということになります。

　なお、この「外から教えない」で「データに基づいて判定させる」という点が一つポイントと考えています。とはいえ、小節の区切りは偶々MIDIデータに含まれていることになっていて使っていいことにしていますが、音響データならそんなものはありません。MIDIの情報というのは12音平均律前提でキーナンバーが振られていることから始まって、ある程度の「フレーム」の下で出来ているわけで、厳密に言えば、「密輸」も程度問題ということになります。例えば調号だってMIDIデータに含めることが出来ます、入っていれば使っても言い訳ですが、こちらは逆に使っていません。調号通りに調が変わるわけではないから、というのもありますが、実際にはほとんどのMIDIデータで調号の情報はまともに入っていない、という現実がある、というのも大きいです。ともかく、でもできるだけMIDIノートの音高と持続の情報だけでやる。小節の区切りは、必ずしも意味の区切りではないので、最後は使わずに済ませたいですが、機械的に簡単に実験するために、手始めとして利用しているとお考えいただければと思います。）

4.例えば、中心音ということでも、単一の音、2つの音が鳴った時点ではそれは明確ではなかったのが、時間的経過の中で新たに出現する音により、徐々に明確化されるということが起きたり、中心音が常に鳴っている、実際に鳴る音はその周囲を旋回するだけ、といった事態はごく普通に起きるが、実際に鳴っている音のデータに基づく分析で、こうした事態を扱えるのか。

　この点も前の点と並んで個人的に重視したい点です。これは特に「マーラー作品のありうべきデータ分析についての予想：発展的調性を力学系として扱うことに向けて」( https://gustav-mahler-yojibee.blogspot.com/2019/11/blog-post_10.html )の後半に書いたことですが、まさに調性が曖昧になったり、潜在的に複数の選択肢があったり、という状況をデータ処理で浮かび上がらせられるような枠組みを探索しています。

　今回のやり方では、（一応、一番相関が高い調性に色をつけてみましたが）、区間ごとに、各調性との相関の推定値を求めています。あるところでは、相関の最大が0.5くらいで、しかも2つの調で同じくらいだとしたら、或る種の宙づりがそこで起きている可能性がある、という具合で、一応、数字によって曖昧さや多義性を扱おうとしています。

　繰り返しになりますが、調的推定は極めて複雑な過程なので、このデータ処理だけで十分ということはなく、例えば別途、和音（和声ではなく音の部分集合、ピッチセットですが、転回形の情報も付けることができます）を取り出すプログラムも作ったので、それと今回のデータを組み合わせれば、上に例示頂いたようなことがデータで語れないか、というように考えています。(2019.12.22公開)

2019年12月12日木曜日

マーラー作品のありうべきデータ分析について：補遺への追記

以下は、記事「マーラー作品のありうべきデータ分析について：補遺」の更に補足となります。背景については元記事（https://gustav-mahler-yojibee.blogspot.com/2019/12/blog-post.html）をご覧ください。

(1)まずは気になっていたティモチコの『音楽の幾何学』。これはかなり手強い内容なので、きちんと読むには時間がかかりそうですが、基本的な前提のところで、今考えている方向とはずれがあるようです。例えば中心音と音階は独立だとする。これは原則としては勿論正しいのですが、結果的に個別の（例えば機能和声の、条件つきの、経験的なものでしかない）合理性の在り処を説明する方向には向かわなさそうです。寧ろ、抽象化をしていった上で、その過程で削り落とした要素をそれぞれパラメトリックに独立に扱えるように幾何学化するとどうなるか、という探求のようです。勿論、そうした抽象化の進んだ次元で見えてくる法則性のようなものはあるでしょうし、機能和声や伝統的な対位法では禁則であっても実は合理性があるのだ、というような説明が可能になることもあるでしょう。更に言えば、音楽を抽象化して行って出来るだけ一般的に秩序だてようとする点で、寧ろ三輪眞弘さんの「逆シミュレーション音楽」をはじめとする「ありえたかも知れない音楽」の仮構のような方向性と親和性が高いように思います。

(2)次にクラムハンスルの『音楽的音程の認知的基礎』および（こちらは邦訳のある）アイエロの『音楽の認知心理学』所収のバトラー、ブラウンの「音楽における調性の心的表現」について。これらは認知心理学の実験結果なので、基本的には理由づけを分析することは一先ず措いて、ある文化的・社会的文脈での習慣づけ＝学習の結果を帰納的に（平均化して）求めて行く。結果として得られるものは発見的（ヒューリスティック）な規則になります。だから母集団を変えたら結果が変わるかも知れない一方で、母集団を変えても、「ヒト」であれば基本的には安定した規則性というのが見つけられる可能性はあり、帰納的な極限として（西洋的な）「人間」のみならず、「ヒト」普遍の法則を見出すことはある程度可能でしょうし、実験結果はそれの一定の誤差つきの近似と捉えればいいように思います。

　但しこの規則を正しいとして中心音決定することの意味は確認が必要と感じます。これ自体が目的なら問題ないですが、これを更に和声の機能を調べるために使うとすると、論理的に循環が生じうる、つまり中心音の発見的規則の中に和声の機能に由来するファクターが含まれている可能性が高く、もしそうなら、形式的には「中心音で機能が決まる。機能に基いて中心音が決まる。」という循環があるように見えるからです。

　もっともこの循環は、まずはそれぞれの「機能」という語で指示されている対象が同じでないかも知れませんし、その点を考慮してなお循環があるとしても、排除されるべきものではなく、対象の性質からいって、物理的法則のようなものを想定するのは妥当ではなく、寧ろ生物のような複雑系に近いと考えれば、ブートストラップ、自己組織化のようなものにつきものの再帰性の現われとして正当化されるものではないかと思います。

　ただし、これは対象が平均律と機能和声の枠組みに基本的に依拠しているマーラーの音楽だからであることには留意しておきたいと思います。仮に今、分析しようとしている作品が、12音平均律には基づいていても、機能和声に支えられた12音各音を主音とする長調・短調の調的システムには基づいていないとします。その時、クラムハンスルのアルゴリズムでの推定が意味がないことは明らかです（そもそも、適用しようとは思わないでしょう）。敢えてそれを行ったとしてわかることは、別の調的システムで作られた音楽を、西洋の伝統的な音楽を聴いてきた人間が聞いた時、敢えてそれを西洋の伝統的な音楽におけるシステムの内部で捉えようとしたら、どのように捉えられるか、ということになるでしょう。この場合には、最初に述べた循環が表面に出て、致命的なものとなってしまいます。

(3)ただ、ここで差し当たってやろうとしているのは、中心音の推定なのか、それとも調性の推定なのか、マーラーを対象とする限り、その両者は理論的に関連しているものの、厳密には一般には両者は独立ですから、その2つを区別する／しないについての確認を念のためにしておくことにします。

　クラムハンスルの調性推定のアルゴリズム（およびその変形）を用いて何ができるかと言えば、厳密に言えば、それはあくまで特定の時間枠の中で鳴っている音の集合からどの調性との相関が最も大きいかを推定することであって「中心音」そのものの推定ではありません。平均的にどの調性だと判断されるかの確からしさが求まるだけです。そしてその上で、調性が推定されたとして、調性の定義に従属するものとして中心音が定義されるならば、調性の推定結果（24の長調・短調の各調性との相関を表すベクトルの系列）に対してある変換を施せば中心音の軌道に変換できるということになります。変換に当っては、例えば、長調と短調における中心音の安定性の違いを加味したりすることになるでしょう。

　更に中心音の定義を重心の如きものとしようとすると、今度は重心を計算する空間の定義が必要となります。避けようと思えば12のピッチそれぞれの確からしさの分布そのものが中心音であるとしてしまえば余計な問題は回避できるわけですが、既にマーラーの作品のMIDIデータを入力として五度圏上の重心計算をやっているわけですから、改めて重心計算について考えてみます。
　
　結局、中心音の重心計算がそこで為される空間自体が、（経験的な）調的相関で定義されるものであるなら、筋道としては「調性の推定（クラムハンスルのアルゴリズム、音の出現分布の相関度に基づく）⇒調的相関（これ自体、各調性における音の出現分布同士の距離として計算された結果）の空間における重心としての中心音の計算」となって、これはこれで矛盾はなさそうです（勿論それは、西洋近代の調的システムという「閉域」にいるから矛盾が起きないということに過ぎないのですが）。わざわざ中心音の空間を定義する意味があるか（「閉域」の中にいる限りにおいては、結局分布のある幾何学的表現に過ぎない）を気にしなければ、これはこれでいいように思えます。

　一方、重心計算ではなく、マーラーの作品のMIDIデータを入力とした調性推定結果自体において、例えば調性の曖昧さの度合いやコントラストなどについて様々な特徴が検出できたとすれば（この特徴も、何らかの平均なり特定の別の対象との比較として取り出せるものでしかないですが）、それはマーラー固有のものとして構わないように思いますし、発展的調性を力学系的に捉えるという観点からは、寧ろ適当なような気もします。

　こうして考えると、マーラーの作品の分析なら、差し当たり出発点としてクラムハンスルの調的階層が前提とする調的システムに基づいて中心音を定義することが大きな問題になることはない、従って結局、まずはつべこべ言わずにクラムハンスルのアルゴリズムなり、その変形を使った分析をやればいいし、それをやる意味はありそうだ、というのが結論のようです。

(4)上記の点に関連して、私の前の記事での議論は、一見するとそれ自体、自己矛盾に陥っているように見えると思います。つまり一方で、倍音のような物理的法則に従うレベルの事実は、一定以上の根拠にはなりえないということで、文化的・社会的な多様性が生じる余地を要求しながら、クラムハンスルの実験結果のように帰納的に求められた規則に対し、それが文化的・社会的な条件に制約された一定の集団の平均値に過ぎないという点において留保をするというのは、無い物ねだりなのではないか、では一体何に根拠をおこうというのか、という問いが成り立つと思います。

　それに対しては、（まさにそのような書き方をしたと思いますが）クラムハンスルの実験結果のようなものを全面的に拒絶するつもりはなく、それを分析の手段として（消極的・暫定に）利用することは否定しません。（というか他に手段がない。）それは飽くまでも（機能和声の「規範」とか、「音階」「旋法」のような理論的概念を援用して分析することも同じだと思いますが）問題にアプローチをするための一手段に過ぎません。

　例えばクラムハンスルに対して、バトラー、ブラウンはより文脈依存性にフォーカスした実験を行っているわけですが、いずれの実験結果についても物理法則レベルの根拠はなくても、生理的・知覚的水準での準・法則的なものを想定するならば、それが一定のレベルで反映されたものであると考えることは可能だろうと思いますし、それを用いることに問題があると考えているわけではありません。

　問題が起きるのは、例えばそうした実験的・経験的な事実が、価値判断の尺度になる時です。平均値に近ければ近いほど「優れている」わけではないし、逆に遠ければ遠いほど「優れている」わけでもない。遠い方について言えば、遠ければ「オリジナル」とは限らないし、「オリジナル」であることと「興味深い」ことはまた別です。（この辺りの事情は、各学問領域における研究の価値とパラレルな側面があるような気がします。）物理的に「協和的」であることと、感覚的に「協和的」であることは既に一致せず、後者は文化依存であるとされています。一方で、いずれの尺度においても「協和的」であること（あるいはその逆）が、そのまま作品の価値を決める尺度となるわけではありません。

　同様に、例えばクラムハンスルは、実験で求めた調毎のピッチの出現頻度の分布に基づき、調性間の距離を計算してマップを作成していますが、このマップはあくまでも或る時代の文化的・社会的な平均的プロトタイプに過ぎません。それは規範のレベルでの機能和声理論に対応する、経験的・帰納的レベルでの等価物であると考えることができるでしょう。勿論これを基準とした個別の作曲家の作品の特徴づけを行うことは可能だし、問題はないですが、規範としての機能和声への忠実度が作品の「興味深さ」を直接決定する尺度にはならないように、それもまた、作品の「興味深さ」を直接決定する尺度にはならないと考えているということです。「興味深さ」を探るとなれば、そこを出発点としながらも、更にそこから離れて、アドルノ風の「ミクロロギー」に拠らなくてはならないのではないか、「唯名論的」にその作品固有の論理を明らかにすることによってしかできないのではないかと思うのです。そして繰り返し述べるように、そうした分析を行う際には（そうした分析だからこそ）、データに基づく裏付けが必要なのではないかと思う一方で、データ分析によって出て来るのは（少なくともここで論じているレベルのものは）あくまでも「素材」に相当するものに過ぎす、それ自体がそのまま「答え」になることはないように思います。

　もともとが、非西洋人である「私」がマーラーを聴くとき一体何を聴き取っているのか、というのが問の発端でしたが、その「私」とてマーラーを含めた西洋音楽を聴くことで脳内にマップを形成しているわけですし、結局のところ目的は「私が受け止めたもの」そのものではなく（それは私がトリヴィアルな存在であるのに応じて矮小化されたものになっていて、そんなものに価値はないので）、それを可能にしたマーラーの作品の背後にある論理を分析することにあるのですから、「私」とクラムハンスルの調的階層の背後に存在する平均的な聴き手との偏差に拘っても仕方ありません。

　その一方で、クラムハンスルの調的推定の結果はそのまま用いるべきではなく、中心音のような、より一般的な理論的概念を措く操作は必要なのではないかと思います。マーラーの音楽は、そもそも私が済む極東とは異なる文化的に属している筈ですし、それは既に1世紀も前のものなのです。一方では固有の伝統に属する能楽に接し、他方では、マーラー以降の西洋の音楽の更にその先にあって、まさに同時代の音楽である三輪眞弘さんのように、倍音列において最も基本的な完全五度に基かないガムランに基づく作品もあれば、はそもそも音律すら前提としない作品もあり、かと思えば、12音平均律に基づきつつも伝統的な機能和声に基づく調性音楽とは異なる調性へのアプローチを試みた作品もあるような「音楽」にも接している現実の状況を踏まえて、特定の文化的な文脈に依存しない、より一般的な仕方で、経験に即した「自然」でかつ「興味深い」中心音の定義をマーラーの作品に即して考えることが、マーラーの作品の背後にある論理を探る際のきっかけになるように思えるからです。そしてその出発点として用いるのであれば、クラムハンスルの調的推定は妥当であるといって良いように思われます。

(5)ここで元々の問題を改めて取り上げて確認してみます。元の問題はI⇒V,VI⇒Iはどう違うか、IとVはパターンとしては同じなのに機能が違うのはなぜ、という問いでした。これはマーラーの個別の作品の特徴がどうの、というのとは一先ず別の次元の問題です。

　答えは「あるパターンが別の機能を持つのは、そのパターンが出現する文脈による」というものでした。文脈を中心音が定義づける、中心音は調性推定の確からしさと等価であるならば、そのパターンの出現する調性が異なる＝中心音が異なるからで構わない。では調性はどのようにして決まるのでしょうか？それは多分そのパターン自体を含めた、でもそのパターンだけではない、水平方向、垂直方向の両方向での周辺の音の分布で求まるということになるでしょう。

　ここで音の分布⇒調性の推定の手段は　統計的に求められた相関に基づくとします。それは経験的に学習されたものですが、何かそこには物理的ではなくても知覚的な法則性のようなものは認められるかも知れません。それが仮に経験的に求められたものに基づくものであったとしても、「中心音は、天下りに与えられてはならない」という要請に対しては、中心音を、或る区間で鳴っている音の集合（つまり入力データに含まれている情報）から求めているということで充足しているので、この方法で構わないことになります。

　鳴っている音の分布⇒調性⇒中心音、という論理が辿る筋道がクラムハンスル的な経験的な根拠によってしか可能でないとしたら、その経験を形成するのが分析対象となる作品を含めた聴取の経験による、という点に循環がみられるでしょうが、この点については(2)で検討した通りで、循環は問題にならず、寧ろ対象の性質上、必然的なものと考えます。調性音楽を支える論理というのは、倍音列のような物理法則の水準にあるものではなく、文化的な構築物であって、寧ろ「解釈学」の対象と考えるべきで、循環は元々備えている性質であると考えるべきです。

　では、この問いはトリヴィアルだったのだろうかと考えると、上記のような答えが直ちに思い浮かぶのであれば（ご覧の通り、残念ながら私にとっては自明には程遠かったわけですが、わかっている人にとっては）確かにトリヴィアルなのかも知れないと思いつつも、少なくとも以下のようなことを確認できたとすれば、それは無駄ではないのでは、とも思うのです。

　それは、抽象化されたピッチの集合だけを見ていたのでは、なぜそのように聴こえるのか？という問いへの答は見つからないということです。その観点から言えば、元の問題は厳密には2つのことを告げているように思えます。IとVがパターンとして同じなのに機能が違う、というのは、単独の和音だけではわからないということを告げているのに対し、I⇒V,IV⇒Iは2つの和音の系列のみを見ていたらわからない。IとVのどちらなのか、I⇒V,IV⇒Iのどちらのカデンツなのかというのは、ピッチセットとして抽象化してしまえば区別がつかなくなるのは当然で、抽象化のプロセスで捨ててしまった情報、即ちそれ以外の水平、垂直の両方の次元での周辺の音やピッチセットの構成要素が、音高方向にどういう順序で並んでいるか（つまりどれがバスで、どれがソプラノか）を見なければわからないのだ、ということです。通常の楽曲分析での説明は、そうした背後にあるプロセスを全て端折って、結論の部分だけで議論をしているということだと思います。それは結果としてこうだ、という説明ではあっても、ではなぜそうなのかについては語らない。目的が違うのだから、それは別に構わないのですが、ここでの分析のような目的にその知見を利用しようとする場合には注意が必要だということのように思います。

　それでは一体、どの範囲を見ればいいのでしょうか？どのような切り口で見ればいいのでしょうか？データに基づく分析をやろうとすると、優れた音楽家や音楽学者でない、平均的な聴き手が無意識に行っている情報処理ですら、その複雑さに圧倒されてしまいます。更に言えば、（それ自体が優れた研究者が苦心の上に編み出したものであって、そこでの捨象の操作の背後にある情報量の大きさに留意するのは勿論ではありますが、その一方で）認知心理学実験で用いられるような単純化されたものではないマーラーの作品のようなものを「聴く」時に背後で起きている情報処理のプロセスの複雑さは、途方もないものだし、そのプロセスを支えているシステムの複雑さ、生物としての、社会的存在としての、美的主体としてといった階層の深さには目眩さえ感じます。ましてや優れた音楽家や音楽学者が直観的に掴み取る、ある作品の特徴を機械に取りださせるというのは途方もない企てに感られます。（そういうことからも、AIと音楽との関係におけるチューリングテストは、人間が聴いてそれっぽい音響を自動生成することがでるかどうかといったレベルにはなく、音楽を聴いて、それに感動したり共感したりすること、その感動や共感について分析できることのレベルにあるのではと思えてならないのです。）その全てを踏破することなど思いも及ばぬことですが、それでもなお、そうした企てへの第一歩と呼べるようなものでなくても、そうした歩みへのせめて呼び水となることを願って、今後も少しずつ手を動かして、その結果を公開していきたいと考えているような次第です。(2019.12.12初稿、12.16,17加筆)　

　

2019年12月7日土曜日

マーラー作品のありうべきデータ分析について：補遺

　以下は、既に公開済の文章「マーラー作品のありうべきデータ分析について：発展的調性を力学系として扱うことに向けて」（https://gustav-mahler-yojibee.blogspot.com/2019/11/blog-post_10.html　）の中で「素朴な疑問」として提示した問いを出発点に、若干の補足を行ったものです。なお、以下の「疑問」に対する指摘は私が創作した架空のものではなく、実際にある専門家から頂いた指摘です。ご指摘に感謝するとともに、その事実を付記させて頂くことにします。

　まず、そこで掲げた問いを再掲します。

　シェンカーのI→V→Iという原則は、上記の文章で提示した五度圏でのピッチの並びに基いた和音のビット列での表現およびその上での力学系においても確かにコスト的に小さく、経済的であるように見えます。
　ただ素朴な疑問として、以下の疑問がすぐに浮かびます。

(1)V→IというのはVが不安定でIが安定だという前提をおけば自然だが、ではVが不安定なのは何によるのか？ビット列としては同じバターンで右に1ビットシフトするのだが、そのことがアトラクタとなるのはなぜか？
(2)左1ビットシフトIV→Iもアトラクタの資格を持っているが、これはI→Vとビット操作上は区別がつかない。何が区別を可能にしているのか？
(3)V→Iが何かの理由でアトラクタであることを認めたとする。このときI→Vがそもそもなぜ起こるのか？これは、音楽は何故始まるのか？なぜ音楽があるのか？という問題に
帰着するようにも思えます。

上記の問に対しては、以下のような指摘が考えられるでしょう。まず(1)(2)について。

A1.(1)(2)とも、やはり中心音、つまり起点とそこからの距離、方向を捨象しているために生じる問いであり、中心音を導入すれば、そもそも問題にならないのではないか？
A2.そのためには、調性の情報を与えればいいのではないか？そもそもがここで対象となっている音楽は、調性システム（のあるバージョン）を前提として組み立てられているのは事実であるから、分析上もその前提に立つべきではないか？
A3.五度圏の隣り合う７つの音の重心の中心からの方向（θ）を中心音と定義すれば、それはドリア旋法ということになる。ところで、旋法のシステムにおいて長調・短調に相当するのはイオニア旋法、エオリア旋法であるが、これは教会旋法のシステムには存在せず、歴史的には新しいものである。この点をどう考えるか？なぜそうなったのか、どのような力が働いたのかを考えるべきではないか？

この指摘について考えたことを以下に記します。

A1.まず中心音についてですが、中心音を否定したいわけではないのです。それはきっとあります。あるから、かほど壮大な楽理の体系が出来て、何百年も続いて、異文化の極東の島国でも教えられているのだと思います。でも鳴っている音を聴いたとき、事前に教えてもらうわけでもなく、中心音に印がついているわけではありません。それは聴くと「自然とわかる」ものなのではないしょうか？そしてここでは、聴く立場に立って考えたいのです。できたら中心音を外から持ち込むのではなく、鳴っている音の構造から自ずと決まってくるものとしたいのです。そうじゃないと、聴経験と一致しません。

　だから、鳴っている音から中心音がこのようにして決まってくるというルールをデータから取り出したい。その時に、ピッチクラス＝ビットの並びだけに限定し、バスの音が何であるか、転回を無視して音名の集まりだけにしてしまうのは抽象のし過ぎかも知れないということは既に述べた通りで、ピッチクラス＝音名の組み合わせパターン＋最低音を
ひろって、きっと長三和音・短三和音の基本形はアトラクタなんだろうということで、まず、アトラクタがどこに現われるかを抽出することが考えられると思い、データ抽出を試みています。（「MIDIファイルを入力とした分析の準備作業：和音の分類とパターンの可視化」 https://gustav-mahler-yojibee.blogspot.com/2019/11/midi.html 参照。）

　中心音については、アトラクタとなる長三和音・短三和音の基本形のベースの音名がそれである、という定義は考えられます。ただ、その後ビット列が変化して、色々な和音が出て来るとき、中心音がどう変わるかも、データの側から取り出したいと思います。これも結果として転調の移行、確定のパターンが所謂「カデンツ」として取り出せるということで構いません。でも向きはこの向きでないとならない。そうしないと、規則で書かれた時にどうなるかは説明できても、規則通りにならない時に、系の状態がどうなっているのかが説明できなくなってしまうし、中心音の候補が2つあって、どっちつかずの状態みたいなことも言えなくなるのではないでしょうか？

　そもそも中心音というのは、具体的にはどのように計算されるものでしょうか？それは、ビット列で表現される同時に鳴っている音名の集合（ピッチクラス）の「重心」（まさにこれまでやってきた重心計算の結果）ではない筈です。もしそうなら、ビット列とは別に中心音が必要になることはないのではないでしょうか？いや、これはおかしいかも知れません。別に五度圏上の重心であっても良くて、重要なのは、何らかの定義に基づき計算された中心音が、「次への遷移の演算」の入力となるという点であるとしても構わないかも知れません。実際に、アルゴリズミック・コンポジションにおいて、そのような力学系が用いられており（ただし正確には、重心は「次への遷移の計算」そのものには持ちられておらず、もっと大域的な軌道の制禦にのみ用いられています。また、それは和音の遷移ではなく、ある区間の単旋律に出現する音の集合を対象としています。そして単旋律か、和声を備えているかという差が中心音という概念にどう影響するかについては、過去の西洋の音楽における歴史的な背景なども併せて理論的な意味合いを正確に突きとめる必要があるでしょうが）、もともとそれをマーラーの作品の分析に謂わば「逆輸入」するというのがきっかけでこの検討が始まったのでした。ただ、西洋近代音楽に限って言えば、中心音は五度圏上の重心ではない。正確を期するなら「最早～ではない」と言うべきなのかも知れません。ここで「西洋近代音楽」と言って西洋音楽としないのはそれ以前の長い歴史においては別のシステムが用いられていたからで、重心計算というのは、その別のシステムにおいては適切であっても、所謂「機能和声」に適用するのは不適切なところを、私が無思慮に適用してしまった結果、「捩じれ」のようなものに悩まされているということは多いにあり得ることだと思います。更に言えば、機能和声に先行する時代の長さに比べれば機能和声の時代など、ごく最近のことなのかも知れませんし、「ありえたかも知れない音楽」の枠組みとして五度圏上の重心を中心音とするシステムを「仮構する」というのは、そうしたことを考えれば深い合理性を持っているようにも感じます。（因みにこうした歴史的なパースベクティブの感覚は、「ヒトが意識を持つようになったのは…」というのと何となくスケールの感覚が似ている気もします。音楽の背後にあるシステムが意識の構造と対応している、というのはあまりに突飛な仮説かも知れませんが…）

‪　いずれにせよ、西洋近代音楽も後期ロマン派のような「小説」がモデルとなるような作品を事例にとった時に、そこでの中心音の定義は、明らかとは言い難いのではないか？充分にありえることとして、西洋音楽の中でも、中心音の決め方自体変遷があり、かつまた作曲者の個人的な嗜好もあるというのは成り立つでしょうが、個別の作曲家に限っても
それは明らかになっているとは思えません。結局何を目的として分析するかが最後には問題になり、結局私がしようとしているのが、ある特定の音楽についての中心音の決まり方を探ることだとしたら、それこそ、それはデータからボトムアップに推定すべきなのではないでしょうか？

　とはいえ、それを最終的に機械に処理させるにしても、どのようなデータを与え、どのようなモデル上でやるかについて設計するために、或る程度の見当をつけるべく考えてみるならば、ビット列で表現される同時に鳴っている（音名ではなく、音高を捨象しない）音の集合を入力に計算されるものである筈です。但しある時点のビット列だけに入力を限定する必要はなく、一つ以上の複数の前の時点のビット列の状態の記憶の系列が入力となるのは自然な仮定だと思います。また、その計算規則は、物理法則のような普遍的妥当性を持つ必要はなく、物理法則に逆らわないある程度自然なものであり、尚且つそれを事前に知らなくても自然に習得可能なものと考えるべきと思えます。それは文化的によって異なりうる幅があって良く、かつまた「嗜好」を受け入れる幅を備え、加えてその嗜好の中で多様な作品を可能にするようなものの筈です。更には中心音は常に一意に決定されるものではなく、決まらないことがあってもいい。中心音についての空間における重心のようなものが、幾つかの候補からの距離によって決められるといったあり方で良いと思います。完全に等距離ならその時には中心音が存在しないとも言えますが、通常は距離で順序づけられた後補が複数あるが、場合によっては2つの候補がほぼ同じ確からしさを持っている場合も生じ得る、というのが自然な仮定のように思います。そうであることによって、発展的調性のような逸脱が可能になる。しかも発展的調性と呼ばれているものの内実は、必ずしも単一のプロセスであるとは思えません。私見では、それは様々なタイプの逸脱に仮にラベルづけをした便宜的なものに過ぎず、その内実は個々に異なる、それこそ「唯名論的」に異なるのではないかと思います。

　というわけで、入力として私が差し当たり採用したのは、ビット列で表現される同時に鳴っている音名の集合＋どの音名が最も低い音かについての情報です。ただし遷移規則の方はまだわかりません。データ分析とＡＩが流行りの今時なら、つべこべ言わずに中心音の「正解」を与えることができれば、それを正解データとして機械学習によって中心音の定義を機能的に推定するのが普通かも知れませんが、今、私にとっては、中心音の定義（計算方法）自体が未知なので、この方法は取れない。まあ、色々な分析の共通見解とか自分の聴経験から正解を作ることも可能なのでしょうが、これはなかなか手間がかかります。とはいえ他に方法もないし、機械学習を適用しないまでも、データを眺めてそれらしい仮説を自分で作るのであれば、それを自分でやるか機械にやらせるかの違いしかなく、いずれ準備が出来れば機械学習を適用する可能性もあると思いますが…

A2.については、中心音に関する上記の議論に基本的には準じるのですが、それは措いても、ビット列の状態の系列からその系列の「調性」を判定する方法を考えられないかというのは、音楽情報処理的な問いとしてあるのだろうと思います。例えば、ある調の構成音の集合（7音）に基いて「調性」を推定するといったやり方が考えられるでしょう。楽理上の説明として一般に言われていることとして、転調が起きたことの確認は、その7ビットの外の音を使った時ということになっていることなどを判定の規則として用いるわけです。

　他方で、調性を前提としてしまえば、以下のような考え方もあるかと思います。ある時点で3つの音が鳴ったとします。その3つの音が含まれうる調性の候補の集合を持つ。ビット列が遷移するにつれて、その候補の集合も変わっていきます。そのうちに中心音が浮かび上がってくるのでは、という発想です。ただ候補の集合の要素はあまり絞り込めないことがすぐにわかる。五度圏だと両隣は常に候補に含まれます。逆に不協和であっても調性決定上は強い制限のある音程もあります。いずれにせよ、一つ前、二つ前、と記憶をたどって、最も確からしさの大きい調性を求めるというやり方が思いつきますが、これはうまくいくものでしょうか？

　一つ興味深く思われるのは、もしビット列の遷移上でそれが可能であれば、それはピッチクラスから更に対称性を除いたコードのパターンのレベルで解ける問題だということで、上で入力として別に求めたどれがバスかという情報は不要ということになる点です。まあつべこべ言っていないで、試してみるべきかも知れませんが。もう一つ言えば、このやり方は措定される調性の候補の集合というのを持たないとならない。長調・短調の2種類は仕方ないとして、教会旋法など、他のシステムが用いられている可能性はないのかとか考え出すと、やはり問題の立て方が逆立ちしているように感じられてしまいます。仮に作る側からすれば特定の調性システムありきであっても、聴く側にとっては、それは分析の最後に得られるものであって、調的には曖昧であっても中心音はこの辺にあるとか、この音とこの音が拮抗しているということが言えないものだろうかというように思ってしまいます。さしあたってマーラーを分析するのであれば、24の長調・短調の調性のそれぞれの間に距離が定義された空間を想定して、その空間の中で軌道を描くイメージでも構わないのかも知れませんが…

　なおもともとの(2)の疑問、IV→IとI→Vの違いそのものについて言えば、結果的には指摘の通り、その文脈での中心音の違いによる、というので全く構いませんが、上述の通り、こちらも同様に中心音を天下りに与えたくなく、和音の系列自体によって浮かび上がってくるものとしたいというのがここでの立場となります。その時に直ちに考えられるのは、過去の系列についての記憶を入力とすることですが、それだけではなく、五度圏上、ないしビット列上での操作としては軸対称となっている左シフトと右シフトが抽象する前の対象では異なっていること、それは結局のところ、どちらのピッチが相手に対して低い／高いという音高を捨象していることに由来するわけで、最低限バスがどのピッチかという情報を補うことによって過度の抽象による対称化を補正することが必要なのだろうと思います。そしてそのことは、振動比に基づくポテンシャルの大きさの系列を保存することにもつながります。
　
　一方で、音高ということで行けば、隣接音とか導音といった相対的な音高（＝振動数の差）に依拠したメタファーに基づく水平方向の概念が楽理にはありますが、それらをどう考えるかというのが別の問題としてあるかと思います。シェンカーのウアザッツにおいても、上声の動きはウアリーニエとして重視され、それは第5音ないし第3音から主音に下降する図式が典型とされているわけですが、それと振動数の比に依拠した和声的な（つまり五度圏上でのピッチクラス間の）距離の概念とが、いわば共存しているように思われるのです。突飛な喩えになりますが、数論における加法と乗法の微妙な関係は様々な未解決問題、予想を産み出す源泉となっているようですが、ここでの振動数の差と振動数の比という2つの概念は、加法と乗法の関係のように強固なものではなく、寧ろ水と油のように異質に感じられつつも、機能和声においては緊密に結びついたものとして立ち現れます。また、一方は上昇／落下、他方は緊張／弛緩というようにいずれも物理的なポテンシャルに結び付いていることについては、別に考えてみる必要を感じます。

　最後に、この辺りの議論については、クラムハンスルによる和声認識についての認知心理学的な研究を思い浮かべる向きがあるかも知れません。しかしここでの立場から眺めると、それは西洋の伝統的な音楽を学習用データとして学習したネットワークに対して任意の和声を与えて、学習済みデータによって形成された重みに基づいて協和度を計算させているように見えます。クラムハンスルがプローブ音法によって求めた和音の「親近度」に基づく距離をベースにすることは、結局のところある文化的伝統に属する音楽の統計的な平均に対して、マーラーの作品の和声進行の持つ「逸脱」がどのように関わるのか、それで逸脱の度合いを測ることができるのか、或いは、どのように適用するかにも拠りますが、逆に逸脱の度合いを測ることにしかならず、固有の力学を取り出すことはできないのでは、といった点が気になります。もう一つには、それが必ずしも物理的な協和度の高さと一致しているわけではない点が挙げられるでしょう。つまりそれはある文化の「閉域」の内部でのみ有効であって、その外部に対しては有効でないとしたら、マーラーの音楽の周縁性というものがそれで捉えられるものなのかという疑念が湧いて来ます。
　
　物理的な協和度と聴感の乖離は、和声のみならず、音程の協和についても指摘されており（ヘルムホルツが倍音構成に基づき演繹した不協和度に対して、プロンプ、レヴェルトが実験結果に基づいて帰納した不協和度を比較検討したものが知られています）、これをどう考えるかはここでは扱いきれない問題ですが、上記の通り、それは音楽が単なる物理現象ではなく、社会的・文化的な構築物であるということを示しているとともに、音楽が何の為に存在するのかという点にも関わるように思えます。実際のところ、音楽が物理的な協和度に従うものであるならば、音楽は文化的・社会的な差異を持たない均質なものである筈ですが、現実には極めて多様なシステムに基づく音楽があるというだけはなく、その多様性は物理的な協和度という基準では到底測れないい複雑さを備えていることは明らかなことに思われます。

　他方で、ピッチクラスに相当するビット列上のパターンから更にシフト対称性（五度圏の回転対称性に相当）を取り除いていくという抽象化の方向については、ドミトリ・ティモチコの『音楽の幾何学』におけるオービフォルドを用いたマップ構成の試み、或いは「一般化された調性ネットワーク」の提唱について調べてみる必要があると考えています。その理論は極めて一般性の高いもののようですし、説明能力の高いもののようですから、既にそこで答えが示されている問題もあるのではないかという期待もあります。他方ではそれが抽象化への方向を持つ限りにおいて、理論的な知識のない聴き手にとってどう聴こえるかをシミュレートするというここでの目的とは相反する方向を持つようにも思います。

A3.について：これは西洋音楽の理論的な捉え直しのようなものですから、私のような音楽理論を専門に勉強したこともない人間の手には余る問題です。確かにダマスコの聖イオアンにアトリビュートされるビザンツのオクトエコスにはA,H,Cを終始音とする旋法はなかったようです。実作でどうだったかはともかく、イオニア旋法、エオリア旋法は一体どこから来たのか、それが後年機能和声の枠組みで特権的な旋法として選ばれ、発達したのはどういう理由なのかというのは興味深いテーマでしょうが、このことについての説明というのも寡聞にして知りません。どなたかご存知の方はいらっしゃれば、是非、教えて頂き炊く思います。

　一方で、dur-mollのビット列の並びや五度圏上での重心を確認した限りにおいて言えるのは、それが実は（マーラーもその中に含まれる伝統の中で産みだされた膨大な作品に基づく学習により形成された感覚とはずれていますが）それが相対的には不安定なものであり、緊張を孕んだものであるということでしょうか？いわばそれはポテンシャルの空間の中での最低点ではなく、相対的には安定しているものの、寧ろその周辺の地形が多様性に富んでいて複雑なシステムを構築することが可能になるような場所なのではないかと思えるのです。繰り返しになりますが、ドリアンモードなら安定しているわけで、これが教会旋法では第1旋法であったのは故なきことではないのでは、と思います。そのことと裏腹の関係だと思うのですが、その替わりそれは静的で、変化の可能性が限られた閉じたシステムとならざるを得ないのではないでしょうか？（勿論、形式的には旋法を定義し、旋法上に和声とカデンツを定義し、旋法間の変換（転調に相当）を定義し、というシステムの構築は幾らでもできますが、振動比のような物理的な基盤の側から見たときにコストが小さく「自然な」ものという観点からすると、安定したシステムは変化の余地が乏しいというようなことは言えるのではないかと思います。この点については(3)の問いと関わりが深いと思われるので、そちらで改めて論じることにします。

　いずれにしても、ここで問題にしたいのは、イオニア旋法、エオリア旋法が長調・短調として選ばれ、それを元に和音に機能を持たせて、というように展開していく中で、選ばれた旋法の中心音が重心からずれていることがどのようにシステムに影響しているのか、ということです。繰り返しになりますが、単音、二音、三和音で重心がずれていく、しかも長調と短調でずれ方が異なり、対称的でないことは、機能和声の三和音のシステムの力学は五度圏上の重心だけでは説明できないということなのだろうと思います。発想としては、主三和音の重心に「何かの変換」を施すと中心音が出てくる。しかもそれが長調と短調の両方を含む（但し完全に長調と短調が対称である必要はない。歴史的にもピカルディの三度のような偏りがあるし、ソナタ形式における第2主題も、長調ならＶだけれど、短調なら並行調のIIIというように非対称になっていて、それらは構造的に関連している筈だと思います）ということになるのでしょうか？長調も短調も、本来の中心音からズレたり、対称性が崩れてたりしていることが、逆にシステムの複雑さを可能にしているようなことが起きていると考えることはできないでしょうか？（ここでの説明は、「中心音」を機能和声に支えられた長調・短調の2つの調性によるシステムにおける「主音」と同一視する前提に立てば、ナンセンスに思われるかも知れません。けれども理論が全くの数学的な構築物ではなく、実際の聴こえ方に根拠を持つものだとしたら、果たして理論で定義された「主音」と「中心音」が常に一致することは自明とは言えないのではないか、短調の主音と長調の主音は機能的にも異なるのはないか、ということが言いたいのです。）

　ちょっと飛躍しますが、こういうイメージが浮かびます。ウルフラムの一次元のセル・オートマトンの有名な実験があります。初期値を変えるとその後の振る舞いが変わるけど、おおまかに4つのクラスに分かれるというあれです。ここではビット列の初期配列を変えるのではなく、「中心音」の計算の「何かの変換」にあたるものを変えていく、するとある場合には複雑な挙動が起きる余地ができ、ある場合には美しくシンプルな挙動しか
起きない、といった感じです。勿論、あれかこれかの二択ではなく、程度問題ですが、機能和声はあえて前者をとったのではないかと思うのです。その時ポイントは第3音（しかも短三度・長三度の二種類があること）にあるように思います。オクターブ・四度・五度のような単純な振動比を持たない要素を入れ込んで中心音の定義を書き換えることで、音楽に動性を持たせることができるようになった。最初はそれでもオクターブ・四度・五度のドミナントのシステムにいわばはめ込んで使っていたのが、次第に一人歩きを始める。更に長調・短調間の変換が定義されると三度関係を軸とした変換の可能性が開拓され、そのうちに出発点に戻る力学的な理由が希薄になっていき、その果てに発展的調性のようなものが出てくる…あまりにラフなイメージですが上記のようなイメージが浮かびます。

ついで(3)について

B.(3)については、そもそもが些か禅問答的になりますが（もっともこの問いは、ギリシア以来の存在論的な疑問、しばしばライプニッツに帰せられる「なぜ何もないのではなく、何かがあるのか」をも連想させますが）、人間（生物）は常に変化を知覚するから、つまり、自分が定常的な状態でも、外部が変わればそれに適応して反応する必要があるから、外部からのきっかけで安定状態が崩れることで音楽は始まる

といった答えが考えられると思います。

　音楽においてもLeonard Meyerの緊張→弛緩という図式は良く言われますが、これは物理系だと振り子のような系、不安定な状態に（外的な要因で）なった系がだんだんと定常状態になる過程の説明でおしまいになってしまうように思います。一方、ここで問うているのは、いわば逆向きの動きで、最初に主和音から始まり中心音が定まっているのに、そこから不安定な状態になる、というのは、止まっている振り子が動き出すようなものです。

　なお、シェンカー理論のウアリーニエ、即ち上声部は典型的には第3音乃至第5音から下降して主音に帰結するという図式は、物理的な落下の法則に一致しているように見えます。けれどもそれはウアザッツの一部であって、和声的には、まさに問題にしたI-V-Iの図式がそれを支えているわけです。そしてここで問題にしているのはまさに後者です。、ソナタ形式を例にとれば、ソナタ原理のテンプレートでは、上声において、例えば第3音から第2音への下降が提示部の第2主題部で起きて、和声はVとなる。上声部の下降はそこで中断され、和声的にはVが延長されたまま展開部に入り、再現部の第2主題になって上声は主音、和声的にはIに帰着するというのが一つの典型とされるようですが、色々な出来事が起きて緊張が高い状態となるのは一般には展開部であって、冒頭に最も高かった緊張が単調に弛緩するというのは多くの場合当て嵌まらないし、仮にそれを認めたところで、マーラーのソナタ楽章のような長大な楽曲を支えているのは、寧ろその緊張を継続し、解決を延期するメカニズムにこそあるのではないかとも思えます。しかも発展的調性をとるマーラーの作品の場合、楽章単独にしても、全曲を通しても、冒頭主音と思われたものが実はそうではない、ということが起きている筈です。どうしてそのようなことが可能になるのか？マーラーのソナタではしばしば第2主題は長調の場合でも属調をとらず、短調の場合も並行調を取りませんが、そのことは図式をどう変えてしまうのか？長大な、しかもしばしば回帰さえする序奏がこうした脈絡において果たす役割は何か、必ずしもシェンカー図式を典型とし、それからの逸脱と捉えるのではなく、等しく存在する可能性の1つという資格で、その力学を考えてみたらいいのではないかというように思う訳です。

　言い替えると、緊張→弛緩は、音の構造に内在的に説明できるけど、逆は、外からエネルギーを加えてやらないと起きないことになる。音楽は、複雑系（生物もその一種）であって、外からエネルギーが加わって動きだし、エネルギーが供給されることで運動を続けるシステムとして捉えるのが自然なように思えます。つまり音響態の外部が音楽には必要で、それを辿っていくと、例えば由来に行きついたりしないだろうか、と思ったりもします。外部で何かが起きたことへの反応として、歌う衝動が湧いて、歌が始まる。歌のはじまりのきっかけは外からやってくるというように言える道筋が浮かんで来はしまいか、というように思っています。勿論一足とびにそこには行けないでしょうが、それでも三輪眞弘さんの「逆シミュレーション音楽」の定義は、中心音を定義してから始めることもそうだし、音響態の外部の「由来」を「音楽」の構成要件として必須のものとすることによって、今ここで現象論的にアプローチしているものを、まさに逆側から仮構し、シミュレートするものであると言えるように思うのです。

　そもそもの発端は、音楽的時間を考えるときに、小説や叙事詩に喩えられるような、人間的なドラマの時間が一方であり、他方では、自然法則に近いような時間の展開があって、コンピュータにとっては後者は扱いやすいが、前者は親和性が低いというような話があって、じゃあ、音楽を物理システムみたいに眺めたらどうだろう、というあたりが出発点でした。

　一方で、マーラーに関するモノグラフがあり、邦訳された文献としては『ベートーヴェンの美学』があるDavid B. GreeneがNelson Goodmanのメタファー的例示（examplify）を援用しつつ、西洋音楽の時代様式をモデルとなる時間性と対応付ける際の具体的な時間表象の不適切さのことも思い浮かびます。そこではバロックの音楽の時間性をニュートン的な時間、ないし時計をモデルとする機械的な時間と対比させているわけですが、勿論、メタファーといってしまえば何でもありとは言いながら、音楽を振り子や時計との類比することは、そもそも不適切なのではないかという気がしてならないのです。（もっともGreeneのメタファー的例示についての疑問は、バロック時代＝ニュートン的時間に留まらず、その他の時代の音楽にも、マーラーについての分析にも当て嵌まります。個別の楽曲分析そのものは示唆に富んでいるにも関わらず、肝心の時間論的分析は惨憺たる有様といって良いと思いますが、前に別のところに備忘を記したことがあるので、ここでは繰り返しません。）力学系といっても、外部からのエネルギーの供給がない振り子の振動のような閉鎖系だと単純すぎて、放っておいても起こる緊張→弛緩の過程の説明にしかならず、これは音楽において起きていることの半分の説明にしかなっていないように思うのです。緊張と弛緩を繰り返すようなものは、最低でも散逸過程じゃないといけない。にも関わらず、普通される音楽の構造の説明って、その後半の部分の話が多い、というかそっちばかりな感じがします。もっとも、どのようにして音楽を前に進めるかは、それこそ規則で決まるようなものじゃないのでしょうが…

　一般に複雑系というのは散逸系で動的不均衡で準安定なわけですが、そもそも音楽は（比喩じゃなく、上記のビット列の力学系の挙動として）まさに複雑系的な挙動をするような系であるというように言えるのではないかと思うのです。外部からエネルギーを与えるというのを、いきなり音楽外の要因が音楽の局所的な振舞に影響を及ぼす、と考える必要なない。勿論、そういう場合があってもいいでしょうが、そうではなく、エネルギーの流入で系の変化に自由度が増した結果、局所的にゆらぎが起きたときに、系がどちらの方向に発展するかについて、必ずしも決定的ではなく、カオス力学系とかで観測される分岐のような現象が起きているようなケースもあるのではないか？

　発展的調性というのは、どこに辿り着くかが事前に決まっているのではなく、複数の調的な極の間で競合があって、そのどちらかが選ばれるような系が条件となります。言い換えれば、発展的だが決定的というのはなくて、寧ろ、不決定性があるから、ある時には
開始の調性に回帰し、ある時には関係調に、ある時には遠隔調に辿り着くということが起きると考えるべきなのではないだろうか、というようなことを思っています。準備なしに遠隔調に転調するのはコストからすれば大きいわけですが、それもあるベイスンから脱出して尾根を超えて隣のベイスンに移るには、尾根を越えるためのエネルギーが必要だというように記述できます。すると遠隔調に転調するような複雑な音楽の場合には、きっと常にコスト最小の原理で遷移プロセスが定まっているわけではないのだと思います。

　一方で上述の通り、セルオートマトンのような単純な力学系でも、規則の与え方によっては複雑なプロセスが起きたりもします。（こちらの場合は当然、計算して内部状態を書き換えて、系が動くには外部からのエネルギーの供給が前提です。）だとしたら、前半部分の緊張を起こす方の側だって、衝動とか霊感でおしまいというのは性急で、もう少し音楽が勝手に進んで、時として緊張が高まっていく論理というのがあるんじゃないか、というようにも思えます。勿論の西欧の音楽は、セルオートマトンとは異なって、決定的な書換え規則に従って動いているわけではありません。でも、全く出鱈目というわけでもなく、何かそこに傾向のようなものがあって、それをデータから抽出してみたい。それはどのような音楽でもある程度普遍的に通用する緊張→弛緩の過程の一般的な説明（これが楽理なのでしょう）とは別に、緊張がどのように作られていくか、その結果として解決が遅れたり、宙ぶらりんになったり、etc.ということが起きることを可能にするような、何らかの条件であるはずで、それをできたらデータから導きたい、というように考えているのです。

　またこのことは、だからこそ音楽は「時間の感受のシミュレータ」たりうるのではないかという点にも関係すると思います。それは具体的に何が起きたかについての「記号」にはなりませんが、（それを記号と見做してプログラム＝標題を外から与えるのはまた別の問題です。）どのようなことが外部から到来したか（、そして、或る種の音楽はそれよりも一層どのような反応が起きたか）について、「時間の流れ方」という形で証言することはできるのではないでしょうか？それは或る種の抽象には違いないですが、通常の抽象とは逆に「記号」とか「意味」とかの認識の内容的な面を捨象して、感受の様態であったり、それに伴う情動とか身体的な反応といった側面のみを抽出し、他者にそれを（共感という形で）伝達するものなのではないでしょうか？
(2019.12.7公開、12.8, 12.17, 28加筆)

2019年11月17日日曜日

MIDIファイルを入力とした分析の準備(1)：和音の分類とパターンの可視化（2021.8.23更新）

重心計算を除けば、MIDIデータを入力としたこれまでの作業は、ほんの初歩的なデータ処理に過ぎなかったわけですが、ようやく「音楽」として普通にイメージされる分析の出発点として、各小節頭拍で鳴っている和音（含む単音、2音）を

(1)ひとまず転回を無視して分類
(2)単音、2音、長三和音、短三和音、七の和音、付加6の和音を抽出
(3)転回を判定するために、最も低い音を抽出
(4)上記を用いて、長三和音、短三和音が鳴っている時点を転回つきで抽出する

といったことをやってみました。データとしては既に公開済の基本データのなかのseqと呼んでいる、同時に鳴っている音の組み合わせの系列を抽出したデータのうち、B系列と呼んでいる各小節頭拍のデータのみを抽出した結果を使いました。ただしそれだけだと(4)のための情報がないため、上記に加えて、同時に鳴っている音の組み合わせのうち、最低音の音名の系列を抽出したデータを用意しました。

結果を示すために、リュッケルト歌曲集の「私はやわらかな香りをかいだ」についての上記の処理結果を図示したものを以下に示します。

一番左の列が(1)の結果です。37小節分のデータがあり、そのうち36小節を分析しています。（MIDIファイルでは、曲頭の小節を色々な初期設定情報を詰め込むためのダミーとすることが良くあります。）和音のパターンは、単音、2音はすべて、三和音、四和音、五和音、六、七、九は分析対象としたマーラーの作品（全交響曲と幾つかの歌曲）や比較対照用の他の作曲家の作品に出現するものを直観的に頻度が高そうなものを130種類くらい用意しました。

4,5行目に0小節,100%と出ているのは、未分類の和音の数、分類進捗率を示します。未分類の和音がなく、分類がすべて終わっていることを示します。
6,7行目の15小節、41.667%というのは、3和音, 4和音からなる小節数、占める割合です。
8,9行目の0小節、0%は、5和音以上の複雑な和音の小節数、占める割合です。この例では5和音以上の複雑な和音は使われていないことを表しています。

10行目以降が各小節毎の和音の種類を示します。
背景色は、単音、2音、長三和音、短三和音、七の和音、付加6の和音についてはパターンを表現し、その他の和音については、3和音なのか4和音なのか、５つ以上の複雑な和音なのかの分類を表現したものです。数字は例えば32がＣの単音、256がＡの単音、2057は432はGesの長三和音といったように、和音のパターンを示します（ビット表現を10進数で表したものです）。またわかりやすさのために、1音、2音のは文字色を青に、未分類の和音は文字色を赤にしてあります。この歌曲は「大地の歌」の末尾と同様、付加6の和音で終わることで知られていますが、最後の背景色桃色の番号3456はDの付加6を表しており、正しく抽出されていることがわかります。

二列目が(2)の結果です。

4,5行目に4小節, 88.889%と出ているのは、単音、2音、長三和音、短三和音、七の和音、付加6の和音には分類されない和音の数、単音、2音、長三和音、短三和音、七の和音、付加6の和音の占有率を示します。4小節分は、上記に含まれない特殊な和音が使われていることを示します。
6,7行目の21小節、58.333%というのは、単音と2音のみからなる小節数、占める割合です。
8,9行目の11小節、30.556%は、長三和音、短三和音、七の和音、付加6の和音の小節数、占める割合です。
背景色の定義は(1)は一列目に準じますが、ここでは背景色が白い部分は単音、2音、長三和音、短三和音、七の和音、付加6のいずれでもない和音を示します。またわかりやすさのために、1音、2音のは文字色を青にしてあります。

三列目は分類された和音パターンにラベルをつけたものです。同一の分類に属するビットパターンを正の整数とみなした場合の最小値としています。例えば単音の場合には、1,2,4,8,16,32,64,128,256,512,1024,2048の12種類（それぞれDesから五度圏のドミナント方向廻りにFisまでの12音の単音に対応）がありますが、このパターンのラベルは、12種類の中の最小値である1としています。最後の小節の27は付加6の和音のパターン（転回形は同じパターンに属するとして区別しない）を表します。

五列目・六列目が(3)の結果です。
各小節頭拍で鳴っている音のうちMIDIコードで最も小さい値＝最も低い音の音名のみを抽出したものです。数字は音名を表します。ここではDesが最下位ビット、Fis=Gesが最上位ビットとしてビット列を定義しているので、数字と音名との対応は以下のようになります。

Des 1
Aes 2
Es 4
B 8
F 16
C 32
G 64
D 128
A 256
E 512
H 1024
Fis 2048

背景色は私の持っている色聴をベースに、しかしそれに似せることを目的とせず、それらしく区別ができるように上記の数字と音との対応に基いてColorindexの中から適当な色を選択しています。なお、参考までに、同様の方法で最高音を抽出して色づけしたのが、名七列目・八列目になります。

四列目が(4)の結果となります。
(2)の中の長三和音、単三和音だけに注目して抽出したものに対して、各小節頭拍において(3)で抽出した最低音の音名から、それが各和音の基本形か第1転回形（6の和音）か第3転回形（4-6の和音）かを文字色で表現しています。即ち　黒＝基本形、緑＝第1転回形、赤＝第二転回形です。文字はその音名を根音とする長三和音、単三和音に相当する音の組み合わせがその小節の頭拍で選ばれていることを表す形式的なものであり、楽曲分析の結果得られた主音を意味している訳ではありません。

背景色は、(2)に準じますが、長三和音、単三和音のみなので、ピンク色が長三和音、橙色が短三和音を表します。またここでは背景が白で数字が入っていない小節は、長三和音、単三和音以外が頭拍で鳴っていること一方、背景色が灰色の部分は、その小節では音が鳴っていないこと（ビット列に対応する数字は0）を示します。曲頭の灰色はMIDIデータにおけるダミーの小節でなければアウフタクトで始まる場合を表しています。曲末の灰色はその手前が最後の小節であることを表しています。

以上からわかる通り、ここで行っているのは通常の意味での楽曲分析ではなく、その手前の鳴っている音名の組み合わせが何であるか、またその最低音の音名が何であるかについての「記述」に過ぎません。しかしながら、上記の情報からだけでも、ある作品に使われている音の組み合わせ・和音の種類数の多寡とか、利用頻度の偏りといった統計的な情報が得られますし、特に主和音の基本形・転回形の出現頻度も同様に調べることができます。また単純なドミナント・サブドミナント・ドミナントセブン（と付加6）によるカデンツに相当するパターンを抽出することも可能でしょう。ただしあくまでもここで抽出できるのは、音の組み合わせの遷移のパターンであって、楽曲分析において機能づけされた和音のカデンツを見出すこととは違いがあります。例えば調性の概念や中心音の概念はまだありません。それらをアプリオリに前提とせずに、選ばられた音の組み合わせの系列の遷移過程を眺めることで、マーラーの音楽の特徴のようなものを抽出できないか、というのがここでの問題設定であることがご理解頂けるのではないかと思います。

最後に、今回の分析をやったづれづれの感想を記しておきます。また計算結果が出たばかりで、結果を細かくてみているわけではないのですが、幾つか今後の作業を進めるにあたって方針づけとなる知見も得られたように思います。

これまでに重心軌道計算結果や基本データを公開してきましたが、今回の分析をするにあたって、MIDIファイルから抽出された入力データが、そもそも（完全にではなくても、分析を進めるにあたって支障とならない程度には）正しく小節頭から抽出されているかをはじめとして、MIDIファイルのデータの信頼性について、大まかにではありますが検討を行いました。

その結果、従来の基本セットについて幾つかの問題があることがわかりました。そのうちの一つは、DTMの領域では「クオンタイズ」の対象とされる問題、つまり通常は演奏されたデータにつきもののタイミングのばらつきのために分析上正しい位置に音が存在しないことに由来する問題です。これは従って一般的にはMIDIシーケンサが持つ「クオンタイズ」の機能を用いれば解決する性質のものです（ただしそれを全自動でやることは非常に難しく、今日のＡＩのベースとなっている機械学習の恰好の問題であると思われます）が、「クオンタイズ」を行うことは楽譜への忠実さという点からはプラスになっても、それを聴いて利用する点からは却って不自然になる可能性もあり、目的に応じて判断は変わってくるでしょう。いずれにしても歌曲のデータのうち、最も多くの歌曲のデータを公開しているサイトのMIIDファイルが、「カラオケ」を提供するという目的故に、ここでの目的に限って言えば極めて信頼性が低く利用に耐えないらしいことがわかりました。それを踏まえて基本セットの見直しを歌曲について行い、対象作品を限定しました。（歌曲では、特にピアノ伴奏版において、高声用、中声用、低声用といったように原調から移調されたヴァリアントが存在するという事情もあります。）

この「クオンタイズ」に纏わる問題は他の交響曲のMIDIデータでもかなりの頻度で発生していますし、類似した問題として、拍の頭がグリッドに対して規則的にずれている、それがチャネル毎に異なるようなケースもありますが、結果だけを見て、それが単に「クオンタイズ」をしていないだけなのか、楽器の特性等を考慮して意図的にずらしたものなのかを判断するのはしばしば困難を伴います。いずれにしても、「拍の頭で鳴っている音を抽出する」以上、鳴っている筈の音が、ほんのわずか遅れて鳴り始めるために拾えないこともあれば、前の拍に属する音が次の拍にかかってしまっていることもあるといった事態が致命的なことはご理解頂けるかと思います。この問題については分析の際に或る程度の補正をすることは考えられ、実際に試行も行っていますが、補正が常にうまくいくとは限らず、却って元のデータを誤って加工してしまう可能性が排除できないことから、公開しているデータは補正を行わずに解析を行った結果をとしています。

上記以外にもMIDIファイルの仕様に由来する（つまり楽譜だけからは思いつかないような）問題もあります。そのうち今回の分析にとって致命的なのは、タクトの情報が欠落している、或いは入っているがずれている場合です。これも入力したデータを再生して聴くだけなら全く問題が起きないことから、そもそもMIDIデータ作成の目的が異なれば仕方ないことではありますが、小節の頭拍の和音を抽出しラベルづけする、重心を計算するといったことをしようとした時には大きな問題になります。特にマーラーの場合、変拍子が比較的頻繁に発生するので、単純には解決できません。（その一方で、聴感上の強拍と譜面上のそれが意図的にずらされているケースもまたマーラーの場合珍しくないですが、こちらは別の問題で、そもそも小節の頭拍を機械的に抽出するという、今回のアプローチ自体の問題になります。）

もう一つ、これもマーラーの場合に特に問題になるのが打楽器の扱いです。MIDIの仕様上、ピッチの決まらない打楽器はデフォルトでは第10チャネルに割当られてられ、この場合に限り、MIDIノートナンバーが音高ではなく、音色の違いを表しているのはご存知の方も多いかも知れません。ただしMIDIファイルの作り方には大きな自由度があり、シーケンサによってやり方は様々です（従って入力をする人間がそれを常に意識しているとは限りません）。打楽器でもピッチのあるものは別チャネルになっている場合もあれば、第10チャネルの中に混在している場合もあります。後者の場合にはMIDIノートナンバーが実質的にピッチを表している場合とそうでない場合が混在していることになり、はなはだ厄介です。そこで考え付く極端な解決策は、第10チャネルを解析の対象から除外してしまうというやり方で、最終的にここで選択されたのは、実はこのやり方です。ピッチがある場合でも打楽器はその音色の特性からピッチが明確に聴き取れるわけではなく、しばしば他の楽器によって同じピッチが裏打ちされていることを考えれば一定の妥当性があるようにも思えますが、ご存知の通り、マーラーの場合にはティンパニを初めとして打楽器のソロというのが珍しくないので、MIDIデータの作り方によっては、そうした部分が切り落とされてしまうということが起きてしまいます。結局、何を目的で分析を行うのか、その是非を決めることになり、今回、私は、最終的にはそれを含めることで、分析結果にノイズが入り込む可能性よりも、それを除外することで一部の和音から音が欠落することの方がより問題が小さいという判断をしたことになります。

こうしたことを考えると、ありとあらゆる場合に対応した解析プログラムを作成することは非常に面倒な作業になるため、現実的な割り切りとして、対象としているデータセットにおいて問題が起きないようにプログラムを作るといったことが必要になります。その時、特定の人が特定のMIDIシーケンサを使って入力したデータは基準が統一されていることが期待できるので、対象データの選択にあたっては、まずカバレッジ（被覆率）の高い作者のデータを用いることが最初の選択肢となりますが、その際には、例えば入れ間違いの頻度といったことも含めた他の問題を抱えていないかどうかも併せての判断となり、しばしば一部の問題点については目を瞑らざるを得ないということが起きます。一長一短あるならば全てのデータの結果を公開するという発想もあるでしょうが、今度は、全てのデータについて対応できる汎用的なプログラムを用意すること、全てのデータについて、それぞれに異なる制限を確認する膨大な作業が発生することを考えると、これもまた現実的な選択肢になりませんでした。

ということで現在公開しているデータセットは、上記のような様々な事情を勘案した上での或る種の妥協の産物であるに過ぎない点をここで明確にしておきたく思います。末尾に記載の[ご利用にあたっての注意]は、この場合に限っては形式的なものではなく、実質的なものであることにご注意ください。（ちなみに上に例として出した「私はやわらかな香りをかいだ」は、上述の様々な問題の影響が比較的少ないことを確認して掲出することにしたものです。）

また比較対照用に用意した他の作曲家のデータについても、今回の分析で大まかな傾向ではありますが、それなりに興味深い知見が得られました。

例えば今回用意した130くらいのパターンで、バッハから古典期にかけての作品は、あくまでも選択された作品の範囲ではありますが、ほとんんど分類可能であることが確認できました。その傾向は特に声楽曲に強いように見受けられました（声楽曲の方が単純、ないし保守的な傾向があるようです）。ロマン派ではブラームスに比べてシューマンの方が未分類の和音が若干多い傾向が見られました。ブラームスは和音が凝っている印象があったのでちょっと意外な気もしましたが、曲の選択のせいかも知れませんし、上述のMIDIファイルの精度の問題のせいかも知れません。マーラーはここでの分析結果に限れば、未分類率だけからすればシューマンの方により近く、作品によりばらつきがあるブルックナーやワグナーと似たような傾向を示す一方で、ラヴェルやシュトラウスは明らかに未分類率が高く、複雑な和音を用いていることを窺わせます。聴感とも一致しますが、マーラーが全音階的とはいっても、和声の種類について言えば保守的でもなければ単純というわけでもなく、その特徴を表すものが何なのかを突きとめるには、時間をかけてきちんと調べる必要がありそうです。ただし、今回確認した範囲でも、マーラーの中では、歌曲の方が複雑な和音を用いる程度が低く、年代区分としては、後期にいくに従い未分類の和音が増加する傾向は認められるように思えます。

転回形に関連して一つ不思議に思ったのが、シェーンベルクがプラハ講演で、マーラーの第8交響曲第1部におけるEsのIの4-6和音（第2転回形）を頻繁に用いていると述べている件があるのを何となく覚えていて、どうかと思って処理結果を眺めてみたのですが、単純な三和音だけに限定すれば、文字通りのEsのIの4-6和音（第2転回形）が有意に多いようには思えませんでした。ただしEsのI和音全体としてみれば、他の作品に比べて頻度が高いのは確実に言えそうです。しかもここでの分析は小節の頭拍のみに限定していますから、それ以外の拍に出現したEsのIの4-6和音（第2転回形）は考慮されていません。全ての拍について調べてみる必要もありそうです。

なお、上記の分析結果のデータのうち、マーラーの全交響曲と一部の歌曲のデータを以下で公開しています。

https://drive.google.com/file/d/1WlBYSIrJIgKi4cV039sa5rl5YzbpfLZr/view?usp=sharing

解凍するとexcelファイルが3種類とpdfファイルが1種類出てきます。
pdfファイル（experimental_MidiFileName.pdf）は対象となったMIDIデータ・作品の対照表です。excelファイルについては以下の通りです。

chord_seq：上記の1列目(sheet1)・3列目(sheet3)に対応。sheet2は3列目で用いているラベル毎に、各グループに属するビットパターンの類型出現回数を集計した結果です。
main_chord_seq：上記の2列目に対応
bass_seq：上記の：4列目(sheet1)・5列目(sheet2)・7列目(sheet3)に対応

用いているMIDIデータや対象となっているマーラーの作品については、以下の重心計算のページをご覧ください。

https://gustav-mahler-yojibee.blogspot.com/2019/09/midi.html

[ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。

(2019.11.17公開, 11.19データ公開, 11.22更新,11.24加筆・修正,12.1最高音のデータを追加し、第8交響曲第1部のEsのI46について付記、2020.1.28 データを改訂版に差し替え)、2.1 MIDIデータ解析上の様々な問題点について付記, 2021.8.23重心計算ページへのリンクを修正。）

登録: 投稿 (Atom)

お知らせ

2020年1月26日日曜日

2020年1月20日月曜日

2020年1月4日土曜日

2019年12月22日日曜日

2019年12月12日木曜日

2019年12月7日土曜日

2019年11月17日日曜日