2022年12月30日金曜日

「ありえたかも知れない民謡」としてのマーラーの歌曲についての覚書(2022.12.30更新)

 一般にはマーラーは、第一義的には交響曲の作曲家として認知されているが、その創作の全体を俯瞰した時に直ちに気付くことは、交響曲以外の創作ジャンルが、ほぼ歌曲に限定されるという点であろう。だがそれ以上に特徴的なのは、平均的な了解としては相容れない筈の交響曲と歌曲という2つのジャンルが、マーラーにおいては相互に影響を与え合い、時として融合している点である。前者としては歌曲がそのまま交響曲の一楽章として埋め込まれた、第2交響曲第4楽章(「原光」Urlicht)や第4交響曲第4楽章(「天国の生活」Das himmlische Leben)もあれば、合唱が追加されるなどの歌唱パートの改変とともに管弦楽化された第3交響曲第5楽章(「三人の天使がやさしい歌を歌う」Es sungen drei Engel einen süßen Gesang)のような場合、逆に管弦楽化されて構造的にも拡張される第2交響曲第3楽章(歌曲としては「魚に説法するパドヴァの聖アントニウス」Des Antonius von Padua Fischpredigt)や第3交響曲第3楽章(歌曲としては「夏の交替」Ablösung im Sommer)のような場合、更には交響曲楽章の主題として用いられる場合(枚挙に暇がないが、例えば第1交響曲第1楽章における「朝の野を歩けば」Ging heut' morgens übers Feldや第3楽章のトリオにおける「彼女の青い目が」Die zwei blauen Augenなど)から、歌曲の一部が引用される場合(これまた枚挙に暇がないが、例えば第5交響曲のフィナーレにおける「高い知性への賛美」Lob Des Hohen Verständesの引用や第9交響曲第4楽章における「よく私は考える、子供たちはちょっと出かけただけなのだ」Oft denk' ich, sie sind nur ausgegangenの引用など)まで、関係の様態は幅広いスペクトルを持っている。後者について言えば、まず何と言っても『大地の歌』(Das Lied von der Erde)が挙げられるだろう。それは『さすらう若者の歌』(Lieder eines farhrenden Gesellen)、『子供の死の歌』(Kindertotenlieder)といった連作歌曲集の流れの集大成であると同時に、マーラー自身によって交響曲と規定されているという点で、それらの連作歌曲集とは一線を画している。結果として、交響曲の側から見た場合には本来は器楽であるべきジャンルへの様々な水準での声楽の導入があり、他方では内部構造を持たない複数の歌曲をただ集めただけの歌曲集から連作歌曲集としての組織化・構造化の方向性の極限として交響曲が位置するといった見取り図がマーラーの創作に関しては成り立つことになる。しかもそれは、膨大で多様なジャンルに取り込んだ他の作曲家であれば、その創作の持つ多面的なアスペクトのうちの一つとして、謂わば外側からアプローチすることも可能だったろうが、マーラーの場合には、それが創作全体のまさに要石の部分に位置し、アドルノの言葉を借りるならば、その作品群の成り立ちを「唯名論的」に規定する実質的な要素であることになる。つまり外的にそれぞれ独立に、事前に規定された2つのジャンルを偶々選択した時にその間に存在する関係といった把握でなく、歌曲と交響曲の両者が、そして両者のみが存在する空間において個別の作品同士の間に生じるその都度の関わり合いを通じて個別の作品の構造が具体的に規定される様相についての観相学が求められているということになるのではなかろうか。

 その結果として、ことマーラーに関しては、単なる音楽形式の問題を超えてより一般に言葉と音楽との関係が他のケースにも増して問題となる。マーラーの交響曲については標題に関する議論というのが或る種の紋切り型のようなものとして存在しており、尚且つそれは、マーラーの生きた時代に既にそのようなものとして存在していて、マーラー自身がそうした問題に関わらざるを得なかった事情を勘案すれば、それを問題として取り立てること自体には一定の正当性があるということになるだろうが、これもまたマーラー自身が既に気付いて或る種の拒絶の身振りを示したことから窺えるように、せいぜいのところ素材の一つに過ぎない標題性なるものを外部から作品へと押し付けて、それを以て作品について何かが解明されたとするような類の議論は、まさに上に記したような事情がある故にマーラーの作品について何かを明らかにすることはない。そしてこのこともまた、アドルノがマーラーに関するモノグラフの冒頭で既に半世紀以上も前に指摘していたことである。それ故にマーラーにおける言葉と音楽の関係を問おうとしたならば、標題などではなく、さりとて楽譜に書き込まれた膨大な言葉による指示に音楽への言語の侵入を見るのでもなく、たとえ自明に見えたとしてもまずはマーラーの創作が交響曲と歌曲より成り、かつ一部の例外を除いてそれらのみから成り、しかもその間には、冒頭でその一例を示したような複雑な関係性のネットワークが存在しているという事実を無視することはできないだろう。それ故また他方で、あたかも言語の侵入を受けない自律した音響態として、言語的な意味づけを排した上でマーラーの作品に向き合う態度は、仮に個別の作品については時としてその場で生まれる「サウンド」として手垢のついていない新鮮さを感じさせることはあっても、その場限りで消費されてお終いとなってしまい、あたかも投壜通信のように(ツェランが講演で述べたように、時間を超えてではなく)時間を通って作品が運ぶ価値に辿り着くことはないだろう。

 とはいってもそれは、作品が誕生した際の文脈を忠実に再現することなく作品に接することを非本来的であるとして断罪するような主張に繋がる訳でもない。そうではなくて、ごく単純に、例えばもし或る聴き手が歌曲「魚に説法するパドヴァの聖アントニウス」Des Antonius von Padua Fischpredigt)を知っていて第2交響曲に接する場合と、知らずにそうする場合には違いがあるし、そうした関係の存在を知った途端に、それを無視して音楽を受け止めることはできないだろうということに過ぎない。言い換えれば、マーラーの交響曲に接するに際して歌曲の存在を抜きにした場合と、それを前提とした場合とでは様々な水準で交響曲の受容自体が異なったものになるだろうという、ごく当たり前のことを言っているだけである。第2交響曲第3楽章は事実として歌曲そのものではないのだから、それが恰も「魚に説法するパドヴァの聖アントニウス」Des Antonius von Padua Fischpredigt)そのものであるような意味の押し付けが不当である一方で、それが「魚に説法するパドヴァの聖アントニウス」Des Antonius von Padua Fischpredigt)の変形であることを知ってしまえば、そのことがまるでなかったように第2交響曲第3楽章を聴くことはできないし、更に言えば、その事実を無視するとしないとに関わらず、マーラーその人は勿論そのことに自覚的であり、意図的にそのようにしたという事実は残る。同様に当たり前のことではあるが、第5交響曲第4楽章の、著名であるだけにそれだけ不幸でもある抜粋の場合とは異なって、歌曲のみを取り出すことには狭義における抜粋とは異なった性格がある。歌曲は一方でそれ自体単独で存在しているにも関わらず、恰もミトコンドリアのような細胞内小器官が元を質せば細胞内共生体であるのと同様に、独立の歌曲であると同時に交響曲の一部でもあるのだ。他方において、歌詞を剥ぎ取られて器楽化されれば元々の歌詞とは異なる文脈の中で異なる意味を獲得することになるのだが、それと同時に元々の歌詞の残響がその文脈にエコーすることを防ぐこともまたできない。単純な引用・被引用の関係はここでは成り立たず、どちらがオリジナルであるかは決定不可能なのだ。勿論、実証的な研究が創作のプロセスを事実問題の水準で解明し、どういう順序で作品が出来上がったのかについての事実が明らかになることはあるだろうが、それはそれとして、一般論ではなく、マーラーという個別のケースにおいてそれを事後的に受け取る状況に限定して言えば、交響曲と歌曲の間、或いは歌曲のピアノ伴奏版と管弦楽伴奏版の間の関係はお互いが相手のヴァリアントであると捉えるべきで、どちらが他方に対してオリジナルであるということは言えないだろう。そしてこのような歌曲のありようが「マーラーの場合」を特徴づけているように私には思われるのである。そのことの帰結として、連作歌曲集ではない、常ならば構造を持たない単なる寄せ集めである歌曲集が取り上げられる際にも、その中からどれを選んでどのような順序で並べるかについて、演奏者の側に選択の可能性が生じるにようになる。かくして粗い類推ではあるけれど、交響曲が長編小説であれば、連作歌曲集は全体で一つのまとまりをもった連作短編集であるのに対して、そうでない歌曲集もまた、単なるアンソロジーではなく、嘗て或る種の実験小説において、断章群が提示しておいて読者が自ら読む順序を決定していくという試みが為されたことへの類比が寧ろ適切なものとなる。

 従って、ここでの歌曲と交響曲と関係を問おうとした場合、例えば、歌曲が交響曲に引用される具体的な様相を分析するというアプローチに帰着して事足れりというわけではないことになる。そのような研究としては既に半世紀も前にモニカ・ティッベの研究があり(Tibbe, Monika, Über die Verwendung von Liedern und Liedelementen in instrumentalen Symphoniesätzen Gustav Mahlers, Emil Katzbichler, 1971)、今更屋上に屋を架す必要もないだろうが、さのみならずアドルノが夙に指摘している通り、マーラーの場合において歌曲は、交響曲に対していわゆる「予備的研究」なのではなく、その役割は交響曲に素材を提供することに存するというように見做されるべきではないのであってみれば、歌曲を引用する交響曲といった図式自体が既に或る種の予断を含んでしまっているのだ。ここでの文脈からは稍々逸れることになるが、そのことはマーラー作品内における歌曲と交響曲の関係にのみ言えるのではなく、一般にマーラーの作品における各種の引用を指摘するような姿勢に共通していることで、勿論そうした実証的な研究の存在意義を否定するわけではないにしても、そうしたアプローチそのものが含み持つ予断が見えてくるものを先行的に規定してしまうことは避け難く、時として、或る種の文化的な文脈への還元によって事足れりとする立場に通じるものがある。歌曲が交響曲とともに、対等の立場で星座を形作ることがマーラーの創作の総体において不可欠の契機なのであって、一見したところ些事に思われるかも知れなくとも、上に例示したような交響曲と歌曲との関係の多様性そのものが、ここでの交響曲なり歌曲なりの在り方を決めているのだ。例えば第4交響曲第4楽章に見られる、独立の歌曲でもあり交響曲の一部でもあるという二重性は、本来的には別々のジャンルに帰属するべきものが偶然に借用されているという見方では捉えきれず、寧ろその二重性こそがマーラーの作品にとって本質的であって、実際にはそのような二重性を明示的には持っていない他の多くの歌曲においてさえ、仮想的な仕方で同様の二重性を謂わば予示的に備えていると考えるべきなのだ。

 マーラーの歌曲のうち、管弦楽伴奏版が作成されなかった(但し、「夏の交替」のように交響曲との関連を持つ作品は含まれている)初期の作品群は『リートと歌(Lieder und Gesänge)』という一見ありきたりの題名の下、3巻に編まれたのであったが、機械的な反復を忌避するという、交響曲形式に対する態度において顕著なマーラーの姿勢は歌曲においても変わることはなく、それ故典型的なのは、題名が示唆するような有節的なリート(Lied)と通作的な歌(Gesang)といった二元論的区分よりも、その間を架橋し、しばしば境界を曖昧にするように節を絶えず変形していく手法であり、それが技術的な構成原理となっている点については交響曲と変わるところはないように見える。交響曲にも語りの契機が侵入し、古典派的交響曲が範例として「演劇」を持っているのに対して、ここではアドルノが言うように「小説」が範例となってシェーンベルクが指摘する「音楽的散文」が支配的となるのだが、その結果は旋律線の白熱であり、予めルバートを作りこみ、人間の声ではなく、楽器が(二次的に、「表現」として)「うたう」ことになる。マーラーの交響曲は騒音的な非楽音の導入の廉でしばしば嘲笑の的になってきたが、常には音色的な効果を添えるだけの打楽器が(場合によってはセンツァ・テンポで、ということは恰も周囲の脈絡とは独立にそれ固有のリズムとテンポを持っているかのように)「うたう」ことが求められているということに他ならない。同様にして、マイケル・ケネディによればマーラーの作品の基本的原理は二声の対位法だが、それは単なる和声進行の声部への分配に終始することなく、寧ろ外部を、他なるものを作品の中にこだまさせる契機なのだ。それは或る時にはステージとは別のテンポで動く舞台裏からの響きであり(第3交響曲第1楽章の展開部末尾、冒頭のファンファーレが回帰する直前を参照)、或る時には音色の変化により、或る時には極端な音域の乖離により仮想的に仮構される空間の広がりでもあるだろう。そこでは「うたうこと」と騒音的な非楽音の対比によって、音楽が生まれてくる起源的な場所が遡及的に言い当てられようとしているかのようだ。

 主観的抒情と客観的叙事の対立についても同様なことが言えるだろう。マーラーの歌曲が所謂芸術的なリートの系譜に連なるものではないこともまたしばしば指摘されることで、最もその傾向が著しいのは『子供の魔法の角笛』歌曲集ということになるであろう。一見したところ民俗的な素材に見える『子供の魔法の角笛』は文学史の中でドイツロマン派を代表する作品と見做されてきたし、それ故そうした民族的遺産に対してユダヤ人マーラーが曲を付けたことに対する言いがかりめいた誹謗中傷が、とりわけてもナチズムが支配した時代には激しかったとは言え、1世紀後の極東の異邦人の子供がマーラーの音楽に取り込まれたそれを聴いた時の印象に照らした時には、フォン・アルニムとブレンターノは民謡を蒐集する民俗学者などではなく、結局のところ『子供の魔法の角笛』は彼らの創作であったという、マルク・ヴィニャルの「音楽素材と史的弁証法」(青土社『音楽の手帖 マーラー』、或いは酒田健一編『マーラー頌』(白水社)所収)における指摘の方が自然に感じられるのである。それが民謡を模倣したものであるとすれば或る種の追創作(nach-dichtung)と捉えるべきで、だとすればそれは寧ろ『大地の歌』の詩がハンス・ベートゲの追創作であるのに親和的とさえ言えるであろう。アドルノはモノグラフの中でシュペヒトが『子供の魔法の角笛』歌曲集の楽譜に寄せた文章を引用しつつ、その見解に疑念を呈しているのだが、その指摘については、それに対する賛同とともにそれを引用しているヴィニャルの見解に与することができるものの、続けてそのアドルノがムソルグスキーやヤナーチェクを参照しながらマーラーの作品の叙事的性格を指摘するのに接すると、ボヘミヤに生まれて、幼少期にはその地の伝統的な音楽にとり囲まれて育ったマーラーの作品にスラブ的な響きを見出そうとすることには一定の妥当性があるのだろうとは思えども、そこにもまた解消し難いギャップがあるという感覚を否定することは難しい。そういうヴィニャルがマーラーを形容した「真実の、または佯りの…」という言葉への共感を、それを象徴する例である「四度で鳴く郭公」をタイトルとした文章に記した川村二郎のマーラー論(青土社『音楽の手帖 マーラー』所収)を読んだ時、子供ながらに「真実の、または佯りの…」という両義性がマーラーの音楽の或る種屈折した特質に良く迫り得ているという点を認めるに吝かではなくても、自分が聴き取ったものが両義性という言葉で尽くされれているかどうかという点については留保の必要を感じずにはいられず、なお懸隔が存在することを感じずにはいられなかった。自ら三重の意味での異邦人であると規定したマーラーの音楽は、一部の評者が言うようなエキュメニカルなものでは決してなく、端的に根無し草の無国籍的なものであって、自分が生まれ育った環境に対してさえ距離感を持ち、或る種のよそよそしさを感じずにはいられないような側面を持っており、敢えて言うならば寧ろ端的に「佯りの」もので、無意識的に湧き上がるものそのものではなく、意識的にシミュレートされ直したものだと言うべきではなかろうか。マーラーの音楽が文化的にも歴史的にも懸け離れた土地に住む子供にとって逆説的にも身近に感じられ、自分に向かって手を差し伸べてくれる存在であり、パウル・ツェランが参照しているマンデリシュタムの投壜通信についての言葉のように、岸辺に辿り着いて打ち上げられた壜の中の手紙を自分宛のものであると感じ取ったのは、そこに両義性があるからであるというよりは、その音楽が初めから風景からの疎外を孕んだものであるが故であるとする方が、事態の正確な記述になり得ていると感じられるのである。そのことが特に明確なのは『大地の歌』の場合なのだが、それについては『大地の歌』のコンサートに寄せて以前書いた文章で触れたことなので、ここではその内容は繰り返さない。

 或いはまた、マーラーの音楽の歌詞を眺めた時、叙事に際してオリジナルには存在したかも知れない固有名をことごとく欠いている点はどうだろうか?廃棄された若き日の歌劇の創作の試みの果てに、辛うじて筋書きめいたものを持ち、テキストが物語としての体裁を備えている最後の作品であると同時にマーラー自身が作品1として、自らの創作の出発点と見做したカンタータ『嘆きの歌』の登場人物は、だが固有名を持たない。その後もう一度きり、ゲーテの戯曲『ファウスト』の終幕の場をその第2部の素材とした交響曲が書かれるが、ここでも(かつてグレートヒェンと呼ばれたといったように注記されることはあっても)固有名が予め剝ぎ取られているのは果たして偶然なのだろうか?「原光」で天使と格闘するのはヤコブその人ではないし、「3人の天使が優しい歌を歌う」で主を裏切ったことに悔恨の涙を流すのもペテロその人ではない。それらに加えて「おお人よ注意せよ」という呼びかけも併せて須らく女声に割り当てられているのに対応するように、歌詞からすれば男声で歌われるべき『さすらう若者の歌』も『子供の死の歌』もまた屡々女声で歌われ、しかもそれは些かも例外などではなく、寧ろ女声による名唱に事欠かない点について異論はないだろう。そしてそれら連作歌曲集の到達点でありながら「交響曲」と規定された『大地の歌』は、逆説的にも歌曲を含めたマーラーの全創作の裡で最も主観的な極に位置しながら、「私」は男声と女声とに分裂する。それでいて終楽章の「告別」はと言えば、別れであるからには当然複数の人間が登場する筈だというのに、私と友はしばしば交替し、果ては本当にそこに「友」がいるのだろうかと訝しむことにさえなりかねない。

 マーラーにとって『子供の魔法の角笛』は、自分がその中に否応なく巻き込まれる「世の成行き」との様々な関わり方を仮託する素材であったのではなかろうか。その中の一つであり、「この世」の成行きに対して、神から出たのだから神のもとに帰るのだ、とうたわれる「原光」は、今、現在のここ、日本での文脈でなら、三輪眞弘の「新しい時代」に出てくる「昇天少年」の歌に比せられるだろう。その一方でマーラーの中には、インド哲学の影響が著しいショーペンハウアーを皮切りに、ゲーテ(『西東詩集』West-östlicher Divan)、東洋学者でもあったリュッケルト、フェヒナー(『ツェント・アヴェスター』Zend-Avesta)、そしてハンス・ベトゲによる漢詩の追創作と、東方的なものに対する関わりが一貫して流れていて、その果てに中国の詩の模作の中で「故郷」という言葉が出てくる時に、一体それは何を指し示しているのだろうか。オリジナルの王維の詩「送別」には、「南山」とあって実はこれは普通名詞ではなく、固有名詞であって、具体的に長安の南にある山のことだそうだが、マーラーの作品の歌詞では例によって、固有名詞は剥ぎ取られている。そして、中国を反対側から眺めている極東の子供にとってもやはり同様に、南山という固有名詞は、中国人であれば感じ取れるのかも知れない具体的な場所への参照を欠いていて、却ってそうした文脈が剥ぎ取られらたベトゲ=マーラーの詩の方が身近に感じられる。まるで『大地の歌』の、聞きようによっては鼻もちならない露骨な異国趣味と受け取られかねない中間の第3楽章・第4楽章・第5楽章こそが「ありたかも知れない故郷の歌」であるかのように。マーラーを簒奪者として規定してみせるハンス・マイヤーのような西欧のインサイダーにとって「原光」と「告別」は全く別のことを歌っていることになるのだろうが、異邦の子供であった私には、それが異なったものとは思えなかったし、今でもそれは変わらない。そうした展望の下では「告別」の「故郷」が生地カリシュトなり、幼年期を過ごしたイーグラウのことを指しているのだという解釈はそもそも入り込む余地がない。「故郷」をめがけて歩んで、だが辿り着くことが夢想される山は、幼少期に「ここ」とは別にあるのだと夢想した「彼方」、アドルノがマーラー・モノグラフの最初の章で鮮やかに描写する、十代半ばの子供が朝五時にそれを耳にしてたたき起こされる、人を圧するようにうち降りてくる音の源ではないのか?それは「世の成行き」の中には場を持たないという意味での「非-場所」に他ならないのではないか、そしてそれは今一度そのように夢想されるけれども、実際に生きたまま辿り着くことはないのではなかろうか。そしてそうした風景が、後続する歌詞を持たない第9交響曲に、更には、それ自体この世に確固とした形で姿を現すことが許されなかった第10交響曲に映り込む…

*     *     *

 何故このような、取りようによっては自明なこと、或いはまた逆の立場からすればどうでもいいような些末に拘って延々と文章を連ねているのかと言えば、まず第一には、最近行った所蔵録音の整理にあたって、特に歌曲の録音を、更にその中でも比較的古い時期の録音を改めて纏めて聞き返してみて思い至ったことが多々あったからで、就中、歌曲の側から、或いは歌曲を通して交響曲を改めて眺めてみるというパースペクティブが、最大限控え目に言っても、とりわけ今回については主観的には非常に印象的で新鮮であったことから、その感じの由来を突き止めてみたいと感じたからである。

 ここでマーラーの作品の演奏の録音記録について時系列に辿り直してみるならば、まず時代を代表する大指揮者でもあったマーラーが指揮した演奏の記録は、1911年に51歳を迎えることなく訪れた彼の早すぎる死によって一つとして遺されることがなく(但し、前世紀末に没したブラームスのピアノ演奏が、ちょうどエジソンの発明したばかりの録音機に録音された記録があり、マーラーより5歳年長のニキシュについても、マーラーの没後、第一次世界大戦まで存命だったが故に、彼が指揮した演奏の録音が残されているということは思い起こしておいてもいいだろう)、僅かに1905年11月9日にライプチヒで記録された自作のピアノ演奏のピアノロール(ウェルテ=ミニョン)が幾つか遺っているだけであるということは良く知られているだろう。そしてマーラーが(それが記録され、再生されることを恐らくは知った上で)指揮をするのではなく、ピアノで弾いた自作が何であったかといえば、第5交響曲第1楽章、第4交響曲第4楽章、「今朝、野辺を行くと」「私は緑の野を楽しく歩いた」の4曲であり、このうち第4交響曲第4楽章は歌曲「天国の生活」そのものなので3曲までもが歌曲のピアノ独奏編曲ということになる。なお、当時のマーラー自身の展望について言えば、同じ年の夏にはマイアーニヒで第7交響曲の第1,3,5楽章のパルティチェルを書き上げたものの、第6交響曲の初演は翌年の5月27日のことであり、前年にケルンで初演し、この年も5月にストラスブールで演奏し、その後12月にはウィーンでも演奏した第5交響曲が「最新作」であった筈である。

 それゆえマーラーの演奏史上初めての「録音」の可能性があるのは、マーラーの没後、疑義があるものの1915年の録音という説が存在する、ソプラノ歌手のシュトゥックゴルトが管弦楽の伴奏で歌った歌曲「この歌をひねりだしたのは誰」のようである。それに続くのが1921年に録音された「私は緑の野を楽しく歩いた」で、やはりシュトゥックゴルトが管弦楽の伴奏で歌ったもの。その後、交響曲の方は、1924年のフリートの第2交響曲、1926 年のメンゲルベルクの第5交響曲第4楽章(アダージェット)、1930年の近衛秀麿の第4交響曲と続くが、歌曲の方は、これもまたあまりに著名なレーケンパーがホーレンシュタイン指揮の管弦楽伴奏で歌った1928年の「子供の死の歌」に先立つものとしては、1926年にミズ=グマイナーがやはり「この歌をひねりだしたのは誰」を今度はピアノ伴奏で歌ったものの録音があるようだ。その周波数特性の音域の制約から、辛うじてそれらしく聴こえるのがまず人間の声だということで、アコースティック録音の時代のレパートリーの中心は声楽曲であったらしく、そのレパートリーの一端は、例えば1925年に出版されたトーマス・マンの『魔の山』に含まれる蓄音機に関する挿話からも窺えるが、マーラーの作品の場合においても、最初期から戦後まもなく辺りまでの時期について言えば、1曲がSP盤の片面に収まるという長さも寄与してか、控え目に言っても歌曲の録音が相対的に多いと言えそうで、1950年代までは録音に占める交響曲の割合は6割に満たない。その後LPレコードが普及していった1970年代までは概ね2/3を交響曲が占めるようになり、1980年代になると更に7割程度まで交響曲の割合が上がる。(それに対していわゆるマーラー・ブームを経た後の2010年代の直近の10年は再び歌曲の割合が上がっている。交響曲のリリースは前の10年に比べて減っているのに対して、歌曲は寧ろ増え続けているようなのだが、その原因についての推測はここでは控えることにしたい。交響曲の録音でセッションが組まれることがほとんどなくなってしまったのは、レコードの流通自体が加速化させたのは間違いない作品の普及により習熟が促されて演奏の精度が上がったこと、そのことの結果としての演奏技術の向上と均質化から、一握りのスター演奏者の録音をセッションを組んで収録するという時代が去った一方で、録音技術の進展によって収録・編集が容易になって流通経路が多様化したことで、大資本のレコード会社以外でもリリースが容易になったこともあろうし、交響曲の全曲録音が両手に余るほど蓄積され、レパートリーとして定着する替わりに新たな録音をそこに加えることのマーケットへのインパクトが喪われた結果、異稿や編曲に関心が寄せられるようになったことなども影響しているのかも知れないが、いずれにしてもここでの関心からは外れるので、この件はここではこれ以上扱わないこととする。)現時点でもなお、録音されたまま流通せずに眠っていた過去の演奏記録が発見され、リリースされつつあるので、直近10年のみならず、それ以前の録音記録の傾向についても若干の変動は見られるかも知れず、確定したものとして語ることには慎重になるべきかも知れないが、少なくとも現時点での展望としては、マーラーの演奏記録の年代記の中で、初期においては相対的に声楽曲が優位にあったことは認められるのではないかと思う。声楽曲ということで「大地の歌」を含め、更に第2交響曲や第4交響曲がその一部に歌曲を内包している点を考慮すれば、人間の声の存在感は一層増すことになるだろう。

 だが今回、ディスコグラフィーを整理する中で、古い時代の声楽曲の録音に数多く接してみて、そうした定量的な水準に留まらない、寧ろ少し違った位相での「声の優位」とでもいうべき感覚を強く抱くに至ったのである。より正確な言い方を期するならば、マーラーの音楽が本質的に備えている特徴である「声の優位」ということについて、今回改めて、古い時代の録音記録に接することによって再認したということになるだろうか。言う迄もなく、歌曲との関わりという点に関してさえ、単に声楽つきの交響曲についてのみ言えることではなく、声楽を伴わない交響曲においても歌曲との直接的な関りには枚挙に暇がないし、直接的な歌曲との連関が指摘できない場合においてすら、「声の優位」というのはマーラーの作品全体を貫く特徴と言えるだろうが、そうした消息について、今回、記録された「声」に数多く接することで、分析の結果というよりはより身体的な次元で感じ取ったというのが真相に近いだろうか。マーラーの歌曲を久し振りに聴いて、人間の声が心の奥底まで染み込むような感覚を久し振りに体験して、一方では、青土社の『音楽の手帖 マーラー』所収の幾つかの文章にあるような、戦前や戦後まもなくの演奏を聴いた時の印象の記述を思い起こし、他方では、マーラーとは一見したところ無縁な、現代のメディアアートの文脈での試み、就中、三輪眞弘と佐近田展康によるユニット、フォルマント兄弟のリアルタイム自動音声合成を中核にした「声」に関する試みに対する自分の関心や、アルゴリズミック・コンポジションを作曲の方法論の中心に据えている三輪眞弘の作品における「ありえかたも知れない伝統」の仮構、更にはそれと構造的に関連する、人の声で歌われる歌が担う、或る種特権的とさえ言える強度への自分の共感の来歴を再認するように感じられたのだった。

 今ならマーラーの歌曲のこれまで述べてきたような特質の端的な要約として、それを「ありえたかも知れない民謡」と位置づけることができるように感じられる。それは今日の極東であれば柴田南雄の『音楽の骸骨の話』を素材として三輪眞弘によって作曲された「極東の架空の島の唄」の最も先駆的な形態であったのではなかろうか。歌曲と交響曲の不思議な混淆。交響曲の一楽章がそっくり管弦楽伴奏の歌曲であること、それはマーラーの器楽がとことん「歌う」ものであるという特質に一方では通じ、それと同時に、言葉と反省的意識の侵入という、もう一つの特質に通じてもいる。更には歌曲が伝統的な主観的抒情詩でなく、寧ろ作者たるマーラーその人でない「語り手」による叙事であることが、アドルノの言うところのマーラーの交響曲の「小説」的な時間的構造を支えるものであることに思い当たる。おまけにスラブ語の文化圏の只中のドイツ語の言語島(当時のオーストリア=ハンガリー帝国領のイーグラウ、今日のチェコ共和国のイフラーヴァ)に育ったユダヤ人という、幾重もの疎外を孕んだ出自もあって、一見したところ民俗的、土着的に見える要素が、実際にはアドルノの言う「仮晶」としての「ありえたかもしれない」伝統芸能としての民謡の「素材」として用いられているということが、1世紀前の半ばは無意識的であったかも知れない「逆シミュレーション」(三輪眞弘)の先駆形態として捉えることができることに気付いたのである。同時代の、同郷の、だがマーラーとは異なって、自分が帰属する民族の集団的記憶に属する民俗学的な遺産であると見做すことができた多くの作曲家たちとは異なって、三重の意味での異邦人であり、「根無し草」であったマーラーは、自分が生まれ育った生活圏の中において土着であった筈のものから、もしかしたら意図せずして架空の民謡を産み出してしまったのではなかろうか。そして、その民俗的要素とは縁も所縁もない1世紀後の極東に住む子供にとって、だがその架空の民謡こそが唯一、自分の居場所だと感じられる場所を垣間見させてくれる存在であったというのは、自分自身が(幸いにして民族的な差別や迫害とは概ね無縁でありながらも)今度は文化的・精神的な意味合いにおいて根無し草であることをどこかで感じとったが故のことなのかも知れないと、今になって思うのである。

 一見すると荒唐無稽な牽強付会ととられるかも知れないし、勿論、長い径庭を経た末のことになるかも知れないが、それでもなお、上記のような位置づけから出発することによってのみ、マーラーの作品に関して指摘されてきた様々な特徴を、首尾一貫した展望のもとに再配置できるように私には思われる。同時にそれは交響曲を「手持ちのあらゆる手段を総動員して一つの世界を構築すること」とするマーラーの定義に通じていて、それを歌曲の側からの展望として裏返し、翻訳・変換したものでもあるだろう。肥大した自我の誇大妄想の産物であるという嫌疑にも関わらず、第3交響曲の廃棄されたマーラー自身による拙い標題が示唆するのは、そこでの語りの主体は「私」ではないということである。更に加えて、一般にはこうした消息とは無関係であると了解されるに違いないとはいえ、敢えてここにシェーンベルクが第9交響曲について述べた非人称性を突き合わせるのは不当な牽強付会だろうか?シベリウスとの会話でマーラーが述べたように、「世界」として交響曲は確かにありとあらゆるものを包含しなければならないが、その時に留意すべきは、その世界はもともと騒音のみが支配する混沌などではなく、最初から「うた」が存在していたという点なのではないだろうか?「言葉」にさえ先駆けて「はじめに「うた」があった」のであり、「うた」が世界への通路であり、そしてその「うた」は常に既に、外部からの他者の呼びかけと、それに対する反応として対位法的なものではなかったろうか。それは意識とか自己の根拠であり、それらに先行して、それらを基礎づけるが故に、意識が成立し、自己が確立した時には忘却されていて、人は改めて「自分のうた」を探すことになるのだろう。 

*     *     *

 ここで一つ、現時点ではそれにどう応答するかは問いとして開かれたままではあるが、興味深い指摘に触れておくことにしよう。ドゥルーズ=ガタリの『千のプラトー 資本主義と分裂病』の「リトルネロについて」の章にはマーラーへの言及が含まれていることに以前注目したことがある(「大地の歌」への参照2件(ジャンケレヴィッチ『死』、ドゥルーズ=ガタリ『千のプラトー』))が、その言及は、実はここでの「ありえたかも知れない民謡」という視点と接続可能ではなかろうか。叙述の順序からすると上で参照した箇所よりも後の部分になるが、この章の最後のパラグラフはこのように始まるのだ。

 音楽が凡庸な、あるいは劣悪なリトルネロも、リトルネロの悪質な使用も排除することなく、逆にそれを誘導し、踏み台として使っているのはなかなか興味深い。「ああ、ママ、お話があるんだけど…」、「彼女は木の足をもち…」、「フレール・ジャック…」。子供の、あるいは鳥のリトルネロ、民謡、酒盛りの歌、ウインナ・ワルツ、牛飼いの鈴など、音楽がどんなものでも使用し、どんなものでもさらっていく。童謡、鳥の歌、あるいは民謡などは、つい今しがた問題にして連想的で閉鎖的な常套句に還元されるということではない。明らかにしなければならないのは、むしろ音楽化がリトルネロの「第一のタイプ」(原文強調点)、つまり領土の、あるいはアレンジメントのリトルネロを必要とするのはどうしてなのか、そして第一のタイプのリトルネロを内側から変形し、脱領土化して、音楽の最終目標である「第二のタイプ」のリトルネロ、つまり音楽機械に属する宇宙的リトルネロを作り出すのはどのようにしてなのかということだ。(ドゥルーズ=ガタリ『千のプラトー 資本主義と分裂病』, 河出文庫, 中巻, p.399--400)

 後続のところで参照されるのは(ジゼル・ブルレを介した)バルトークなのだが、マーラーに親しみ、マーラーに関する言説に容喙した人であれば、上の文章は寧ろそっくりマーラーにこそ当て嵌まるものと考えるところだろう。「フレール・ジャック」は勿論第1交響曲第3楽章のカノンの素材だし、鳥の声(第1交響曲第1楽章、第2交響曲第5楽章、第3交響曲第4楽章、『大地の歌』の第5楽章、第6楽章など枚挙に暇がない)、ウインナ・ワルツ(一つだけ挙げるならば、何よりも第5交響曲第3楽章だろう)、牛飼いの鈴(第6交響曲と第7交響曲で用いられるカウベル)に加えて民謡が並んでいるのを見れば、これらすべてを素材として「内側から変形し」(アドルノのいう「ヴァリアンテ」の技法を思い浮かべよ)、「脱領土化して、(…)音楽機械に属する宇宙的リトルネロを作り出す」とは、まさにマーラーのことを言っているとしか思えない。「音楽機械に属する宇宙的リトルネロを作り出す」とは、マーラーの言葉に翻訳すれば「手持ちの手段を総動員して世界を構築すること」という、あの第3交響曲に関しての発言の言い換えでなくてなんだというのか?「凡庸な、あるいは劣悪なリトルネロ」で思い浮かべるのは、クヴァンダーとの対談でシノーポリが引き合いに出したウィーンのナッシュマルクト(カールス広場とケッテンブリュッケンガッセの間にある食品市場のこと、立風書房『マーラー事典』所収の同じインタビューの別の訳では何故か「菓子屋」と訳されていて、世にも珍妙な、およそ意味不明な訳文になっているので注意)で「何か食べられるものはないかと廃物の中を探すといったようなこと」(ジュゼッペ・シノーポリへのゲオルク・クヴァンダーのインタヴュー「マーラー・ルネッサンスと世紀転換期への回帰」、キューン、クヴァンダー編『グスタフ・マーラー』所収,泰流社, p.392)といった譬えではあるまいか?或いは、柴田南雄さんのような教養ある聴き手をうんざりさせる、マーラーの音楽における「通俗的」な要素の数々、ハンス・H・エッゲブレヒトがDie Musik Gustav MahlersにおいてVokabelという言葉で言い当てようとした、かの「日常語的語調(umgangssprachlicher Ton)」のことではないだろうか?

*     *     *

 ところでマーラーに関してこのような逸話がある。マーラーは幼少時にアコーディオンを与えられると、自分が接した様々な音楽を悉く記憶し、アコーディオンでそれを演奏することができたというのだ。このエピソードが広く流布した理由は、―語った本人の意図とは別に―マーラーの音楽的才能の発露の早さを示すことでその天才を証しすることであったのだろう(注:このエピソードの典拠はナターリエ・バウアー=レヒナーの『グスタフ・マーラーの思い出』中の「アッター湖畔のシュタインバッハ 1896年夏」の章の「子供時代の思い出」節であるから、このエピソードがマーラーによってナターリエに対して語られたものであることは事実と考えていいだろうし、本人が語ったことであるならば、仮にそのうちの一部が、本人の記憶の中で変形し、事実とのギャップを含むとして、マーラー本人の自己認識の一部であることは依然として成り立つが故に、ここでの議論における有効性は変わらない。ヘルベルト・キリアーン編、ナターリエ・バウアー=レヒナー『グスタフ・マーラーの思い出』, 高野茂訳, 音楽之友社,  pp.144~148 参照)。

 だが私にとってその挿話は別の疑問を惹き起こすものであり、恐らくその疑問はマーラーにとって「うたう」ことが何であったかという問いに根本的な部分で通じているように思われるのである。このエピソードに関して私が抱く謎は至ってシンプルで素朴なもので、「何故マーラーは自分の声で歌わずに、専らアコーディオンで演奏したのか」という点に存する。いや、現実にはマーラーはアコーディオンで伴奏をつけながら歌ったのが、そのように若干変形されて伝わったという可能だってあるだろうから、その場合には上記の私の問は実証的な水準では意味を喪うことになるだろう。だが私にはこのエピソードは、別のことを告げているように思えるのだ。それはマーラーが、その音楽的才能の最初の発露の時点で既に「固有の声」というのを持てなかったということ、更にそれに加えて、最初から自分固有の声を補綴し代補するものとして楽器が必要だったのではないかということ、誰のものでもない楽音に、自らの声をではなく、自らに語りかけてきたものの声を託したのではないか、つまるところ自分の中に響き渡るのは、常に他者の声なのだということを告げているのではないかということである。(そしてそのことと、指揮者という役割の選択の間にももしかしたら関係があるのかも知れない。)そしてこのエピソードを念頭に置いて先に触れたピアノロールのことを考えた時、一見したところ単なる状況の制約に由来するものでしかなく、事実としてもそうであったのだろうが、マーラーが記録のために取り上げた作品のうち3つまでもが歌曲であって、それをピアノ独奏用に編曲したということが幼年期のアコーディオンの演奏の再現のように感じられはしまいか。更には、これはさすがに牽強付会に過ぎるだろうが、第5交響曲の第1楽章、即ち葬送行進曲を選択したことの方については、グスタフ少年が最初に作曲したのがポルカ付きの葬送行進曲であったという幼少期のエピソードの続きを思い起こさせはしまいか?

 それを踏まえて1世紀後の極東を見渡した時私が見出すのは「フォルマント兄弟」のリアルタイム音声合成を行うMIDIアコーディオンである。時あたかも新型コロナウィルス感染症の蔓延によって自分の声で歌うことが禁じられた状況に置かれた人間は、コンサートホールの舞台をぎっしりと満たす大規模な管弦楽や声楽を必要とするマーラーの音楽を満席の聴衆の一人として聴くことを禁じられてもいるのだが、ヴォーカロイドにマーラーの歌曲を歌わせることが普通に行われるようになった今日、そうした状況に置かれた人間にとってのMIDIアコーディオンと、年端も行かぬ子どもであったグスタフ少年にとってのアコーディオンとの比較は見た目程突飛なことではないのではなかろうか?

 ヴォーカロイドが「うたう」マーラーの歌曲を聴いて感じるのは、一方では、もしかしたら他の、より本来的な抒情詩としての歌曲とは異なって、マーラーの歌曲の寄る辺なさ、「誰のものでもない」という側面が、人工音声で歌われるに相応しいものなのかも知れないという認識を伴った、ずれを自然なものとして感じるパラドキシカルな印象であり、だけれども他方では、人間の声の歌う、そしてそれに曳き摺られるようにして、伴奏のピアノが、或いは管弦楽の全てのパートが(打楽器でさえも)歌い出してしまう過去の演奏の録音記録に結局のところそれは及ばないというようにも感じるのである。そしてその点こそが、ヴォーカロイドとリアルタイム音声合成MIDIアコーディオンとの間に存在する決定的な差異であり、かつグスタフ少年のアコーディオンと通じる点なのだ。ヴォーカロイドに通じるのは寧ろ「うたうこと」の一回性を持つことのない録音・再生技術に基づく複製芸術、再び三輪眞弘の言葉を借りれば「録楽」の方なのだ。技術的な制約の大きい嘗ての録音を再生した貧弱な音響においてさえ人間の声を聞き取ることができる同じ耳が、今日ではもしかしたら客観的には怪しい部分があるかも知れないヴォーカロイドの歌唱さえ、歌詞を見せられさえすれば、恰も人間が歌っているのと同じようなものとして聴き取ってしまう。アコースティック録音において「最もそれらしく聞こえる」というのには、単なる録音技術に加え、それよりも寧ろ、人間が「人間の声」を聴くことに最適化された聴覚システムを持っているという事情が与ってはいないだろうか。上でも触れたトーマス・マンの『魔の山』の中でアコースティック録音のSPレコードをハンス・カストルプが聴くシーンにおける「幽霊性」の由来もまた、単なる物理的音響に過ぎないものに人間の声を聴き出そうとする人間の知覚の基本的な構えに基づくものではなかろうか。その一方で、21世紀を迎えた以降の最近の神経科学の研究においては、知覚は一般的にそう了解されているように受動的なものではなく、能動的に外界の理解を行っており、ボトムアップの感覚信号における特徴検出としてではなく、外界の状態を予測し、その予測の誤差を検出して最小化するように動作しているというカール・フリストン等の「予測する心」のパラダイムが有力視されるようになってきているが、それは本来的なものが向こう側にあって真理の根拠となるという立場とは異なって、「ありえたかも知れない民謡」の仮構と親和的であるだけでなく、脳を予測する機械と見做し、心を世界についてのシミュレータとして捉えることを通じて、交響曲の創作を「手持ちのありとあらゆる手段を使って世界を構築すること」と定義したマーラーの了解とも親和的ではなかろうか。この立場に立つならば、世界を構築することとは、世界を知覚し、認識することと別の副次的・派生的な行為などではなく、無意識の裡に為される活動を意識化し、リニアな物語として編集したものに他ならないことになるだろう。

 「予測する心」のパラダイムが、マーラーの同時代人であるばかりか、直接面識があった可能性もあるとされるヘルムホルツが展開した自由エネルギーについての熱力学的理論にその基盤を持っている点は、偶然とは言え興味深い。マーラーへの影響についての言及を含むフェヒナーに関する研究書である岩渕輝『生命の哲学』によれば、マーラー自身の世界観は、ヘルムホルツの学派よりも寧ろフェヒナーのような広義での生気論的な発想との親和性が高かったとされているようだが、近年の意識や心に関する理論を踏まえた時に感じられるのは、今日の問題意識とマーラーの時代のそれの連続性であり、我々が同じエポックの反対側の端に居るということであり、当時は埋めることのできない対立と思われたものについて、今日であれば新たな発見と理論に基づいたより肌理の細かい議論が可能になっているということである。その最も顕著な例を一つだけ挙げるならば、こちらもマーラーの同時代人であり、同時期にウィーンに住み、マーラーと同じ精神的な圏内に居たと言ってよく、更にはライデンにて、本格的なものではなかったにせよ、分析者・被分析者という関係性の中で、被分析者の位置に立ったマーラーと言葉を交わしたことがわかっていて、直接的な交流があったことがわかっているフロイトの精神分析に関しても、近年、脳神経科学との架橋が試みられており、ソームズの『意識はどこから生まれてくるのか』のように、ダマシオとフリストンの理論を介してフロイトの理論を再評価するといった試みが今まさになされているのである。通常は当時の文脈に帰着させて了解されることが専らであり、そのような了解を前提とする限り、既に今日においては陳腐で賞味期限の切れたものであることになるであろうマーラーの「世界観」なるものも、今日の問題意識に照らして再解釈することが求められているように感じられる。「ありえたかも知れない民謡」という観点にしても、例えばマーラーが用いた旋律が、ボヘミヤの民謡やユダヤの旋律に起源を持つものであるかどうかについての実証的な議論や、マーラーのある旋律が先行する誰それの作曲家のしかじかという作品の引用であるかどうかといった議論が学術的には意味のある問であったとして、だが1世紀後の極東の子供の耳に響くものとの関わりは慎重に言っても希薄、実質的にはほとんど皆無である。その時、その子供に対して、伝統からの断絶と無知をもって聴取の資格なしと断定するのではなく、そうした子供にすら聞き取れるものが何であるかを確認したいというのがここでの立場であり、上に述べた様々な指摘の中でたとえ一つだけであっても、マーラーについて言われてきた様々なことを今日の問題意識の中に再配置するための視点の一つたりうるならば、この覚書の企図は達成されたことになる。(2021.5.23-24 マーラーの命日のために準備したものの未完成に終わった未定稿を補筆の上公開, 5.27-9/7.12更新。8.14自由エネルギー原理に関連してソームズによるダマシオを介したフロイトとの架橋の試みについて追記。2022.5.14 幼年時代のアコーディオンの逸話の典拠について追記。2022.12.30ドゥルーズ=ガタリ『千のプラトー』について追記。) 

2022年12月7日水曜日

備忘:意識の音楽、自我の音楽:アンリ・ルイ・ド・ラ・グランジュ『グスタフ・マーラー:失われた無限を求めて』を参照しつつ(2022.12.7更新)


* * *

意識の問題を優先させるのだ。これこそが解くべき問題。
だが、意識の「何を」解けばよい。
音楽は無力。だが、信仰もまた。
それは「私」しか救えない。

音楽が他人を楽しませるのなら、他人を癒すなら、それは役に立っている。
作ること、演じることは、役に立つ。
だが、聴取は他人には働きかけない。
それはせいぜいアフォーダンス、可能態に過ぎない。

信仰は私の一人称の問題を主観的には解決するかもしれない。
だが、二人称の問題に対しては無力だ。
無力さを意識し、何かに委ねることは、制度としての信仰がなくても可能だ。
委ねる何かに何らかの超越性を認めるかどうか、人格性を認めるかどうかの 違いに過ぎない。勿論、だから行為へのいざないをもつ「教義」というのが あるのかもしれない。だが、それとて、ここで扱わなくてはならない意識の 問題の系の一部なのだ。行為へのいざないは、そうした外在的な制度が なくても、存在するし、意識することができる。

意識の問題とは、だから、一人称に限定されない。
二人称の、あるいは三人称の、相互主観性の問題を扱わなくてはならない。
ただし、認識のレベルではなく、役に立つかの、行為の、実践の、インタラクションのレベルで 扱わなくてはならない。

* * *

ベクトル場としての音楽。
運動(行為)が新たな場を引き起こす。

意識の音楽、自我の音楽を定式化すること。
マーラーの場合、多くの場合には常に自意識が働いている、目覚めている。だが、いつもではない。
単なる気分や情緒でなない、メタレベルの自己言及性が表現されている。
皮肉、韜晦、二重言語、パロディが成立するレベルがある。これは文化的な方向付けの上での 解釈とは別次元で保証されている。そういったレベルは実在する。
可能世界意味論。あるいは世界制作。

* * *

音と主体
主体とは、結局(自)意識のこと。自覚的システムのこと。
実験音楽が音を問題にするとき、そこでは(自)意識は問題になっていない。
ある抽象的な状態が問題。抽象的形式的な枠のみ与える。
そこから自意識への作用は聴き手にまかされている。表現の断念、拒否。

ある構えの呼び起こし―知覚
を考えたとき、その呼び起こしの中に、自己言及的なレベルを含むか
記憶の問題?
ある相互作用自体の呼び起こし?

津田一郎「複雑系脳理論」p.84のスマリヤンによる推論者の階層的定義に従って、意識の現われるレベルを位置づける。
0.命題なりパターンなりの呼び起こし
1.命題だけでなく、命題に対する志向的態度も呼び起こされること
/1a..志向的態度のみが呼び起こされること
2.命題に対する志向的態度に関する認識も呼び起こされること
2a.志向的態度に対する認知が呼び起こされること
シミュレーション能力:自覚的システム=自意識。
時間の感受のシミュレータとしての音楽。

* * *

意識と音楽、結局アドルノ風の観相学は有効。
ただしその社会批判的な側面は制限してよい。
観相学においても、作品にあらわれたものとしての(つまり結果としての)意識の現われについて語り得る音楽は 限定される。(ex. マーラー/ショスタコーヴィチ)
それは世界に対する反応の、しかも反省を含めた(高度な推論者を含めた)記述でなくてはならない。

単なる情動、反応でないような認識の構え
屈折か、外性の意識が必要。
外と主体との「調停」ができていない方が関係の様相ははっきりする。
破綻の瞬間―アフォーダンス、存在の開け
倫理的次元の彼方…。
死についての意識。老いについての意識。別れについての意識…。

外性の大きさ、主観の強さをモデル化できないか。
そのように思われるのは、何によるのか?
統一性、素材の節約の度合い。
コヒーレンスのようなもの
世界のあらわれの度合い?
主観の受動性?

* * *

可能世界。夢や空想、幻想、神秘的で非日常的な経験。
こうだった、こうでありえたかも知れない、という記憶や予期に彩られた現在。
そして、音自体ではなく、音を触媒に音以外の事象についての地平を、 フレームを浮かび上がらせる音楽は、やはりかけがえのない豊かさを持っている。
音楽が役に立つか、を問うならば、それもまた効果の一つであり、豊かな方が良い。
もちろん抽象的な音の運動を浮かび上がらせる姿勢も一つの態度ではある。
だが、役に立つかを問題にしたとき、それは、結局のところ認知実験ではないのだから、 文字通り「世界が限られている」。

Sartreの自我の超越―構成するものでなく、されるものとしてのEgo
物理学的描像―自我の構成についての説明というのは、まああり得るかもしれないのだが、 自我の構成する働きが消える訳ではない。
自我は構成されるものであり、かつ構成する機能を持っている。その間には二者択一はない。
そもそも矛盾などないからだ。
自我をinertなもの、クオリアの様なものとして還元するのは、自我を専ら機能的なものと考え、 自己感というクオリアを消去するのと同じにように間違っている。

幻想の否定もそれが主観の展望なり信念である限りは幻想に過ぎない。
救いもその否定も、主観の思いなしに過ぎない。志向的スタンスの問題に過ぎない。
ショスタコーヴィチが間違っているのではないが、より正しいという訳でもない。
だが、ミームの存続は?作品は?主体と異なる他者としての作品の存続は?

幻想ということは結局は物語、fictionであるということ
1.どういう物語なのか?他者との関係は?物語の共有?交換?作品としての物語の存続、ミームとしての伝承
2.経験の質、クオリアによる計測、迫「真」性という測度の導入?

* * *

意味や価値を見出せない、という状態も、主体の状態の一つに過ぎない
それは何か特定の価値を信じる盲目を嗤うかも知れないが、だが特権的な位置に居るわけではない。
自分の背中を見ることができない、という点では同じなのだ。
何事も相対化してしまい、肯定的な価値を置いていたものの裏面に否定的な契機を嗅ぎ付ける態度は 批判的といえば聞こえはいいが破壊的だ。
そうした傾向は、主体が覗き込めない主体を支える無意識の、下意識のメカニズムに由来するのだろう。

一方で、生物学的な、神経科学的な「事実」というのは、目を背ける訳にはいかない。
有限性、儚さは事実だ。
否、多分、それはもう問題ではない。価値の多様性と相対性、価値の領域におけるダーウィニズムが問題なのだろう。

多元性に何故傷つくのか?
「自分」の眺望の意味は担保するものの、根拠薄弱は仕方ない。
それがどうして己の行為の価値への疑いになるのか?
自然も、音楽も、思想も、己の価値の体系の中にあったものが、かつて程は自分をひきつけなくなっている。
それらの限界を、制限を無視できない。
「夢中に」なれなくなっている。
対象を信じられないのは、自分を信じられないのに対応している。
だが、それを知ったところでどうすればいいというのか?

* * *

表象(物語のイメージ「も」含む)―KleinのObject、表象についての論争にとって、どういう意味合いを持つのか?
世界認識のスキーマの有無?
「表象なしの知性」etc.の文脈―フロイトの動力学的な解釈は可能か?
記憶と表象の問題
客観的、現実的な対象、というときも実際にはあるスキーマを通しての認識だ。
経験によって獲得される後成的なネットワークがあるのは確かだが、―クラインならPositionと呼ぶのだろう。
生物学的に―遺伝的に、先天的に与えれる条件があるのも確か
タブラ・ラサは虚構だ。

* * *

どこまでさかのぼる事ができるのか、という問題なのだ。
Adornoの方向とHusserlの方向には大きな隔たりはない。
強いて言えば、遡及の途上を根源と見做して、基礎付けを宣言するのは誤りだ。
そして己の背中を見ることはできないから、内観主義的な方法は限界を持つ。
(それは説明されるべき経験の可能性自体であって、説明の道具にはならないのだ。)
だが、それに替わる方法に唯一正解があるわけではない。
Adornoの「その先」が、どんなに恣意的な物語であるかは、実際の適用―音楽に対する―を見れば明らかだ。
オリジナリティ、独創性と工学的な方法論(追試可能で、検証可能な)の緊張もあるだろう。
Husserlの還元もそう。
大言壮語は不要だが、すべてを否定することはない。

de La Grangeの「自分の魂の状態を表現する以上のことを求めた」(アンリ=ルイ・ド・ラ・グランジュ『グスタフ・マーラー:失われた無限を求めて』, 船山隆・井上さつき訳, 草思社, 1993, p.13)というのは全く正しい。
マーラーの音楽は、意識の音楽だが、それは内部状態の記述に終始しない。「超越」についての報告たり得ている点で それはもはや主観的とはいえないのだ。
またマーラーは、自分を限定され、己の有限性の中に閉じ込められた存在とは考えない。まさに作曲を通じて 無限なるものへと通じていると感じていた(それが思い込みであったにしても―その疑いは、R. Straussが H. Pfiznerが皮肉交じりにすでに指摘していた)

「失われた無限を求めて」というde La Grangeの著作の題名は、だから両価的だ。一方でそれは無限を問題に する限りで正しく、他方でそれはそれを「失われた」―かつてあったものと捉える点で間違っている。
だが、無限なものとのつながりの予感は、唯物論的に、またミームの進化論の観点からも正しかった。
まさに彼は、作品を通じて「永遠」へと(ただし、非形而上学化された進化論的に限定つきでだが) 通じている。
(de La Grangeが後期様式について語った「永遠」観念的な、甘美なものとここでの永遠は何の関係もない。)

※では「大地の歌」のEwigはどうなのだ?de La Grangeではなく、マーラー自身とも無関係だというのか?

心理・音楽学(同書, p.110)は興味深い。が、これが精神分析を方法論とする必然性はない。勿論、言われるところの 無意識を否定することはないが、まずもって必要なのは創作の謎ではなく、創作されたものの謎だ。
だからそれはまずは認知的なレヴェルにとどまらなくては。
創作されたものから創作への性急な遡行は Adornoにも見られる(彼は精神分析にも否定的ではない)。
だが、まずもって謎があるとすれば作品だ。

精神分析の自然主義化が必要なのだ。無意識、エス、超自我、いずれにしても、それは脳内に後成的に 形成されたネットワークの構造に過ぎない。

* * *

マーラーの「反復」についての考えに留意すること(同書, p.129)
「反復や再現や後戻りは「偽り」(マーラーの言葉)であり、またまったく単純に作曲者の 脆弱さとその役割の放棄のしるしであった。」
「二人ともAdornoが「非可逆行性」と呼んだもの、つまり同一の足跡に戻ることは不可能だと いう考えをやはり確信を持って表明している」
勿論、これはAdornoの言うヴァリアンテの技法に関係している。(古典的な意味での変奏ではない。) 
「やはりアドルノの創案した用語を使って言えば、マーラーの「小説風交響曲」の起源は まさにこのような点にあるのであり、そこではいくつかのエピソードが物語りのなかでのようにあらかじめ定められたプランに従わずに自由に連続し、登場人物たち(諸主題)は discoursにそって動き回る。」
と同時にこのことはマーラーの音楽を「心理的に」意識の流れとして読むことを保証している筈だ。

一方で、本物の劇的展開―つまりオペラや劇音楽のうち、統合性の高いもの―との比較に 注意すべきだ。つまり―例えばマーラーの内部に例を求めれば、「嘆きの歌」や第8交響曲第2部の様な部分は、まさにプロットが 音楽の流れを直接支配するが、これと上の意味合いでの心理的展開、小説としての流れとは 一致しないのだ。ソナタやロンド、変奏曲形式、なかんずく二主題の変奏曲形式のあるタイプが むしろここではモデルになる。
その展開の力学は「物語」に由来するものではない。そうではなくてある意味では自律的な 法則を持っている。第3交響曲第6楽章や第4交響曲第1,3楽章、第6交響曲第4楽章、第9交響曲第1,4楽章、第10交響曲第1楽章といった器楽の音楽が、その法則の具体化なのである。
音楽の持つ「効果」による「例証」。連続性、断続、充足、終結、あるいはAdornoのDurchbruch/Suspensionも含めて 心理的(フロイト派でも何でも)ではなく、せめて認知心理のレベルで意識の様相の記述と対応付ける。

音楽自体を記述の媒体として捉えること。
表現と記述。クオリアの再現が可能なある記述の体系なのだ。 (少なくともマーラーの音楽は)意識現象は様々なレベルと手段で記述できる、そのうちの1つとして位置づける。 ―音楽は意識の流れ自体ではない。感情そのものではない。
それを「ひき起こす」側面のみが(表現の側面のみが)強調されるが、音楽もある仕方で、そうした流れや 感情の記述になっている。ロマンと対比される程のマーラーの音楽は特にそうだ。
それは外部事象の模倣(描写音楽)ではなく、内部事象の記述なのだ。

* * *

標題に、歌詞にひきずられずに音が記述するものを読み取る。
それを標題や歌詞とつき合わせてイロニーが判定できる。
アドルノ的な歴史のスキーマは一旦捨てるべき。勿論創作の極の「文化史」なり意識のありよう、 社会のありようがしかじかであったという事実はある。
だが、読み取るのは音楽が記述することなら、何が隠れているのかを事前に決めなくても良い。
西欧の社会の歴史を読み取らなくてもよい。
観相学は別の枠組みで機能させることも可能ではないか?
文化史は結構(フローロス)だが、アドルノはそれ自体を「素材」と見做しつつも結局、「文脈」に 戻ってゆく。創作の文脈の外にあるものは音楽からは聴き取れない。
だが音楽作品は別の文脈でも機能しうる。
相互作用も起きる。そうした文脈形成を、つまりはミームとしての存続を保証するのは作品そのものだ。
アドルノ的な文脈から離れて作品の認知的なスキームを記述すること。
所詮は文化依存のものとはいえ、「意識」レベルでの共時的な記述を試みること。

認知のレベルは一般的だが、「意識の音楽」という定式には限界がある。
マーラーならOKだが、他の作曲家がどうかは個別に検討すべき。
マーラーが中心、出発点の展望は自明でない。それに留意すれば、だが、その展望ならではのものがあるだろう。 しかもここではさしあたりマーラーの場合で十分なのだが。

* * *

自分の例えばバルビローリのマーラー演奏に関する評言を練り直すこと。
意識の音楽、主観の、世界に対する反応の音楽というのが、如何にして正当化されうるのか、の議論が必要だ。
形式的には、バルビローリについて演奏スタイルについてのコメント―聴くことをめぐる幾つかの視点を 書いたのが参考になるだろう。
あるいはショスタコーヴィチについて書いたときの論点をマーラーにapplyすることによって少なからず明らかになるだろう。

テンポの設定の問題も、意識の様態として考える際の重要なパラメタになりうる。遠近法(空間性)図と地、特に地の、 地平の存在はマーラーの場合これまた重要だろう。

過度に主観的に受け取ることについての異論が存在するだろう。それは歌曲の側から来る。
主観的な抒情詩の世界からはマーラーは遠い、ムソルグスキー、ヤナーチェクというAdornoの連想は多分正しいのだ。
一旦中期のRueckertの時期に主観性に辿り着いたという見方もあるだろう。
だが、多分中期においてすら、少なくとも交響曲では、いわゆる抒情詩的な主観性と異なるものがある。 要するに、意識の音楽は、主観の音楽は「主観的な」音楽ではないのだ。この点を強調する必要がある。

そもそも交響曲の構成原理は、主観的な叙情からはでてこない。よくマーラーの交響曲の形式は借り物だ、 と言われるが、だが、交響曲が「既存の」形式であった以上、同時代の誰にとってもそれは借り物なのだ。 要するに、交響曲の構成を支える要素は、世界の側に存する。マーラーにとっては毀損の交響曲という形式そのものが「世の成行き」なのだ。

* * *

シェーンベルクの「メガホン」。書きとらされているというマーラーの証言。

Sibeliusの孤独、何と遠いことか。
あの主観と風景のあり様は、やはり例外的なものだろう。
単に人との交わりを絶って、ひとりになることはではない。
例えばマーラーの第3交響曲が書かれた環境や、Ich bin der Welt abhanden gekommenを考えればよい。
それは主体の享受の相で捉えることができる。

第3交響曲は一見、客観の力をほとんど制御せずに(第9交響曲でそうであったように)主体はほぼ媒体として機能しているように見えて、その主体の「形式」の 「形式化する」力はきわめて強い。要するに、ここでの立場の違いは、世界を表現することと音の自律的な運動に身を委ねることの違いなのだ。「メガホン」であることは、非人称性は、作品の無個性、汎個性を意味しない。(事実は全く逆だ。)

Selbstgefuehlという標題は興味深い
確かにこれを「うぬぼれ」と訳すのは妥当でなさそうだ。
しかも、この歌詞はマーラーの音楽の持つ「批判的態度」の典型的な例証となっている―ただし、自分の気持ちが 「わからない」というアイロニーの形をとってだが。

* * *

(2022.12.7:2002~2008の間に書き留めた備忘を整形・校正・編集)

2022年10月10日月曜日

ポスト・コロナ禍における第2交響曲演奏の意義(2022.9.11 マーラー祝祭オーケストラ第20回定期演奏会によせて:2022.7.27 最終稿)

 「復活」というタイトルで親しまれ、マーラーの作品の中で最も人口に膾炙した作品であろう第2交響曲について、既に色褪せたものとする主張が半世紀以上前にアドルノによって為されている。国内でも柴田南雄がフィナーレの器楽部分への批判を述べているし、最近では村井翔の評伝の作品篇には第8交響曲同様、第2交響曲の解説もまた存在しない。こうした識者の評価に対し、第2交響曲の意義を擁護することは今日如何にして可能だろうか?

 この作品の構成が緊密とは言い難いことは様々な論者により繰り返し指摘されてきたが、7年にも及ぶ錯綜を極めた成立史もまた、最終形態に至るまでの構成上の紆余曲折を物語って余りある。この作品の最初の構想は第1交響曲の初期稿が完成した1888年迄遡るが、最初に完成したのは最終形態の第1楽章で、草稿のタイトルは番号なしの「交響曲ハ短調」であった。当時、後に第1交響曲となる作品はまだ2部からなる交響詩「巨人」であり、その状況は第2交響曲が完成した1894年においても同様であったから、この作品はマーラーが「交響曲」として構想した最初の作品であるのみならず、「交響曲」として最初に完成した作品でもあったことになる。

 その最初に完成した部分が一時期、交響詩「葬礼」として独立した作品として扱われていたことは良く知られているが、他方で交響曲としての構想において楽章順序の揺らぎが存在したこともまた、ナターリエ・バウアー=レヒナーの回想や遺品によって確認できる。最終形態で第2楽章となるアンダンテが書かれたのが第1楽章の完成に近い時期であるにも関わらず、当初マーラーはこの楽章を第1楽章に後続させることを考えておらず、アンダンテを第1楽章、スケルツォ、「原光」に続く第4楽章に置く I-III-IV-IIという順序を構想したスケッチが遺されている。更に1895年1月に行われた最初の3楽章の試演では最終形態と同じI-II-IIIの順序で演奏されたようであるが、その折に作成された写譜における楽章順はI-III-IIであり、スコアの練習番号がスケルツォのみ、第1楽章が27番で終わるのを受けて28から始まる点にその名残が見られる。最終稿における第1楽章と第2楽章との間の5分間の休憩の指定は、構成上の弱点が最後まで解消されなかったことについてのマーラー本人の自覚を告げていよう。

 交響詩「巨人」や第3交響曲と異なり、各楽章のタイトルこそ付されなかった替わりに、この曲にはプログラムが遺されており、作品紹介の定番アイテムの一つとなっているようだが、本人の手になるとはいえ、当時の環境下での或る種の方便として後付けで用意された、それこそとっくに賞味期限切れに違いないものを、時代と文化的環境の隔たりが恰も存在しないかの如くに文字通りに受け取り、内容を論じることに意義があるとは思えない。マーラーの「復活」「再生」についての考え方は書簡や回想によって確認することができるが、作品そのものの今日的意義を測る上でより重要なのは、寧ろフィナーレの歌詞に対するマーラーの介入であろう。クロップシュトックの「復活」の讃歌は歌詞の冒頭部分のみに過ぎず、その後の追補は「自作」のものであると、作品を仕上げている最中の1894年7月のベルリナー宛書簡でマーラー自身が述べている通りで、全体としては後年の「大地の歌」終楽章でも見られる「追創作」の先駆と見るのが妥当だろう。

 この点はハンス・マイヤーがマーラーを「簒奪者」と断じる理由に他ならないが、同時に彼は、それを同時代の芸術的代理宗教に属するもので、信仰の衰退の証言としてではなく、新しい宗教感情の芸術として受け止めてもいて、岡田暁生がマーラーの音楽を「神なき時代の宗教音楽」と規定し、フランス革命後の市民社会が産み出した制度であるコンサートのためのジャンルであるにも関わらず、その交響曲が聴衆から拍手喝采を浴びるための音楽ではなく、祈りの音楽であることを指摘する点に通じていよう。更にマイヤーは「大地の歌」が第2交響曲の撤回を意味するとも述べているが、この指摘は第2交響曲末尾の変ホ長調の主和音(それは第8交響曲にも共通する)と比べて「大地の歌」末尾の付加六の和音を「不協和」と見做すことに構造的に対応しており、かつまた第2交響曲におけるハ短調⇒変ホ長調という並行長調での解決の図式を共有する唯一の作品が「大地の歌」(イ短調⇒ハ長調)であり、だが前者での長調の主和音の解決に替えて後者では付加六の和音で解決が宙吊りされていることに対応している。柴田南雄は第8交響曲以降の後期作品を指して「背後の世界の音楽」と名付けたが、それはまた第2交響曲にも相応しく、第8交響曲第2部と同様、第2交響曲も死の影に覆われている点で「大地の歌」に通じることの方が重要ではなかろうか。

 マーラーがピアノで第1楽章を弾くのを聞いたハンス・フォン・ビューローの拒絶反応と並んで、そのビューローの葬儀で歌われたクロップシュトックの「復活」の讃歌に霊感を受けて終楽章を書き上げたという経緯もまた有名だが、そこに精神分析的な「父親殺し」を見出そうとするテオドール・ライクの主張よりも、クロップシュトックの讃歌という「他者からの呼び掛け」に触発されてようやくマーラーが自らの語りへの衝動を掴み取ったことに寧ろ注目すべきだろう。後者については1897年2月17日付のアルトゥール・ザイドル宛書簡で「聖書を含むあらゆる文学書を渉猟しつくした挙句」のことだと回顧しているが、例えばド・ラ・グランジュに拠れば、終楽章に取り組んでいる時期にマーラーがフリッツ・レーアへ作品集の送付を依頼したとされるヘルダーリンの「ヒュペーリオン」第2巻第2部に「わたしたちは生きるために死ぬのです」(Wir sterben, um zu leben.)というディオティーマの言葉が見出せるのは偶然だろうか。続けて神々の世界では「すべてが平等」で 「主人も奴隷もいない」と語られるのが第2交響曲のプログラムの内容と呼応するように感じられるのはどうか?実証的な裏付けは不可能にせよ、他者達とのやりとりが半ば無意識の裡に作品中に仮想的な風景として定着された結果、作品を介して他者達が語っていること、更に時空の隔たりを通じて我々もまたそれを「投壜通信」のように拾い上げ、更に継承していくことが重要なのではなかろうか?

 「簒奪」に見えたものは、実は「他者からの呼び掛け」に対する「応答」に他ならなかったのだ。またしても第8交響曲も含め、敬虔さや超越者との対話といった変ホ長調の調性格論的な規定を考えれば、それが「他なるものへの応答」であることが確認できよう。そしてそれに見合うように、この作品は構成上の困難を埋め合わせるに足る決定的な瞬間に事欠かず、彼を通して他者の声が響きわたる瞬間の持つ圧倒的な力が色褪せることはなさそうに見える。

 コンサートホールが祈りを追放し、チケットの代金と引き換えに動員された聴衆が演奏者と一体となる高揚感の挙句に拍手喝采を惹き起こす場所であるのに対して、しばしばこの作品のモデルとして引き合いに出されるベートーヴェンの第9交響曲とは明らかに異なって、この第2交響曲は一見そうした熱狂を惹き起こす企図を共有するかに見えて、それに反するベクトルをも含み持っているのだ。今日のコンサートにおいて確実に集客が見込める「主力商品」である一方で、しばしば第2交響曲が特定の出来事を「記念」するための音楽でもあるのも、そのことを物語るように思われる。コンサートホールの杮落しや演奏者のアニヴァーサリーを「記念」することも勿論だが、それにもましてこの曲が、その場にいない者への「追悼」や「追憶」のための音楽であることは、数多いこの曲の演奏記録の中でも圧倒的な第二次世界大戦後のワルターのウィーンへの里帰りコンサート―それはナチスにより禁じられたマーラーの音楽の「里帰り」という意味合いもあっただろう―やケネディ大統領追悼の放送のためのバーンスタイン指揮のニューヨークフィルハーモニックによる演奏のような例を思い起せば十分だろう。

 翻って今回の演奏が、新型コロナウィルス感染症の蔓延とそれに伴うコンサートの延期・中止といった出来事を追憶し、そこからの甦りの祈念という意味合いを持つことは、ステージにあふれんばかりの巨大な管弦楽と独唱・合唱を必要とし、それを聴くために集まる満場の聴衆を必要としているこの作品のような音楽を演奏し、継承していくことが一時的とはいえ不可能となったことに照らした時、決して偶然ではないだろう。それが故に今回のコンサートの意義を噛み締めることは、時代を通り抜けて継承されるべき価値をマーラーの音楽に見出す人間にとって一つの責務であるように思われるのである。(2022.5.18-9初稿, 5.22改稿)

 [後記]上掲の文章は 2022年9月11日のマーラー祝祭オーケストラ第20回定期演奏会のプログラムに寄稿させて頂いた文章の最終稿(プログラムノートに掲載される直前の稿態)です。直前迄、公演に立ち会う予定であったものの、事情により叶わず大変に残念でしたが、そのことのお詫びとともに公演へのコミットメントへの記録して公開させて頂きます。(2022.7.27脱稿, 2022.10.10公開)

2022年7月7日木曜日

Google Magenta の Polyphony RNN モデルを用いたマーラーの作品の学習実験ノート・本文(2022.7.7 公開, 10.10更新)

元記事(2022年7月7日公開)の「はじめに」を2020年10月10日に独立させて「Google Magenta の Polyphony RNN モデルを用いたマーラーの作品の学習実験ノート・序文」とし、別記事として公開しましたので、併せてご一読頂ければ幸いです。


1.実験に至るまでの経緯と実験結果公開の目的について

 MagentaはGoogleが開発した音楽の機械学習ライブラリだが、その詳細についてはWeb等で情報が入手できる他、2021年7月に斎藤喜寛『Magentaで開発 AI作曲』(オーム社)が刊行され、環境構築や簡単な実験を行うための情報が入手可能になったことをきっかけに2021年の8月末くらいから予備調査に着手した。

 深層学習が注目されるようになって間もなくの頃は、深層学習の実験を自分で試行する手段としては、個人で購入するには決して閾が低いとは言い難いGPUマシンを自前で用意する他なかったが、Google ColaboratoryというクラウドサービスでGPU環境が利用できるようになった。早速試用してみると、無料での利用の範囲ではGPUが連続利用できる時間や利用できるメモリ等に制限がある他、高速なGPUが割り当てられるとは限らないといった制限があり、ちょっとした実験をするにも工夫が必要だが、月あたり1000円程度(為替相場による変動あり)のコストで最低限の実験環境を持つことができ、特に今回の実験に限れば実施可能であることが確認できた。そこでGoogle ColaboratoryのPro版で実験を行うこととした。

 一方、今回の実験の素材として第3交響曲第6楽章を取り上げた最大の理由は、本ブログで2ヵ月前くらい(2022年5月)に公開した記事(デイヴィッド・コープのEMI(Experiments in Musical Intelligence)によるマーラー作品の模倣についての覚え書)に記載の通り、デイヴィッド・コープの著書Computer Models of Musical Creativity(音楽的創造性のコンピュータモデル)の邦訳(『人工知能が音楽を創る 創造性のコンピュータモデル』(音楽之友社, 2017)に遅ればせながらようやく接し、そこでコープがEMIを用いて作成したマーラーの作品の模倣の一つに、この曲をモデルにしていると考えられるもの(『弦楽のためのアダージョ』)があることを、その一部(Mahler Adagio Emmy David Cope (1:57):Mahler Adagio for Strings fragment by Experiments in Musical Intelligence (Emmy) programmed by David Cope.)をYotubeで確認したからである。

 理由のもう一つは、Google Magentaが用意している幾つかのモデルの中で今回実験にPolyphony RNNモデルを用いたことにある。Polyphony RNNモデルはMagentaで用意されているモデルの中で和音を扱うことができるほぼ唯一のモデルといって良い、厳密にはPianoroll RNN-NADEモデルも候補になりうるのだが、こちらは持続方向の扱いに制約があるために、結果を「聴いて」直観的に評価することが困難であること以上に、Pianoroll RNN-NADE custom dataset sample generation error #1878 で報告されている事象に予備実験中に遭遇してしまったことから、消去法的にPolyphony RNNを用いることにしたというのが実態である。 

 既述の予備実験においては、第3交響曲第6楽章以外のマーラーの色々な作品のMIDIファイルを色々なやり方で与えた他、シェーンベルクがプラハ講演で述べたマーラーの作品の旋律の特徴を念頭に、歌曲の歌唱パートのみを抽出し、旋律のみを扱うmelody RNNモデルに与える実験も行った。しかしながら後述の理由から、機械学習の実験テーマとしては成立しそうに思われたものの、実験の目的やそれに応じた実験条件の設定についての検討の必要を感じたことから、今後の実験課題の候補には含めるものの、優先的に実験を行う対象とはしなかった。例えば第10交響曲の補完を考えた場合に、必要なのは与えられた旋律線に対する和声付けや対位法的な声部の補完といった方向性の課題となる。またくだんのシェーンベルクの指摘も、和声法や対位法的な垂直の次元を捨象した水平的な線の問題として扱うことが妥当かどうかには疑問の余地があるだろう。何よりもこれまでMIDIファイルを入力としたマーラーの作品の分析において中心的な課題としていたのは、調的重心であったり和声の出現頻度であったこととの連続性を踏まえれば、最初の実験としては単旋律の発展ではなく、和音のシーケンスを対象とするのが自然に感じられたということである。

 そして和声のシーケンスにフォーカスする場合にMagentaで事前に用意されたモデル中で適切なのは、上記の通りPolyphony RNNということになるが、Polyphony RNNモデルにおける課題の範例はコラール旋律への和音づけであり、直接にはFeynman Liang, BachBot: Automatic composition in the style of Bach chorales Developing, analyzing, and evaluating a deep LSTM model for musical style (2016)に記載されたBachBotという自動音楽生成アルゴリズムに刺激を受けて作成されたもののようである(なお、上記論文では先行研究としてデイヴィッド・コープの研究を参照している)。後述のように、Pythonのコードの形態で提供されているPolyphony RNNモデルの公開されている実装はコラール固有の特徴を前提として各種パラメータの規定値が設定されているため、マーラーの作品を対象とするにあたっては後述するようにパラメータの調整が必要ではあったが、線的な書法の作曲家であるマーラーの作品の中でも、第3交響曲第6楽章(更にその中でも主要部の主題旋律とその和声づけ)は「コラール風」のものと言って良く、Polyphony RNNを用いた実験の素材として無理がなさそうに感じられたというのも、実験で最初に取り上げる題材として選択した理由の一つである。

 だがその一方で第3交響曲第6楽章をGoogle Magenta の Polyphony RNN モデルに訓練データとして与えるということの意味合いについては議論の余地があるだろう。そもそもコープのEMIによるマーラー風のアダージョがどのようなプロセスで生成されたのかは明らかではない(正確を期すれば、現時点の私にとっては、という制限を付けるべきだろう。もしかしたら、この個別のケースについての報告がなされているかも知れないが、上掲のコープの著作の文献リスト中にそれらしいものはないし、コープは自分のプログラムを公開していたことがあるようだが、寧ろ重要なのは何を入力として与え、どのような制御パラメータがあって、それぞれどう設定したら結果がどのように変わるのかといったディティールの筈である。ここでも問題設定は、例えば囲碁や将棋のような、well-definedでclosedな世界とは異なって、寧ろチューリング・テストのような設定に近そうであることは、例えばバッハ風のコラールの和声づけをやった結果を人間に聴かせて、コンピュータが生成したものか否かを判定させて、人間の創作物と区別がつかなければ成功といった評価の仕方に端的に表れている。だがこの場合ですら、バッハの手になる作品か否かというように問いをずらした途端、バッハが行ったコラールの和声づけを「全て」知っている人間にとっては、未知の真作が発見されたといったような文脈抜きではトリヴィアルな問いになってしまうだろう。結果として、既知の作品の「模倣」という目的での或るモデル上での学習の結果の評価は、それを「人間」の曖昧な感覚に委ねるというやり方を拒否してしまえば、自ら定義した「模倣」の成功の度合いを密輸して(何なら堂々と再利用して)生成されたものとオリジナルの既知の作品の距離を測っているに過ぎないことになってしまうことを避け難い。

 それが「学習」であるならば、訓練用データを用いた訓練の結果として汎化が行われ、訓練データ以外のデータを与えた場合にも「それらしい」出力が行われることが求められるのだが、それでは第3交響曲第6楽章と似て非なる作品が生成されるためには一体何を訓練データとして用意すればいいのだろうか?(なおこの問いは、まさにマーラーその人を作曲する機械と見た立てた時、第3交響曲の第6楽章を出力する際に、どのような情報を素材にして、どのようなプロセスで生成が行われたかを問うていることに他ならない。そしてそうした類比を行う先には、Recurrent Neural Networkというチューリングマシンとしての能力を備えた再帰的構造を持つネットワークを基本とし、それが持つ問題点を解消するための制御ノードとして機能するゲートを追加して部分構造を持つようにしたLSTM(Long Short Term Memory)上に実装されたPolyphony RNN モデルがやっていることを、人間の営みとしての「作曲」と呼んでしまうことが孕む深淵が控えていることが見てとれる。)いわゆる「過学習」が起きている場合には、汎化能力が犠牲になる替わりに訓練用データについては精度の高い近似ができるようになっているとされるが、もしそうであるとするならば、ここでの関心は「学習」をさせることではなく、寧ろGoogle Magenta の Polyphony RNN モデルに第3交響曲第6楽章を訓練データとして与えた結果、訓練済モデルが第3交響曲第6楽章そのものを(音楽サヴァンの一部で見られるように完全に間違いなく、最初から最後まで、ではなく、時として間違いを含みつつ、だが或る一部についてはかなりの高精度で)再生できるかどうかにあるのではなかろうか?

 一般的に機械学習の問題設定として見た場合には、演奏すれば20分以上の時間を要するから作品としては大規模なものであるとはいえ、400小節にも満たない第3交響曲第6楽章だけをLSTMの学習の素材として与えることは、サンプル数が少なすぎて適切なものではないという評価になるだろう。一方で第3交響曲第6楽章を出力として得るためには、どういう学習の問題を設定したらよいかというのは、上で見たように端的に言って不良設定問題に過ぎない。従ってここで以下に報告する実験は、形式的にはそのように見えるということもあって、Google Magenta の Polyphony RNN モデルを用いたマーラーの作品の学習実験と銘打っているけれども、実態としては、それが「学習」なのかどうかは一先ずおいて、とにかくGoogle Magenta の Polyphony RNN モデルにマーラーの作品のうちの特定の1楽章を与えてみた結果の報告に過ぎないということをお断りしておきたい。

 なお実験に使用したMagentaのバージョンは2.1.3である。このバージョンは2022年7月1日以降、関連するライブラリの更新の結果、Colaboratory環境にインストールすることができなくなり、本稿執筆時点では実験再開の見通しは立っていない。基本的にはフリーで提供される場合には、こうした状況はしばしば発生し、基本的に利用する側が自己解決すべき性質のものとされ、時間をかけて依存関係を調べて、トライアル&エラーを繰り返せば利用できる可能性もあるだろうが、遺憾ながらそのための時間的な余裕がないため、一旦Magenta を使った実験は中止せざるを得ない。まだ実験を開始してからの時間が短く、敬虔が浅いため、まだまだ改善や工夫の余地があるにも関わらず、一旦これまでの経過を報告することにしたのには、Magenta 2.1.3 が私の環境で使えなくったという事情も寄与している。

[2022.10.10 追記]その後程なくして、遅くとも2020年8月下旬くらいには、ライブラリの依存関係の問題が解消され、再びMagentaを私のColaboratory環境から利用できるようになり、9月中旬には、それまでに実施できていた実験が行えることを確認した。この追記を行うにあたり、念のため最新の状態を確認したが、利用可能な状態にあることを確認できた。そのため、今後更に、このノートの内容を踏まえた追加実験を行うことがあれば、稿を改めて報告することにしたい。

 最後にもう一言だけ述べてこの節を閉じることにするが、「学習」実験の設定としてはより自然なものに見えるであろう、例えばマーラーの複数の作品を入力として与えたらどうなるかという設定について検討しなかったわけではない。既に述べた通り、予備検証フェーズでは、マーラーの歌曲でMIDI化されているものすべてを対象とした検証は実施しているし、マーラーの交響曲全曲のMIDIファイルを対象とする検証も実施はしており、だがこちらはリソースの限界が確認できたために中止することにした。無論対象を絞って、リソースの制約上可能な条件を設定することは可能なのだが、それ以前の問題としてマーラーの複数の作品によってモデルを訓練させることの意味合い、結果として生成される音の系列をどう評価するかについて、上述のような疑問を感じて、実験することに意義を見出せなかったということの方が本質的であると考える。例えば思考実験として、マーラーの歌曲の中から2曲を取り上げて学習させることにしよう。この場合なら、何が学習されるのか?一方で、ごくありふれたこととして、或る歌曲なり交響曲楽章の内部構造として主要部と対比的な部分があるとして、主要部の複数のヴァリアントを与えるなり、主要部と対比部のコントラストを与えるなりすることとどう違うのか。もちろんそれは学習機械の構造にもよるし、具体的な学習時のパラメータと入力として用意したデータとの関係で決まる部分もあるだろうが、ここで私に言えることは、こうした問いは自明でトリヴィアルなものという訳ではないということであり、実のところ今回の実験は、もしかしたらトリヴィアルかも知れないこうした問いについて、それゆえ他の誰もやってみようと思わない実験をやってみた結果を報告することを目的としているというのが実態に即しているように思われる。

 

2.予備検証により判明した本番実験に向けての課題と本番実験方針の決定

2.1.MIDIファイルの事前編集

 Google Magentaは入力としてMIDIファイルを使うことができるので、これまでMIDIファイルを入力としたデータ分析に利用することを目的に、Web上で取得可能でかつフリーで使用可能なMIDIファイルを取得・蓄積してきたものが活用可能である。実際2021年8月末から約1ヵ月程度、断続的に実施した予備実験では、調的重心の移動の可視化や和音の出現頻度に関する統計的な分析の入力として使用してきたMIDIファイルを利用した検証を行うことができた。その一方でMagentaで用意されたモデルが入力として要求するMIDIファイルには制限があり、手元にあるMIDIファイルをそのまま使うことができないことが調査の結果判明した。

 手元にあるMIDIデータは、DTMの一環としてMIDIシーケンサソフトウェアを用いて手入力されたものであるか、MIDIキーボードでの演奏をMIDIデータとして保存したもののいずれかであることが多いが、マーラーの作品の場合にはピアノ伴奏版がある一部の歌曲を除けば管弦楽曲であるためマルチトラック・マルチチャネルで作成されているため、Polyphony RNNモデルへの入力となるMIDIデータはシングルトラック・シングルチャネルである必要がある。マーラーの作品は既存のMIDIファイルはマルチトラック・マルチチャネルで作成されており、Magentaで利用するためには事前にMIDIシーケンサソフトを使ってデータを加工・変換する前処理が必要であることがわかった。 トラックの統合はMIDIシーケンサソフトで比較的簡単に行うことができるが、統合されたトラックの開始部分にはもともと各トラック毎にチャネルを指定していたプログラムチェンジが残っていて、マルチチャネルの状態は解消されていない。そのためMagentaで利用するには更にプログラムチェンジを取り除く必要があることがわかった。


2.2.Onsets and Frames Transcriptionの出力の利用の検討

 ところでマーラー作品のMIDIデータの作成の方法としてもう一つ、ピアノ編曲の演奏をMIDIファイルに変換するというやり方がある。MIDIキーボードを用いた演奏であれば演奏をMIDIデータとして保存することでMIDIデータが生成されるが、アコースティックのピアノの演奏の音響を録音して保存した場合には、wavなどの様々なフォーマットで作成された音響ファイルをMIDIデータに変換しなくてはならない。

 この変換の実現手段として、それ自体Magentaを使ったアプリケーションであるPianoScribeがあり、かつColaboratory上では、Onsets and Frames TranscriptionというNotebookとして提供されているので、これを用いてwavファイルをMIDIファイルに変換することが可能である。Youtube等でマーラーの交響曲のピアノ編曲版の演奏が公開されており、第3交響曲第6楽章については以下のように2手用・4手用の演奏があるため、これらを入力としてまずOnsets and Frames Transcriptionの検証を実施した。

 結果としてOnsets and Frames Transcriptionの性能は申し分なく、音響データが精度よくMIDIコードに変換されることがわかったが、その一方で結果を確認してみると、当然のことではあるが、あくまでもこれは音響データのMIDIコード化であって楽曲の構造を意識したものではないから、例えば小節・拍に関しての処理はなされず、本来ならば記譜上、拍節構造を持つものとしてMIDIコード化された上で、実演において微妙なアゴーギクが施されたものがMIDIのテンポ変更コマンドとしてコード化されるべきものが、直接長さの微妙な差異がMIDIノートのステップ数として表現されてしまっていることがわかる。また現実の演奏にありがちな和音の打鍵のぶれや、長さのムラ、或いはミスタッチについても当然のことながらそのまま記録され、修正や規格化が行われることはない。

 Polyphony RNNモデルは拍節構造を意識したものではないから、以前に取り組んだ拍頭の和音の集計や分類におけるような致命的な問題にはならないし、更に言えば微妙な演奏上のクセのようなもの込みで学習するという別種の可能性もあるにせよ、ここでの関心からすると遠回りな感覚を否めず、その手間を埋め合わせるだけのコストメリットは見出し難い。更にいえば、分析目的ではなく、あくまでも演奏されることを目的に作成された編曲版は、ピアノという楽器の性質を踏まえて然るべき演奏効果を上げることを目的として、しばしば元の管弦楽版の楽譜に忠実であるとは限らない。

 具体的に第3交響曲第6楽章について言えば、上記の2手用編曲と4手用編曲の演奏記録が存在するわけでが、前者がピアノ独奏で大規模な管弦楽を用いたマーラーの交響曲を演奏することに由来する改変が目立つのに比べれば、ここでの目的に照らして後者に分があるのは明らかだとはいえ、後者もまた独自の演奏効果を求めて管弦楽版には存在しない要素が追加されていることには違いなく、管弦楽総譜に忠実にマルチトラック・マルチチャネルで作成されたMIDIファイルをシングルトラック・シングルチャネルにマージしたMIDIファイルの方が今回の目的には適っていると判断し、Onsets and Frames Transcriptionの出力は実験には採用しないことを決定した。


2.3.入力データの調整、訓練用データ生成のパラメータの調整について

 そこで管弦楽総譜に忠実にマルチトラック・マルチチャネルで作成されたMIDIファイルについて確認してみると、第3交響曲第6楽章については以下の2種類のMIDIファイルがWebで公開されており、利用可能であることがわかる。(本ブログのMIDIファイル(2019.9.21更新) を参照されたい。)

  • GustavMahler.Comで公開されているBen Boot作成の6th-movement-Langsam-Ruhevoll-Empfunden.midi (16-channel)
  • 加藤隆太郎さんの旧「Deracinated Flower」のコンテンツの一つであった「MIDIの間」中の「マーラー交響曲 MIDI 全集」に含まれる m3_6.mid。記載はないがこちらも16channelである。(2022.10.10 プロバイダの閉鎖によりアクセスできない旨記載していたが、2022年7月20日にご本人より移転のご連絡を頂いた。現時点では、http://kakuritsu.sitemix.jp/asobi/midi2/index.html に移転されており、再びアクセス可能な状態となっている。2024.6.21その後再びアクセスできなくなったことをか確認。)

 このうち後者のMIDIファイルの作者とはマーラーの作品のMIDIファイルの調査を実施した折にメールでやりとりをさせて頂いており、作成方針から第10交響曲こそないものの、その時より今日に至るまで、文字通り世界で唯一の「マーラー交響曲 MIDI 全集」である後者のデータを従来より和音の出現頻度や調的重心の遷移などのデータ分析で用いてきたこともあり、ここでも後者のMIDIファイルを素材とすることにした。(ちなみに前者は第1交響曲こそ2種類のデータが入手可能であり、更には第10交響曲のデリック・クックによる演奏会用補筆完成版のMIDIファイルが公開されていることが特筆されるものの、第6~8交響曲と「大地の歌」を欠いており全集とはなっていない。)

 既に述べたように、Google Magentaは入力としてMIDIファイルを受け付けるが、事前に用意されているモデル毎に制約事項が存在する。ここで利用を予定しているPolyphony RNNモデルについては、シングルトラック・シングルチャネルであることを条件としているとのことなので公開されているMIDIファイルをそのまま使うことができない。そこでMIDIシーケンサソフトを使って、Magentaに与えることができるかたちに加工する作業を実施することにした。

 使用したMIDIシーケンサソフトは、従来の和声の出現頻度や調的重心の遷移過程の分析にあたって利用してきた以下の2つのフリー・ソフトである。

 対象としたMIDIファイル m3_6.mid は16チャネル16トラックだが、ピッチを持たない打楽器用の第10チャネル/第10トラック以外について1トラックにマージする作業をまず実施した。その結果を用いて試しにMagenta(バージョン2.1.3)のPolyphony RNNモデルに与えて、NoteSequenceファイル(notesequences.tfrecord)の作成、NoteSequenceファイルから抽出した訓練データ(training_poly_tracks.tfrecord)の作成、訓練の実行、更には訓練結果のbundle_file (polyphony_rnn.mag)への出力、bundle_fileを使った楽曲生成と一通りの手順を試行してみた結果、一応最後まで実行できることが確認できたのだが、訓練データ(training_poly_tracks.tfrecord)作成にあたって、訓練データとして抽出する条件に多くの部分が合致せず、結果として訓練用データがわずかしか生成されないことを確認した。原因を探るべく、Pyrhonで実装されたPolyphony RNNモデルのソースコードの中の訓練データ・評価データの作成を行うpolyphony_rnn_create_dataset.py を読んでみると、Polyphony RNNモデルの公開されている実装については、前提としてバッハのコラールが学習の対象であることから、コラール固有の条件が各種パラメータの規定値とされていることが判明した。例えばシーケンスの長さの上下限の制限が厳し過ぎて、訓練用データが生成できないケースが多い。これに対処するために、ローカルにmagentaの環境のクローンを作成し、シーケンスの長さの下限の制限を緩和したコードでデータ生成を行うことにした。

 具体的な修正箇所はpolyphony_rnn_create_dataset.py の中でmin_steps, max_stepsの設定をしている箇所()で、それぞれの標準値は以下の通り。
  • min_steps=80(5小節相当
  • max_steps=512 (32小節相当) 
 標準値は明らかにコラールのフレーズの構造および各フレーズの長さ、コラール全体の長さを想定したものであることがわかる。そこで第3交響曲第6楽章という対象の性質を考慮して、以下のように値を設定することとした。 

(A)予備実験でのパラメータ設定
  • min_steps = 16(=16*1) 1 measures:より短いフレーズの抽出を行う。
  • max_steps = 768(=16*48) 48 measures :1.5倍の長さのフレーズまで抽出。
 上記の設定値での予備実験の結果は、lossやaccuracyといったメトリクスは良好であるにも関わらず、生成結果は期待外れだったことから、短すぎるトラックが副作用を起こしている可能性を考慮して、本番では以下の通り、minを若干長く設定することにした。
 
(B)実験本番でのパラメータ設定
  • min = 48(=16*3) 3 measures:より短いフレーズの抽出を行う。
  • max = 512(=16*32) 32 measures :デフォルト値のまま。
 上限について変更しないことにしたのは、後述のMIDIファイルの分割を実施したこともあり、実際に訓練データ・評価データの抽出を行ったときに、上限超過が原因で抽出対象から除外されたケースが生じなかったことから、変更の必要がなかったことによる。上下限とも値をデフォルトに戻したのは、訓練に用いるネットワークのサイズを変更せず、デフォルト値を使うことと関わる。このデフォルト値の範囲ならばデフォルトの規模のネットワークでの学習が可能でサイズ変更は不要だろうという判断に基づく。
 
 更に上記のパラメータ変更を前提とし、第3交響曲第6楽章という対象の性質を考慮して、シングルトラック化・シングルチャネル化したMIDIファイルをまず幾つかのブロックに分割することを検討した。分割のやり方としては機械的に行うことも考えられるが、訓練用データ・評価用データの作成の抽出の仕方を考えると、質の面でも量の面でも楽曲の構造を意識した分割をした方が望ましいことは明らかであるから、楽式上の区切りを考慮して、まずは全体を10ファイルに分割したデータを用意することにした(program_merged_36)。
  • ①最初から練習番号4 Noch mehr so breit.の手前まで
  • ②練習番号4 Noch mehr so breit.から練習番号9 Tempo I. Ruhevoll! の手前まで
  • ③練習番号9 Tempo I. Ruhevoll!から練習番号14 a tempo (Etwas bewegter.)の手前まで
  • ④練習番号14 a tempo (Etwas bewegter.)から練習番号16 a tempoの手前まで
  • ⑤練習番号16 a tempo から練習番号19 a tempo の手前まで
  • ⑥練習番号19 a tempo から練習番号20. 2/2 taktiren. Sehr bewegt.の手前まで
  • ⑦練習番号20.2/2 taktiren. Sehr bewegt.から練習番号23の5小節手前まで
  • ⑧練習番号23の4小節手前から練習番号25 Wieder Viertel schlagen! Langsamの手前まで
  • ⑨練習番号25 Wieder Viertel schlagen! Langsam から練習番号26の2小節前8/8 Sehr zurueckhaltend. の手前まで
  • ⑩練習番号26の2小節前8/8 Sehr zurueckhaltend.から最後まで
 次いで更に上記の分割結果をベースとして、更に以下のような加工を行った。
 
(1)コーダはフレーズの構造としては特殊であり、カデンツが拡大したものとみることができるため、ここでの目的の観点から削除した。コーダの前にある、アドルノ風には「充足」の機能を持つ後楽節についてはコーダとは機能的には異なるが、それを独立のフレーズとして訓練用データに含めると異質な感じがあるので、同様に削除することにした。
(2)トレモロの指定もなくして、同じ長さの単音符に置換。学習する上で、トレモロの有無が特徴として捉えられるのは、今回の実験の目的にはそぐなわないため、外してしまうことで余計な特徴次元のためにリソースが使われてしまうことを防ぎたい。(実際、全小節を10分割した入力データでの訓練結果を使って生成したケースでは、トレモロが特徴として捉えられていることを窺わせるものであった。)
 (3)対比群を削除して主要主題部に限定したデータを用意。既に述べた通り、楽式分析上は二重変奏と把握されることが多い第3交響曲第6楽章を対象としているので、2つの異なった系列の交替を、だが訓練用データとしてはブロック単位で分割して、それぞれ独立したサンプルとして、だが2系列を同時に一度に与えて(つまりバッチの中でも両方が混在するような前提で)訓練するというのはどういうことをしていることになるのだろうか、という疑問が生じる。勿論このことは、機械学習による作曲一般に言えることではないのだが、人間が介在することなしにコラールのような単純な形式を超えた楽式を機械が学習を通じて習得することに成功したという話は聞かないし、Google Magenta の各モデルで想定されているのは(出力のステップ数のデフォルトはpolyphony_rnn_generate.pyの62行目に定義されており128step=8小節であることからも窺えるように)、作品上では一部に過ぎないフレーズレベルの時系列シーケンスの学習であって、マクロな楽式はGoogle Magentaのモデルに限定すれば実質的にスコープの外であろう。(それに対して、コープが想定しているのが、その範囲に留まらないことは恐らく間違いないが、その代わりに、例えばマーラー風アダージョを生成するのに、具体的に何を入力し、どのようなプロセスを経たのかの具体的な説明はなく、最終的にYoutubeでその断片が公開されている「作品」の成り立ちのどこがEMIが自動的に生成した部分で、どこがコープが介入したのかは明らかではない。)従って、ここでの学習の枠組みを考えたとき、楽曲を加工をせずにまるまる一つ学習モデルに与えるのではなく、訓練データ・評価データが具体的にどのような条件で抽出されるのかを踏まえて、逆算するようなかたちでモデル与えるデータを準備してやり、生成された結果については、時系列のパターンの記憶・再現がどの程度できているかを確認するのが妥当に思われるのである。
 
 これまでの検討により、最終的に実験の対象として用意したデータは、第3交響曲第6楽章全曲を分割した10ファイルのうち以下の部分を抽出したものとした。
  • ①,40 measures.:最初から 練習番号4 Nicht mehr so breitの前まで。
  • ③,40 measures.:練習番号9 tempo I. Ruhevollから練習番号13 Nicht mehr so breitの前まで
  • ⑦b,16 measures.:練習番号21 tempo I.から22の8小節後, Unmerklich draengend.の前まで。
  • ⑩a,26 measures.:練習番号26の2小節前8/8 Sehr zurueckhaltend.から練習番号28 Immer breiter.Langsam anschwellen の前まで
  • ⑩c,26 measures.:練習番号28 Immer breiter. Langsam anschwellen から練習番号30 の4小節後まで 

total 148 measuresであり、楽章全体(328 measures)の45%程度だが、抽出された部分はコラール的な旋律の提示と変容であり、Polyphony RNN モデルがバッハのコラールの和声づけであることを考えると、マーラーの作品を素材とする前提においては相対的に親和性の高い部分ではないかと考えられる。 

 上記の前処理およびパラメータの設定により訓練用データ・評価用データの抽出結果がどうなったかを以下に示す。

(A)予備実験:全曲を10の区分に分割(328小節、10ファイル)

データ抽出のパラメータ

  • min_steps = 16(=16*1) 1 measures:より短いフレーズの抽出を行う。
  • max_steps = 768(=16*48) 48 measures :1.5倍の長さのフレーズまで抽出。
  • 10 inputs. / 216 outputs..(= train (198 =9+117+54+9+9) + eval(18 = 9+9))

    eval:#評価用データ

    • 小節数毎の頻度(計18)
    • [10,20): 9
    • [20,30): 9
    • polyphonic_tracks_discarded_more_than_1_program: 0
    • polyphonic_tracks_discarded_too_long: 0
    • polyphonic_tracks_discarded_too_short: 153
    • poly_tracks_count:1,
    • skipped_due_to_range_exceeded: 0,
    • transpositions_generated: 171, 

    train:#訓練用データ

    • 小節数毎の頻度(計198)
    • [0,1): 9
    • [1,10): 117
    • [10,20): 54
    • [20,30): 9
    • [30,40): 9
    • polyphonic_tracks_discarded_more_than_1_program: 36 #本番実験では修正して0に。
    • polyphonic_tracks_discarded_too_long: 0 
    • polyphonic_tracks_discarded_too_short: 1161
    • poly_tracks_count: 9,
    • skipped_due_to_range_exceeded: 0,
    • transpositions_generated: 1395


    (B)実験:主要部の提示と変容の部分のみ5つの区分に分割(148小節分、5ファイル)

    • データ抽出のパラメータ

  • min = 48(=16*3) 3 measures:デフォルト値に戻す。
  • max = 512(=16*32) 32 measures :デフォルト値に戻す。
  • 5 inputs. / 81 outputs.(= train (63 = 27+18+18) + eval(18 = 0+9+9))

    eval:#評価用データ

    • 小節数毎の頻度(計18データの内訳)
    • [10,20): 9
    • [20,30): 9
    • polyphonic_tracks_discarded_more_than_1_program: 0
    • polyphonic_tracks_discarded_too_long: 0
    • polyphonic_tracks_discarded_too_short: 27
    • poly_tracks_count:1
    • skipped_due_to_range_exceeded: 0
    • transpositions_generated: 45

    train:#訓練用データ

    • 小節数毎の頻度(計63データの内訳)
    • [10,20): 27
    • [20,30): 18
    • [30,40): 18
    • polyphonic_tracks_discarded_more_than_1_program: 0
    • polyphonic_tracks_discarded_too_long: 0 
    • polyphonic_tracks_discarded_too_short: 270
    • poly_tracks_count: 4
    • skipped_due_to_range_exceeded: 0
    • transpositions_generated: 33
     polyphonic_tracks_discarded_more_than_1_programが0であることは、マルチチャネルのMIDIコマンド(Program change)が正しく全て削除されていることを意味する。既述の通り、大抵のMIDIファイルがマルチトラック・マルチチャネルで作成されており、特に管弦楽のMIDIファイルをシングルトラック化した場合、Program changeの情報を削除しないとマルチチャネルの方は残ってしまう。削除漏れがないことを確認するためにはこの項目をチェックすれば良い。
     polyphonic_tracks_discarded_too_longが0であることはmax_stepsを上回るデータがないことを、polyphonic_tracks_discarded_too_shortが0でないことはmin_stepsに満たないデータがあることを意味する。


    2.4.訓練時のハイパーパラメータの設定について

     ここまで学習の入力とするデータの調整や訓練用データ生成のパラメータの調整について述べてきたが、ここでは訓練時のハイパーパラメータの設定について、検討したり予備実験を実施した内容を述べる。今回の実験にあたって設定値の検討を行ったハイパーパラメータは以下の2種類である。

    • rnn_layer_size:Polyphony RNNモデルの場合、入力層・中間層・出力層の三層のノードの数を指定する。デフォルト値は[256, 256, 256]。今回は予備実験時および実験本番の1度目はデフォルト値のままとし、実験本番の2回目に[192, 192, 192]に縮小した時にどのような差がでるかの実験を行った。
    • batch_size:これは訓練・評価で同じサイズを指定することを前提にすれば、データ数が少ない評価用データ数がバッチサイズよりも小さくてはならないという点が拘束条件となる。デフォルト値は64。ここでは予備実験時も実験本番でもeval=18なので、全ての実験において batch_size=18とした。

     今回の実験のようにサンプルデータが少ない場合、まず最初に調整を検討すべきハイパーパラメータはバッチサイズだが、これは訓練用データ、評価用データの出力データ数に応じて変更すべきであるとされる。ネットワークのノード数については回帰式における変数の数とのアナロジーで考えることができ、問題の規模と比べて数が多いとオーバーフィッティングに陥りやすく、ノード数が少ないと粗い近似しかできないため、accuracyやlossといった近似の精度を示す値が頭打ちになりやすい。今回の場合、実験本番の1回目において5000 stepでaccuracy=0.985, loss=0.047となったことを踏まえて、2回目にはノード数を減らし、そのかわりに6000 stepまで訓練を行って比較検証を行った。


    3.訓練結果の概要

    予備実験、実験本番1回目、2回目それぞれの訓練の結果を、Tensorboardの基本的なスカラー量についてのグラフで示す。オレンジ色のグラフは訓練の経過を、青色のグラフは評価の結果を示している。それぞれの指標の意味については上掲書やWeb上の解説を参照頂きたく、ここでの説明は割愛する。

    (A)予備実験(~4500 step ~7000 step)












    (B-1)実験本番第1回目(~6000 step)












    (B-2)実験本番第2回目(~3000 step ~5000 step ~6000 step)












    4.本学習予備実験の経過を収めたアーカイブファイルについて

    本学習予備実験の経過を収めたアーカイブファイルをGoogleドライブで公開中で、以下のURLから取得可能である。

    内容は以下の通りである。

    ①polyphony-m3_6_1-48-4500

    • m3_6-1-48-4500.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(4500 stepまで)
    • test/ :学習用に前処理を行ったMIDIファイルのフォルダ
    • noteseq/:NoteSequenceファイル(notesequences.tfrecord)のフォルダ
    • sequence_examples/:訓練データ(training_poly_tracks.tfrecord)および評価用データ(eval_poly_tracks.tfrecord)のフォルダ
    • logdir/run1/train/:訓練の経過ログが格納されているフォルダ
    • primer/:楽曲生成のキューとなるprimerファイルのフォルダ
    • generated/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_1/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_2/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • polyphony_rnn.mag:訓練済モデルのdumpファイル
    • *.jpg:訓練経過の評価のための各種スカラー値をTensorboardでグラフ化したもの(4500 stepまで)。それぞれの意味については上掲書やWebでの説明を参照されたい。
      • accuracy-4500
      • batch-4500
      • event_accuracy-4500
      • global_step-4500
      • input_producer-4500
      • loss-4500
      • loss_per_step-4500
      • no_event_accuracy-4500
      • perplexity-4500
      • perplexity_per_step-4500
    ②polyphony-m3_6_1-48-7000
    • m3_6-1-48-4500.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(4500 stepまで)
    • m3_6-1-48-7000.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(7000 stepまで)
    • test/ :学習用に前処理を行ったMIDIファイルのフォルダ
    • noteseq/:NoteSequenceファイル(notesequences.tfrecord)のフォルダ
    • sequence_examples/:訓練データ(training_poly_tracks.tfrecord)および評価用データ(eval_poly_tracks.tfrecord)のフォルダ
    • logdir/run1/train/:訓練の経過ログが格納されているフォルダ
    • primer/:楽曲生成のキューとなるprimerファイルのフォルダ
    • generated/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ(7000 step時点の訓練結果による)
    • generated_1/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ(7000 step時点の訓練結果による)
    • generated_2/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ(7000 step時点の訓練結果による)
    • generated-4500/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ(4500 step時点の訓練結果による)
    • generated_1-4500/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ(4500 step時点の訓練結果による)
    • generated_2-4500/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ(4500 step時点の訓練結果による)
    • polyphony_rnn.mag:訓練済モデルのdumpファイル(7000 stepまで)
    • polyphony_rnn-4500.mag:訓練済モデルのdumpファイル(4500 stepまで)
    • *.jpg:訓練経過の評価のための各種スカラー値をTensorboardでグラフ化したもの(7000 stepまで)。それぞれの意味については上掲書やWebでの説明を参照されたい。
      • accuracy-7000
      • batch-7000
      • event_accuracy-7000
      • global_step-7000
      • input_producer-7000
      • loss-7000
      • loss_per_step-7000
      • no_event_accuracy-7000
      • perplexity-7000
      • perplexity_per_step-7000
    ③polyphony-m3_6_extracted-3-32-256
    • program_merged_36_extracted2.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(5000 stepまで)
    • test/ :学習用に前処理を行ったMIDIファイルのフォルダ
    • noteseq/:NoteSequenceファイル(notesequences.tfrecord)のフォルダ
    • sequence_examples/:訓練データ(training_poly_tracks.tfrecord)および評価用データ(eval_poly_tracks.tfrecord)のフォルダ
    • logdir/run1/train/:訓練の経過ログが格納されているフォルダ
    • primer/:楽曲生成のキューとなるprimerファイルのフォルダ
    • generated/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_1/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_2/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • polyphony_rnn.mag:訓練済モデルのdumpファイル(5000 stepまで)
    • *.jpg:訓練経過の評価のための各種スカラー値をTensorboardでグラフ化したもの(5000 stepまで)。それぞれの意味については上掲書やWebでの説明を参照されたい。
      • accuracy
      • batch
      • event_accuracy
      • global_step
      • input_producer
      • loss
      • loss_per_step
      • no_event_accuracy
      • perplexity
      • perplexity_per_step
    ④polyphony-m3_6_extracted-3-32-192-3000
    • program_merged_36_extracted2-192-3000.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(3000 stepまで)
    • test/ :学習用に前処理を行ったMIDIファイルのフォルダ
    • noteseq/:NoteSequenceファイル(notesequences.tfrecord)のフォルダ
    • sequence_examples/:訓練データ(training_poly_tracks.tfrecord)および評価用データ(eval_poly_tracks.tfrecord)のフォルダ
    • logdir/run1/train/:訓練の経過ログが格納されているフォルダ
    • primer/:楽曲生成のキューとなるprimerファイルのフォルダ
    • generated/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_1/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_2/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • polyphony_rnn.mag:訓練済モデルのdumpファイル(3000 stepまで)
    • *.jpg:訓練経過の評価のための各種スカラー値をTensorboardでグラフ化したもの(3000 stepまで)。それぞれの意味については上掲書やWebでの説明を参照されたい。
      • accuracy-3000
      • batch-3000
      • event_accuracy-3000
      • global_step-3000
      • input_producer-3000
      • loss-3000
      • loss_per_step-3000
      • no_event_accuracy-3000
      • perplexity-3000
      • perplexity_per_step-3000
    ⑤polyphony-m3_6_extracted-3-32-192-5000
    • program_merged_36_extracted2-192-5000.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(5000 stepまで)
    • test/ :学習用に前処理を行ったMIDIファイルのフォルダ
    • noteseq/:NoteSequenceファイル(notesequences.tfrecord)のフォルダ
    • sequence_examples/:訓練データ(training_poly_tracks.tfrecord)および評価用データ(eval_poly_tracks.tfrecord)のフォルダ
    • logdir/run1/train/:訓練の経過ログが格納されているフォルダ
    • primer/:楽曲生成のキューとなるprimerファイルのフォルダ
    • generated/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_1/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_2/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • polyphony_rnn.mag:訓練済モデルのdumpファイル(5000 stepまで)
    • *.jpg:訓練経過の評価のための各種スカラー値をTensorboardでグラフ化したもの(5000 stepまで)。それぞれの意味については上掲書やWebでの説明を参照されたい。
      • accuracy-5000
      • batch-5000
      • event_accuracy-5000
      • global_step-5000
      • input_producer-5000
      • loss-5000
      • loss_per_step-5000
      • no_event_accuracy-5000
      • perplexity-5000
      • perplexity_per_step-5000
    ⑥polyphony-m3_6_extracted-3-32-192-6000
    • program_merged_36_extracted2-192-6000.txt:訓練用ファイル・評価用ファイル生成から訓練済モデルによる楽曲生成実験までの実行ログ(6000 stepまで)
    • test/ :学習用に前処理を行ったMIDIファイルのフォルダ
    • noteseq/:NoteSequenceファイル(notesequences.tfrecord)のフォルダ
    • sequence_examples/:訓練データ(training_poly_tracks.tfrecord)および評価用データ(eval_poly_tracks.tfrecord)のフォルダ
    • logdir/run1/train/:訓練の経過ログが格納されているフォルダ
    • primer/:楽曲生成のキューとなるprimerファイルのフォルダ
    • generated/:m3_6_0_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_1/:m3_6_1_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • generated_2/:m3_6_2_primer.MIDをprimerとした楽曲の生成結果(10ファイル)が格納されているフォルダ
    • polyphony_rnn.mag:訓練済モデルのdumpファイル(6000 stepまで)
    • *.jpg:訓練経過の評価のための各種スカラー値をTensorboardでグラフ化したもの(6000 stepまで)。それぞれの意味については上掲書やWebでの説明を参照されたい。
      • accuracy-6000
      • batch-6000
      • event_accuracy-6000
      • global_step-6000
      • input_producer-6000
      • loss-6000
      • loss_per_step-6000
      • no_event_accuracy-6000
      • perplexity-6000
      • perplexity_per_step-6000

    *    *    *

    [ご利用にあたっての注意] 公開するデータは自由に利用頂いて構いません。あくまでも実験的な試みを公開するものであり、作成者は結果の正しさは保証しません。このデータを用いることによって発生する如何なるトラブルに対しても、作成者は責任を負いません。作成者自身の無理解や実施時の不注意による間違いの可能性は勿論ですが、それ以外にも入力として利用させて頂いたMIDIファイルに起因する間違い、分析プログラムの不具合に起因する間違いなど、各種の間違いが含まれる可能性があることをご了承の上、ご利用ください。

    (2022.7.7 公開, 2022.10.10 実験対象の一つとして利用させて頂いているMIDIファイルの提供元である加藤隆太郎さんの「マーラー交響曲 MIDI 全集」のURLに関する情報を最新のものに更新。 Google MagentaのColaboratory環境での利用可否についての記載も更新。2023.3.10「はじめに」を序文として独立の別記事に)

    Google Magenta の Polyphony RNN モデルを用いたマーラーの作品の学習実験ノート・序文(2022.7.7 公開, 7.10, 11.12更新, 2023.3.9-10追記)

     はじめに

     マーラーの作品を素材とした人工知能による模倣の実験を行った結果を以下で報告する。より具体的に言えば、以下で報告するのは第3交響曲第6楽章を入力とし、Google Magentaで用意されているモデルの一つであるPolyphony RNNモデルを用いた実験の結果である。まず実験に至るまでの経緯に触れながら、なぜGoogle MagentaのPolyphony RNNモデルを使ったのか、なぜ第3交響曲第6楽章が選択されたのかについて説明することを通じて、この実験を実施するにあたって考えたことや、実験結果を公開することにした目的について記載したい。なお本稿では、音楽の機械学習全般やMagentaに関する説明は次節で紹介する書籍やWebで入手できる情報に譲ることとして説明を割愛し、その書籍に記載されている内容程度の予備知識があることを前提とし、実験の背景や狙い、実験を行った環境および結果について記載することとさせて頂く。なお、序文の長さがかなりのものになったことから、本文から分離して別記事として公開することにしたので、背景や狙いはおいて、実験環境や結果のみに関心のある方は、直接本文を参照されたい。)

     まず記事タイトルで「学習実験」と言っておきながら、冒頭「模倣の実験」という言い方をした点についてお断りしておく。というからにはそれはうっかりミスでもなければ、言葉遣いの極端なルーズさに起因するものでもなく、意図的な選択の結果である。Google Magentaは、深層学習と呼ばれる一連の技術的なブレイクスルーによって近年脚光を浴びている人工知能技術の一つである機械学習を用いた自動作曲のための環境として知られている。コンピュータによる自動作曲は人工知能の黎明期からの典型的なタスクの一つであるが、そのために用いられる技術は多様で、個別の技術要素のみを取り出してしまえば今日の「人工知能」のイメージからは遠い手法が用いられる場合も少なくないが、ここでは環境としてGoogle Magentaを用いていること、素材としてマーラーの作品を用いていること、ある目的のためのツールを他の目的に転用するといったレベルでの転用をしているわけではなく、Google Magentaでのごく一般的な自動作曲の手順に従って、訓練のための前準備から訓練した結果を用いた楽曲生成までを行っていることから、一先ずはここでやったことを「学習」の実験と呼ぶのが自然であるのがタイトルで「学習実験」と形容した理由である。他方で本文冒頭で「学習」とは言わず「模倣」と言ったのは、実施した実験の諸条件が、ここで特に実験結果を公開するその最後の段階の幾つかに限らず、予備的で試行錯誤的な段階を含めた総体としてみた場合でも、通常Google Magentaを用いて行う自動作曲の典型からの逸脱を含んでおり、その点を配慮した場合にはこれを「学習」と呼ぶことは不適切であり、寧ろ「模倣」と呼ぶべきであるということが理由である。最も多様な素材を入力とした場合でもその範囲がマーラーの作品に限定されているということ、なおかつここで用いられる学習のメカニズム、つまりLSTM(Long Short Term Memory)という人工ニューラルネットワークの振る舞いを踏まえ、更には実際に実験の生成結果を確認した限り、ここでやっていることは寧ろ「模倣」と呼ぶのが適切であると考えた結果なのである。

     とはいえそうした区別は文脈に出来るだけ依存しない厳密な定義を追求した結果というわけでもない。例えば古典派なりロマン派の作品をかき集めて入力して、ありえたかもしれない古典派作品ないしロマン派作品を自動生成する試みは機械学習のタスクとしてはごくありふれた典型的な設定だろう。そしてその場合に訓練時に与えるサンプル数は少なめに見ても数百・数千程度であることが実は暗黙の前提となっている。更に言えば、そうしたサンプルの集合が理想的には或る特定の統計分布に従っていることが学習が成功するための理論上の前提とされており、サンプルがある仕方で分布する抽象的な空間の中で、サンプル点そのものではなく、その近傍にある点を生成するというのが学習に基づく自動作曲の実質だが、それを可能にするためには一定量のサンプルが欠かせないし、そのサンプルの集合の統計的な性質がどんなものあっても良いというわけではなく、学習メカニズムが前提としている分布に近いものであればあるほど良好な結果が得られる可能性が高い。一方で、現実にはよくあるケースだが、様々な理由から利用できるサンプル数が少ない場合に、サンプルに基づいて訓練データの「水増し」を行う手法も提案されているが、それが正当化できるのもサンプルの集団の持つ統計的な分布が一定の性質を持っていることが前提となる。そうしたことを踏まえた時に、「マーラーの作品の学習実験」という設定がそもそも「学習」のタスクとしてどういった位置づけになるのかを考えてみる必要が出てくることになる。

     ここで具体的に、或る特定の作曲家の作品を入力として、その作曲家が書いたかもしれない架空の作品を自動作曲する場合を考えると、例えばそれがバッハやモーツァルトのように数百から千を超える数の膨大な作品が遺され、かつその作品の様式が或る程度の多様性はあるにしても程々に安定している場合には、時代様式を対象とした学習の場合とほぼ同様に考えることができるだろう。だがマーラーの場合は良く知られているように、まず遺された作品数が少なく、多楽章形式の作品について楽章毎に1とカウントしてもその総数は3桁に満たないレベルである。更に言えば、特に交響曲楽章には長大なものが含まれ、その内部の構造も錯綜を極めるため、内部構造に従って分割をしたものをサンプルとして与えることで或る程度の「水増し」が出来たとしても、今度はその個々のサンプルのもつ性質の多様性が「学習」を困難にする。加えて現実的なニューラルネットのサイズや計算リソースの制限もあって、優れた結果を数多く出しているとされるGoogle Magentaにおいても、生成される「楽曲」のサイズとして標準的に想定されている規模は、マーラーの作品であれば「断片」レベルのものに過ぎないし、いわゆる楽式レベルの巨視的な構造をMagentaに事前に用意されたモデルに「学習」させることは、仮にそれが理論上は可能であったとしても、現実に私が利用可能なリソースを考えてしまえば実現不可能な企てに見える。

     予め人間が学習すべき特徴を分析し、それに基づいてネットワークの構造と規模を設定し、入力データを前処理して学習を行うという従来のやり方ではなく、特徴の空間の獲得そのものを機械にやらせるという点が深層学習のブレイクスルーの一つであるとされるが、実際にそれが実現されたのは画像のような静的なデータを対象とするCNN (Convolutional Neural Network)のようなケースであって、音楽作品のような時系列データは、そもそも学習のために用いられるネットワークのモデルが異なる。ここでの技術的な進展は、従来はネットワークのノード間を伝播する信号が急激に減衰したり増幅したりするために困難であった長い系列のデータの学習や、系列中の隔たった時点の間に存在する構造を捉えることを可能にするメカニズムの追加である。古典的な時系列データ用のネットワークはRNN (Recurrent Neural Network)と呼ばれるフィードバック機能を実現する回帰構造を備えたネットワークだが、そこに幾つか制御を行うユニットを付け加えたのが技術的な進展の実質である。更にいわゆる古典的な時系列分析の対象は一次元の時系列データであるのに対して、(特に西欧の)音楽作品ではある時点で複数の音が鳴ることが普通であり、水平的な次元だけでなく垂直的な次元の考慮も必要であるが故に、更に問題の難易度が上がって複雑なモデルと膨大なリソースが要求されるという点も指摘できるだろう。

     こうしたことを踏まえて、様々な試行錯誤の結果ここで最終的に選択された方向性は、「学習」が備えているべき「汎化」能力の獲得は一先ず目指さず、様式的に或る程度均質なサンプルを用意して、それを用いてモデルを訓練し、サンプルの一部をキューとして与えた時にサンプルとよく似たフラグメントが生成できるかどうかを確認するというものになった。そしてその結果として、ここで報告する実験の実質を「マーラーの作品を素材とした人工知能による模倣の実験」と規定するのが適切に思われたのである。こうした点をこのように長々と注記するのは、それ自体は参考になり、今回の実験を準備したり進めたりするにあたっても少なからぬ恩恵を被っている、Web上で読むことができるGoogle Magentaを実際に動かしてみた経緯を報告してくださっている記事の多くにおいて、こうした点についての考慮がなされておらず、「環境構築して、データを食わせて訓練させることができた。訓練したモデルで楽曲を生成したらこんな感じだった」といった内容の報告がなされることが多いように見受けられることへの反応といった側面がある。結局のところそれは、生成した出力を評価しているとはいえ、あくまでのその重点はツールとしての評価にあって、そのツールを使って行ったコンテンツの方はあくまでもサンプルといった捉え方をされていて、だからそれは機械学習ライブラリの評価であって、或るデータを或る目的で機械学習を行った実験そのものの評価ではないのだ。それこそがまさに「工学」であるからには仕方ないこととはいえ、結果として「人工知能」を使った「学習」の肝心の「内容」が論じられることが極めて稀であることへの違和感を感じることは避け難い。他方で「内容」の方にフォーカスがあたった場合、―別の記事で取り上げた、デイヴィッド・コープの一連の実験がそうであったように―今度は出力結果が「似ているか」どうかが専ら議論されることが専らのようだが、そうであればそれは、汎化能力を持っている場合でさえ具体的な特定作品の模倣ではないだけで様式の模倣には違いなく、それならば端的に「模倣」と言えば良いということになる。

     だがそれは単なる言い方の問題に留まらない。マーラーのような過去の作曲家の場合、未知の作品が新たに「発見」される可能性が全くないとは言えないものの、その作品リストは確定しており、既に閉じていると見做される(時代を遡って、例えばペルゴレージの場合のような大量の偽作の存在により、真正な作品のリストが確定しない場合もあるが、マーラーについては該当しない)。そうした有限の作品を入力とした「学習」を行ったモデルの汎化能力は、どのような尺度で測られるのだろうか?通常の「学習」の場合には、サンプルのうちの一部を訓練データとし、それ以外を評価データとして、訓練データには含まれないサンプルを精度良く推定できるかどうかによって測定することになっているし、そうした検証を経たモデルは、実際に新たなサンプルが追加された場合の予測にもちいられることになるのであって、閉じていない。勿論、マーラーの作品の場合でも、或いは今回のように、そのうちのある楽章のみをサンプルとした場合にも、実際に実験でそうしたように一部の作品、あるいは楽章内のある部分を訓練データとし、それ以外を評価データとして評価すれば良さそうに見える。だが形式的には成り立ちそうに見えるアナロジーは、具体的なマーラーの作品に即して考えた途端に危ういものに感じられてくるように思われるのだ。マーラーの作品のある部分を用いた訓練の結果で、それ以外の部分を生成できるというのは、偶々後者が前者の再現であったり変奏であったりする場合(実は、今回の実験はまさにこの場合に該当するようにデザインされたのだが)を除けば、そもそもナンセンスではなかろうか?繰り返しを厭わずに言えば、バロック期や古典期の多くの作曲家、ロマン派以降でも自分の過去の作品をそのまま転用したり、若干の焼き直しをした上で別の作品を作りだすような自己模倣的な作曲法をとるような場合であればそれも可能かも知れない。だが、ことマーラーの場合についてはうまく行かないのではないか。これは何も機械学習の実験の素材としての仮定の話ではなく、現実の問題でもある。マーラーの場合なら未完成の第10交響曲の補筆完成を考えてみればよい。その補筆がマーラーのそれ以外の作品を入力とした「学習」によって可能であるというようには誰も思わないだろう(カーペンターによる補作のように過去の作品の「引用」を散りばめるのはまた別の話だが、カーペンターのそうしたやり方がマーラー「らしい」かどうかについて疑念を持つ人は少なくないだろう)。第10交響曲については、それがマーラーの最後の作品であり、(ありうべき)未来を推定することの困難が原因だというのであれば、初期のピアノ四重奏曲の補作はどうだろうか?そこではシューベルトの「未完成」交響曲のように完成したソナタ楽章とともにスケルツォ楽章の断片が残っていて、24小節からなるその断片に基づきシュニトケがその楽章を「完成」させたことは、その断片を自作の交響曲第5番=合奏協奏曲第4番の第2楽章に「引用」していること同様、良く知られていることだろう。或いはマーラーの場合には他には思い当たらないが、一時期脚光を浴びた「交響的前奏曲」のような存疑作(私個人としては、これをマーラーの作品とは見做しておらず、作品リストにも含めていないが)を思い起こしてみれば良い。通常の問題設定では違和感を感じない「学習」という言葉が、マーラーの作品という個別の場合に限って言えば、さまざまな違和感を呼び起こすように私には感じられる。結局のところ、それにはマーラーの作品によって構成される抽象的な特徴空間の性質が関わっているのであろう。それは知る限り未だかつて定量的測度を備えた仕方で定義されたことはないが、定性的で極めてラフな仕方でならば、既にアドルノのマーラーモノグラフの中で、しかも興味深いことには1つならず2つまでも、しかもいずれもマーラーの同時代の証言の伝聞とともに書き留められていると私には思われる。即ちその一つ目は「III.音調」の章において、シェーンベルクの証言として、マーラーの存命中に「ある著名な批評家が彼の交響曲を「巨大な交響的寄せ集めメドレー(ポプリ)」にすぎない、と非難した」(龍村訳のp.48の最初のパラグラフ)との伝聞であり、もう一つは「IV.小説」の章においてグィド・アドラーの言葉として引用されている「いまだ誰も、たとえ敵対者でさえも、マーラーを聴いて退屈したことはない」(龍村訳のp.83の冒頭)という指摘である。後者の参照の直前でアドルノ自身は「小説と同様、彼の交響曲の一つ一つが、特殊なものという期待を贈り物として呼び覚ます」(同訳書p.82~3)と述べているが、そうした性質を持つマーラーの作品の集合が統計的な扱いに対して抵抗を示すであろうことは、ここで報告する実験をした経験の中で得られた感覚と一致する。のみならず、以前に実施して別の記事で報告した和音の出現頻度をはじめとしたマーラーの作品の幾つかの特徴量についての集計・分析での感覚とも一致する。であるとするならば、それを感覚などと言っていないで、それらの関連の具体的な様相を調べるべきだろうが、これは後日の課題としたい。

     更にこれは、全くの個人的な文脈での偶然に過ぎないが、テンプル・グランディンの『自閉症の脳を読み解く』(中尾ゆかり訳、NHK出版、2014)の中で、自閉症の人の視覚についての研究の結論を参照しつつ、自閉症スペクトラム障碍のデータのエラーバーの大きさについてコメントしている箇所(上掲書, p.153)のことを思い浮かべた。そこでグランディンは自閉症に関する調査についてまわる困難として、調査対象の中に大きな差異が含まれていること、だがそれは研究における問題設定の仕方の問題であること、その故に、サブグループを見つけて分ける必要性を述べているが、マーラーの作品についても同じことが言えるのではないかというように感じたのである。その意味でマーラーの作品は、人間が産み出したものよりも寧ろ、人間自身に近い性質を持っているのではないか、更にそれはアドルノの言う「特殊なもの」に通じ、そのことは「小説」や「物語」の主人公である自己意識を備えた自伝的自己に対応した構造をマーラーの作品が備えているということに帰着するという道筋が思い浮かぶ。そしてこのことはマーラーの音楽が、このブログにおいて永らく構想してきた「意識の音楽」であるという主張そのものに他ならない。だがこの点は本稿の目的である実験の報告とは最早別のテーマであり、この点を更に展開して構想の肉付けをすることは、後日の課題としてここでは一旦打ち切らざるを得ない。

     更に言えば「学習」を「模倣」に置き換えたところで、実はこの問題の或る側面については解決は望めそうにない。有限で列挙可能な「マーラーの作品」が存在していて、恐らくマーラーの場合に限れば、未知の真作が発掘される可能性はほとんどないというところに、既知の「マーラーの作品」には含まれない「マーラー風」を自称する作品が出てきたとき(これもまた仮定の話ではなく、デイヴィッド・コープの事例のように現実の問題なのだが)、一体その「模倣」の出来を評価する尺度はどのようにして構成できるだろうか?実際、世上「マーラー風」と形容される作品は少なからずあるようだが、そもそも「マーラー風」「マーラー的」という形容は、マーラーの作品の或る一面と共通性を持つという意味合いで用いられることが一般的であって、それはここで報告する実験の水準で当否を扱うことができるものではないだろう。他方で「…風に(à la manière de ...)」という、パロディであることを明示したジャンルが存在するが、そこでは特定の作曲家の様式は或る種の「記号」としてメタレベルで機能しているのであって、それもまたここで報告する機械学習における「模倣」とは異なった水準のものであろう(それが「パロディ」として成立するには、所謂「贋作」とは異なった何かがそこになくてはらないが、機械学習における「模倣」は寧ろ「贋作」に近く、例えば「アルビノーニのアダージョ」と称する模作に類似すると考えられる)。後述の実験についての具体的な記述において明らかになることだが、寧ろここで「模倣」と呼んだものの実質は、時系列データとしての音楽作品の一部を「記憶」しそれを与えられたキューに基づき「想起」することに近いのではなかろうか。それは記録媒体に「記録」したものを「再生」することは異なるメカニズムに基づいており、変形や欠落を生じる可能性の一方で、「学習」における「汎化」とは異なったレベル(但し、このレベルの近いは、それを実現するメカニズムの違いを意味しない。メカニズムは同一であっても構わない。)でエラーに対する補完を可能にする頑健性を有することで「模倣」を実現しているという言い方が可能だろう。

     ちなみに上記の「記録」の「再生」と「記憶」の「想起」の差異は、機械が「知的」であるための条件としてアラン・チューリングが示した可謬性に関わっていて、適応的な機械が「正しい」かどうかの判定基準は文脈依存で客観的には決まらず、必ずどういうサンプルを与え何に適応させたかを基準に測るしかないというところから、知的であることの判断基準は結局人間の側にしかないという認識に繋がっており、結果としてここでの「学習」の成功の度合いや「模倣」の出来を評価する尺度に対する答えの枠組みとなる。チューリングはここからチューリング・テストに至ったわけだが、そのことが「学習」の成功度合いや「模倣」の出来は生成された音を人間が聴いて主観的・感覚的に評価するしかないという結論に繋がるわけではないことに注意すべきだろう。そうではなくて、何のために「学習」なり「模倣」なりをするのかという目的、実験自体が置かれた文脈抜きに測度を構成できないということであって、「学習」なり「模倣」なりを自己目的化した実験は、実はおのれの抽象性故に評価の基盤を自ら破壊してしまっていることに気付くべきなのだ、ということに他ならない。

     自分が開発したソフトウェアが生成した音楽の評価に対するデイヴィッド・コープの不満は、それ故二重に不当なものに見えてしまう。まずそれは自分の実験の枠組みの、上述の意味合いでの救い難い抽象性を棚に上げて、自分で破壊した評価基準の不在を評価者に不当に押し付けているに過ぎないし、次に自分が開発したソフトウェアが生成した音楽のみを聴かせて、どういうサンプルを与え何に適応させたかを示すことなく評価を求めるという姿勢の不当さを棚に上げて評価者の反応を批判するのも責任転嫁であると言わざるを得ない。以下にも述べるように、この実験結果を公開することを決断した背景の一つは、まさにデイヴィッド・コープが自分が開発したソフトウェアが生成した「マーラー風」の作品を少なからず発表していることを知ったからなのだが、私の公開の目的は、コープの「マーラー風」作品との結果との「優劣」の比較ではなく(工学的な評価としては、コープの業績に異を唱える人はいないだろうし、情報工学者であると同時に作曲家でもあるコープの業績に対して私のようなアマチュアが付け焼刃の俄か実験をもって何かを言う事自体、こちらはこちらで不当で、身の程をわきまえない暴挙であろう)、寧ろコープがマーラーを素材にしてやったことの「全体」に対する疑問の表明にあり、謂わば「メタ批判」であることをここで明記しておきたい。

     最後に今度はマーラーの側からではなく、機械学習の側からの釈明をさせて頂くならば、端的に実験結果のみを知りたい方にとっては煩わしいだけかも知れず、その場合には本稿末尾の実験結果の紹介までスキップして頂いて構わないが、まずもって機械学習を専門とする研究者でもなく、マーラーの音楽を研究対象とする音楽学者でもない、単なるマーラー音楽のアマチュアが、ごく表面的にGoogle Magentaを試したという前提抜きで実験結果として生成された音響のみを評価されてしまうと、色々な意味でミスリーディングであるという懸念がある。最も端的には、ここで報告する実験の生成結果自体は「出来の良い」ものではなく、だがそれはGoogle Magentaに代表される人工知能の技術的限界を示すものではなく、多くは更に改善の余地があるに違いない。ではなぜそのような箸にも棒にもかからないレベルものを敢えて公表するのかについては、ここまでお読み頂いた方に対しては既に十分にお答えしたつもりでいる。釈明の必要性自体、結局のところ背景と目的の説明は欠かせないということでご了承頂く他ないと考えるが、一つだけ記しておきたいのは、MIDIファイルを解析するプログラムの自作(C言語を用いて行った)から始まって、一通りハンドメイドでMIDIファイルを用いた和音の出現頻度などの集計・分析の仕組み(主としてExcelとS言語を用いて行った)を作るきっかけは、着手時点では先行事例を知らなかったから、知りたいと思えば自分でやってみるしかなかったからであり、だがその後、作業を進めていくうちに、類似の研究があることは確認できたものの、ことマーラーの作品を対象にしたものとなると、現時点でも確認できていないのと同様、ここで報告するような実験の報告のようなものを目にしたことがないということである。勿論、マーラーの作品の人工知能による模倣は既に行われて結果も示されているし、この手の話には格好の題材であろう第10交響曲の補筆完成版の作成を人工知能で行った結果が披露されたという報せを知らないわけではないことは、既に本ブログの過去の記事「デイヴィッド・コープのEMI(Experiments in Musical Intelligence)によるマーラー作品の模倣についての覚え書」でも報告している通りだが、そこで私が個人的に不満なのは、既に述べた通り、人工知能が「創作」したとされる「結果」のみが示され、それがマーラーの音楽に「似ているかどうか」のみが論じられるという点である。そこでここでは、どのようなことを考え、どのような準備をして、どのような条件を設定して、どのようなプロセスで処理がなされた結果、どのような結果が得られたかの詳細についてここまで報告することもまた、実験結果自体と同様に意義があると考えていることをお断りして、背景についての説明を終えることにする。

     なお、上述の背景の説明から、マーラーの作品の「模倣」の実験は可能だが、「学習」の実験は意味がないと考えていると受け止められてしまうかも知れないが、実際にはそういうことではないことを最後にお断りしておきたい。機械学習の対象として捉えた場合にマーラー固有の問題として思いつくのは、作品数が少なく、しかも様式的に多様で、作品・楽章間での多様性が大きいということだろうか。例えばバロック期や古典期の作曲家や、近年ではポピュラー音楽におけるようにある程度決まったパターンに基づき、消費のニーズに応じるべく大量に作品を「生産」「製造」するようなケースと比べれば、「マーラーの場合」が機械学習に馴染まないのは直観的には明らかなことだろう。作品の完成度に拘るスタイリッシュな寡作家というわけではなく、単純にシーズン中は歌劇場監督としての職務の多忙から、パートタイムの「夏の作曲家」たることを余儀なくされたという事情(それゆえ彼の作曲活動は、楽長の道楽として揶揄されさえした)に由来する作品数の少なさのみならず、アドルノが「マーラーがいつもどのように作曲するかは、伝来の秩序の原則にではなく、その曲独自の音楽内容と全体構想とに従っている。」(アドルノ, 『マーラー 音楽観相学』, 龍村あや子訳, 法政大学出版局, 1999, p.56)と言う「唯名論的」(同書, p.83)な傾向を踏まえ、「作品のいずれもが以前に書かれた作品を批判しているということにより、マーラーはまさに発展する作曲家となっている。言うならば、彼の量的には決して多くない作品にこそ、進歩ということを語ることができる。」(同書, p.111)というアドルノの見解を受け入れるならば、「マーラーの場合」の特徴は、そもそも統計的な処理に馴染まない性質のものでさえありうる。

     だがそれでもなお、そうした傾向が結果としてミクロな系列が持つ特徴となり、その特徴を検出し、学習することでマーラーの独自性、「マーラーらしさ」を言い当てることが可能かも知れない。数は少ないとはいうものの、マーラーの作品全体の量を、例えば小節数や演奏時間という尺度で捉えたならば、統計的な学習を行うに十分な分量であるという見方も可能だろう。(単純な比較ができないことは断った上で、例えばGoogle MagentaのPolyphony RNNモデルのモデルケースであったバッハのコラールへの和声付けに基づく学習に用いられるサンプルの規模と比べて、量的に少ないということはないだろう。)既に別のところでは、いわゆる「スモールデータ」でも適用可能な分析ということで主成分分析等のような手法を用いて、和音の出現頻度という、ごく表層的なテクスチュアに関する特徴量だけからではあるが、マーラーと他の作曲家の作品の比較やマーラーの交響曲作品の間の比較を試みた結果を別の記事で公開している(その概要については、記事「MIDIファイルを入力とした分析:データから見たマーラーの作品 これまでの作業の時系列に沿った概観」を、その結果の要約については記事「MIDIファイルを入力とした分析:データから見たマーラーの作品 和声出現頻度の分析のまとめ」を参照)が、そこから更に、そもそもアドルノの上記の主張の裏付けとなる結果をデータ分析から得られないかというアプローチも考えられるだろうし、そこから更に踏み込んで、特にその後期作品について、ベルクやベッカーの言葉を踏まえてアドルノが「(…)マーラーだけに、アルバン・ベルクの言葉によれば、作曲家の威厳の高さを決定するところのあの最高の品位の後期様式というものが与えられる。すでにベッカーは、五十歳を過ぎたばかりのこの作曲家の最後の諸作品がすぐれた意味での後期作品である、ということを見逃さなかった。そこでは非官能的な内面のものが外へと表出されているというのだ。」(p.112)と述べている点について、それに対応する何らかの特徴量を検出できないかという問題設定を行うことで、マーラーの音楽における「老い」について実証的な仕方で語ることさえ可能かも知れない。

     要するに特定の楽曲、例えばここで取り上げられている交響曲第3番第6楽章の主要部分「っぽい」作品を生成することを目的とした「学習」ということならば、こちらは統計的な「学習」の問題として設定しうるかどうか、そもそも問題の設定の水準において疑問の余地がないとは言えないということなのであって、一般に「学習」の問題が設定できないと言っているわけではない。実際、本稿執筆後、問題設定を変えて、1曲毎の規模が小さい歌曲については、全歌曲を一まとまりとして見て、交響曲については各交響曲毎に、Magentaで用意されたツールを用いて訓練用/評価用データを抽出したらどうなるのか、抽出されたデータを用いて訓練したらどうなるのかという実験は継続して実施しており、その結果については別途公開の予定である。(2022.7.7 公開, 7.16 語句の調整。22.11.12誤字修正および若干の補足を加筆, 2023.3.9-10追記, 独立の記事として本文から独立)