2022年7月7日木曜日

Google Magenta の Polyphony RNN モデルを用いたマーラーの作品の学習実験ノート・序文(2022.7.7 公開, 7.10, 11.12更新, 2023.3.9-10追記)

 はじめに

 マーラーの作品を素材とした人工知能による模倣の実験を行った結果を以下で報告する。より具体的に言えば、以下で報告するのは第3交響曲第6楽章を入力とし、Google Magentaで用意されているモデルの一つであるPolyphony RNNモデルを用いた実験の結果である。まず実験に至るまでの経緯に触れながら、なぜGoogle MagentaのPolyphony RNNモデルを使ったのか、なぜ第3交響曲第6楽章が選択されたのかについて説明することを通じて、この実験を実施するにあたって考えたことや、実験結果を公開することにした目的について記載したい。なお本稿では、音楽の機械学習全般やMagentaに関する説明は次節で紹介する書籍やWebで入手できる情報に譲ることとして説明を割愛し、その書籍に記載されている内容程度の予備知識があることを前提とし、実験の背景や狙い、実験を行った環境および結果について記載することとさせて頂く。なお、序文の長さがかなりのものになったことから、本文から分離して別記事として公開することにしたので、背景や狙いはおいて、実験環境や結果のみに関心のある方は、直接本文を参照されたい。)

 まず記事タイトルで「学習実験」と言っておきながら、冒頭「模倣の実験」という言い方をした点についてお断りしておく。というからにはそれはうっかりミスでもなければ、言葉遣いの極端なルーズさに起因するものでもなく、意図的な選択の結果である。Google Magentaは、深層学習と呼ばれる一連の技術的なブレイクスルーによって近年脚光を浴びている人工知能技術の一つである機械学習を用いた自動作曲のための環境として知られている。コンピュータによる自動作曲は人工知能の黎明期からの典型的なタスクの一つであるが、そのために用いられる技術は多様で、個別の技術要素のみを取り出してしまえば今日の「人工知能」のイメージからは遠い手法が用いられる場合も少なくないが、ここでは環境としてGoogle Magentaを用いていること、素材としてマーラーの作品を用いていること、ある目的のためのツールを他の目的に転用するといったレベルでの転用をしているわけではなく、Google Magentaでのごく一般的な自動作曲の手順に従って、訓練のための前準備から訓練した結果を用いた楽曲生成までを行っていることから、一先ずはここでやったことを「学習」の実験と呼ぶのが自然であるのがタイトルで「学習実験」と形容した理由である。他方で本文冒頭で「学習」とは言わず「模倣」と言ったのは、実施した実験の諸条件が、ここで特に実験結果を公開するその最後の段階の幾つかに限らず、予備的で試行錯誤的な段階を含めた総体としてみた場合でも、通常Google Magentaを用いて行う自動作曲の典型からの逸脱を含んでおり、その点を配慮した場合にはこれを「学習」と呼ぶことは不適切であり、寧ろ「模倣」と呼ぶべきであるということが理由である。最も多様な素材を入力とした場合でもその範囲がマーラーの作品に限定されているということ、なおかつここで用いられる学習のメカニズム、つまりLSTM(Long Short Term Memory)という人工ニューラルネットワークの振る舞いを踏まえ、更には実際に実験の生成結果を確認した限り、ここでやっていることは寧ろ「模倣」と呼ぶのが適切であると考えた結果なのである。

 とはいえそうした区別は文脈に出来るだけ依存しない厳密な定義を追求した結果というわけでもない。例えば古典派なりロマン派の作品をかき集めて入力して、ありえたかもしれない古典派作品ないしロマン派作品を自動生成する試みは機械学習のタスクとしてはごくありふれた典型的な設定だろう。そしてその場合に訓練時に与えるサンプル数は少なめに見ても数百・数千程度であることが実は暗黙の前提となっている。更に言えば、そうしたサンプルの集合が理想的には或る特定の統計分布に従っていることが学習が成功するための理論上の前提とされており、サンプルがある仕方で分布する抽象的な空間の中で、サンプル点そのものではなく、その近傍にある点を生成するというのが学習に基づく自動作曲の実質だが、それを可能にするためには一定量のサンプルが欠かせないし、そのサンプルの集合の統計的な性質がどんなものあっても良いというわけではなく、学習メカニズムが前提としている分布に近いものであればあるほど良好な結果が得られる可能性が高い。一方で、現実にはよくあるケースだが、様々な理由から利用できるサンプル数が少ない場合に、サンプルに基づいて訓練データの「水増し」を行う手法も提案されているが、それが正当化できるのもサンプルの集団の持つ統計的な分布が一定の性質を持っていることが前提となる。そうしたことを踏まえた時に、「マーラーの作品の学習実験」という設定がそもそも「学習」のタスクとしてどういった位置づけになるのかを考えてみる必要が出てくることになる。

 ここで具体的に、或る特定の作曲家の作品を入力として、その作曲家が書いたかもしれない架空の作品を自動作曲する場合を考えると、例えばそれがバッハやモーツァルトのように数百から千を超える数の膨大な作品が遺され、かつその作品の様式が或る程度の多様性はあるにしても程々に安定している場合には、時代様式を対象とした学習の場合とほぼ同様に考えることができるだろう。だがマーラーの場合は良く知られているように、まず遺された作品数が少なく、多楽章形式の作品について楽章毎に1とカウントしてもその総数は3桁に満たないレベルである。更に言えば、特に交響曲楽章には長大なものが含まれ、その内部の構造も錯綜を極めるため、内部構造に従って分割をしたものをサンプルとして与えることで或る程度の「水増し」が出来たとしても、今度はその個々のサンプルのもつ性質の多様性が「学習」を困難にする。加えて現実的なニューラルネットのサイズや計算リソースの制限もあって、優れた結果を数多く出しているとされるGoogle Magentaにおいても、生成される「楽曲」のサイズとして標準的に想定されている規模は、マーラーの作品であれば「断片」レベルのものに過ぎないし、いわゆる楽式レベルの巨視的な構造をMagentaに事前に用意されたモデルに「学習」させることは、仮にそれが理論上は可能であったとしても、現実に私が利用可能なリソースを考えてしまえば実現不可能な企てに見える。

 予め人間が学習すべき特徴を分析し、それに基づいてネットワークの構造と規模を設定し、入力データを前処理して学習を行うという従来のやり方ではなく、特徴の空間の獲得そのものを機械にやらせるという点が深層学習のブレイクスルーの一つであるとされるが、実際にそれが実現されたのは画像のような静的なデータを対象とするCNN (Convolutional Neural Network)のようなケースであって、音楽作品のような時系列データは、そもそも学習のために用いられるネットワークのモデルが異なる。ここでの技術的な進展は、従来はネットワークのノード間を伝播する信号が急激に減衰したり増幅したりするために困難であった長い系列のデータの学習や、系列中の隔たった時点の間に存在する構造を捉えることを可能にするメカニズムの追加である。古典的な時系列データ用のネットワークはRNN (Recurrent Neural Network)と呼ばれるフィードバック機能を実現する回帰構造を備えたネットワークだが、そこに幾つか制御を行うユニットを付け加えたのが技術的な進展の実質である。更にいわゆる古典的な時系列分析の対象は一次元の時系列データであるのに対して、(特に西欧の)音楽作品ではある時点で複数の音が鳴ることが普通であり、水平的な次元だけでなく垂直的な次元の考慮も必要であるが故に、更に問題の難易度が上がって複雑なモデルと膨大なリソースが要求されるという点も指摘できるだろう。

 こうしたことを踏まえて、様々な試行錯誤の結果ここで最終的に選択された方向性は、「学習」が備えているべき「汎化」能力の獲得は一先ず目指さず、様式的に或る程度均質なサンプルを用意して、それを用いてモデルを訓練し、サンプルの一部をキューとして与えた時にサンプルとよく似たフラグメントが生成できるかどうかを確認するというものになった。そしてその結果として、ここで報告する実験の実質を「マーラーの作品を素材とした人工知能による模倣の実験」と規定するのが適切に思われたのである。こうした点をこのように長々と注記するのは、それ自体は参考になり、今回の実験を準備したり進めたりするにあたっても少なからぬ恩恵を被っている、Web上で読むことができるGoogle Magentaを実際に動かしてみた経緯を報告してくださっている記事の多くにおいて、こうした点についての考慮がなされておらず、「環境構築して、データを食わせて訓練させることができた。訓練したモデルで楽曲を生成したらこんな感じだった」といった内容の報告がなされることが多いように見受けられることへの反応といった側面がある。結局のところそれは、生成した出力を評価しているとはいえ、あくまでのその重点はツールとしての評価にあって、そのツールを使って行ったコンテンツの方はあくまでもサンプルといった捉え方をされていて、だからそれは機械学習ライブラリの評価であって、或るデータを或る目的で機械学習を行った実験そのものの評価ではないのだ。それこそがまさに「工学」であるからには仕方ないこととはいえ、結果として「人工知能」を使った「学習」の肝心の「内容」が論じられることが極めて稀であることへの違和感を感じることは避け難い。他方で「内容」の方にフォーカスがあたった場合、―別の記事で取り上げた、デイヴィッド・コープの一連の実験がそうであったように―今度は出力結果が「似ているか」どうかが専ら議論されることが専らのようだが、そうであればそれは、汎化能力を持っている場合でさえ具体的な特定作品の模倣ではないだけで様式の模倣には違いなく、それならば端的に「模倣」と言えば良いということになる。

 だがそれは単なる言い方の問題に留まらない。マーラーのような過去の作曲家の場合、未知の作品が新たに「発見」される可能性が全くないとは言えないものの、その作品リストは確定しており、既に閉じていると見做される(時代を遡って、例えばペルゴレージの場合のような大量の偽作の存在により、真正な作品のリストが確定しない場合もあるが、マーラーについては該当しない)。そうした有限の作品を入力とした「学習」を行ったモデルの汎化能力は、どのような尺度で測られるのだろうか?通常の「学習」の場合には、サンプルのうちの一部を訓練データとし、それ以外を評価データとして、訓練データには含まれないサンプルを精度良く推定できるかどうかによって測定することになっているし、そうした検証を経たモデルは、実際に新たなサンプルが追加された場合の予測にもちいられることになるのであって、閉じていない。勿論、マーラーの作品の場合でも、或いは今回のように、そのうちのある楽章のみをサンプルとした場合にも、実際に実験でそうしたように一部の作品、あるいは楽章内のある部分を訓練データとし、それ以外を評価データとして評価すれば良さそうに見える。だが形式的には成り立ちそうに見えるアナロジーは、具体的なマーラーの作品に即して考えた途端に危ういものに感じられてくるように思われるのだ。マーラーの作品のある部分を用いた訓練の結果で、それ以外の部分を生成できるというのは、偶々後者が前者の再現であったり変奏であったりする場合(実は、今回の実験はまさにこの場合に該当するようにデザインされたのだが)を除けば、そもそもナンセンスではなかろうか?繰り返しを厭わずに言えば、バロック期や古典期の多くの作曲家、ロマン派以降でも自分の過去の作品をそのまま転用したり、若干の焼き直しをした上で別の作品を作りだすような自己模倣的な作曲法をとるような場合であればそれも可能かも知れない。だが、ことマーラーの場合についてはうまく行かないのではないか。これは何も機械学習の実験の素材としての仮定の話ではなく、現実の問題でもある。マーラーの場合なら未完成の第10交響曲の補筆完成を考えてみればよい。その補筆がマーラーのそれ以外の作品を入力とした「学習」によって可能であるというようには誰も思わないだろう(カーペンターによる補作のように過去の作品の「引用」を散りばめるのはまた別の話だが、カーペンターのそうしたやり方がマーラー「らしい」かどうかについて疑念を持つ人は少なくないだろう)。第10交響曲については、それがマーラーの最後の作品であり、(ありうべき)未来を推定することの困難が原因だというのであれば、初期のピアノ四重奏曲の補作はどうだろうか?そこではシューベルトの「未完成」交響曲のように完成したソナタ楽章とともにスケルツォ楽章の断片が残っていて、24小節からなるその断片に基づきシュニトケがその楽章を「完成」させたことは、その断片を自作の交響曲第5番=合奏協奏曲第4番の第2楽章に「引用」していること同様、良く知られていることだろう。或いはマーラーの場合には他には思い当たらないが、一時期脚光を浴びた「交響的前奏曲」のような存疑作(私個人としては、これをマーラーの作品とは見做しておらず、作品リストにも含めていないが)を思い起こしてみれば良い。通常の問題設定では違和感を感じない「学習」という言葉が、マーラーの作品という個別の場合に限って言えば、さまざまな違和感を呼び起こすように私には感じられる。結局のところ、それにはマーラーの作品によって構成される抽象的な特徴空間の性質が関わっているのであろう。それは知る限り未だかつて定量的測度を備えた仕方で定義されたことはないが、定性的で極めてラフな仕方でならば、既にアドルノのマーラーモノグラフの中で、しかも興味深いことには1つならず2つまでも、しかもいずれもマーラーの同時代の証言の伝聞とともに書き留められていると私には思われる。即ちその一つ目は「III.音調」の章において、シェーンベルクの証言として、マーラーの存命中に「ある著名な批評家が彼の交響曲を「巨大な交響的寄せ集めメドレー(ポプリ)」にすぎない、と非難した」(龍村訳のp.48の最初のパラグラフ)との伝聞であり、もう一つは「IV.小説」の章においてグィド・アドラーの言葉として引用されている「いまだ誰も、たとえ敵対者でさえも、マーラーを聴いて退屈したことはない」(龍村訳のp.83の冒頭)という指摘である。後者の参照の直前でアドルノ自身は「小説と同様、彼の交響曲の一つ一つが、特殊なものという期待を贈り物として呼び覚ます」(同訳書p.82~3)と述べているが、そうした性質を持つマーラーの作品の集合が統計的な扱いに対して抵抗を示すであろうことは、ここで報告する実験をした経験の中で得られた感覚と一致する。のみならず、以前に実施して別の記事で報告した和音の出現頻度をはじめとしたマーラーの作品の幾つかの特徴量についての集計・分析での感覚とも一致する。であるとするならば、それを感覚などと言っていないで、それらの関連の具体的な様相を調べるべきだろうが、これは後日の課題としたい。

 更にこれは、全くの個人的な文脈での偶然に過ぎないが、テンプル・グランディンの『自閉症の脳を読み解く』(中尾ゆかり訳、NHK出版、2014)の中で、自閉症の人の視覚についての研究の結論を参照しつつ、自閉症スペクトラム障碍のデータのエラーバーの大きさについてコメントしている箇所(上掲書, p.153)のことを思い浮かべた。そこでグランディンは自閉症に関する調査についてまわる困難として、調査対象の中に大きな差異が含まれていること、だがそれは研究における問題設定の仕方の問題であること、その故に、サブグループを見つけて分ける必要性を述べているが、マーラーの作品についても同じことが言えるのではないかというように感じたのである。その意味でマーラーの作品は、人間が産み出したものよりも寧ろ、人間自身に近い性質を持っているのではないか、更にそれはアドルノの言う「特殊なもの」に通じ、そのことは「小説」や「物語」の主人公である自己意識を備えた自伝的自己に対応した構造をマーラーの作品が備えているということに帰着するという道筋が思い浮かぶ。そしてこのことはマーラーの音楽が、このブログにおいて永らく構想してきた「意識の音楽」であるという主張そのものに他ならない。だがこの点は本稿の目的である実験の報告とは最早別のテーマであり、この点を更に展開して構想の肉付けをすることは、後日の課題としてここでは一旦打ち切らざるを得ない。

 更に言えば「学習」を「模倣」に置き換えたところで、実はこの問題の或る側面については解決は望めそうにない。有限で列挙可能な「マーラーの作品」が存在していて、恐らくマーラーの場合に限れば、未知の真作が発掘される可能性はほとんどないというところに、既知の「マーラーの作品」には含まれない「マーラー風」を自称する作品が出てきたとき(これもまた仮定の話ではなく、デイヴィッド・コープの事例のように現実の問題なのだが)、一体その「模倣」の出来を評価する尺度はどのようにして構成できるだろうか?実際、世上「マーラー風」と形容される作品は少なからずあるようだが、そもそも「マーラー風」「マーラー的」という形容は、マーラーの作品の或る一面と共通性を持つという意味合いで用いられることが一般的であって、それはここで報告する実験の水準で当否を扱うことができるものではないだろう。他方で「…風に(à la manière de ...)」という、パロディであることを明示したジャンルが存在するが、そこでは特定の作曲家の様式は或る種の「記号」としてメタレベルで機能しているのであって、それもまたここで報告する機械学習における「模倣」とは異なった水準のものであろう(それが「パロディ」として成立するには、所謂「贋作」とは異なった何かがそこになくてはらないが、機械学習における「模倣」は寧ろ「贋作」に近く、例えば「アルビノーニのアダージョ」と称する模作に類似すると考えられる)。後述の実験についての具体的な記述において明らかになることだが、寧ろここで「模倣」と呼んだものの実質は、時系列データとしての音楽作品の一部を「記憶」しそれを与えられたキューに基づき「想起」することに近いのではなかろうか。それは記録媒体に「記録」したものを「再生」することは異なるメカニズムに基づいており、変形や欠落を生じる可能性の一方で、「学習」における「汎化」とは異なったレベル(但し、このレベルの近いは、それを実現するメカニズムの違いを意味しない。メカニズムは同一であっても構わない。)でエラーに対する補完を可能にする頑健性を有することで「模倣」を実現しているという言い方が可能だろう。

 ちなみに上記の「記録」の「再生」と「記憶」の「想起」の差異は、機械が「知的」であるための条件としてアラン・チューリングが示した可謬性に関わっていて、適応的な機械が「正しい」かどうかの判定基準は文脈依存で客観的には決まらず、必ずどういうサンプルを与え何に適応させたかを基準に測るしかないというところから、知的であることの判断基準は結局人間の側にしかないという認識に繋がっており、結果としてここでの「学習」の成功の度合いや「模倣」の出来を評価する尺度に対する答えの枠組みとなる。チューリングはここからチューリング・テストに至ったわけだが、そのことが「学習」の成功度合いや「模倣」の出来は生成された音を人間が聴いて主観的・感覚的に評価するしかないという結論に繋がるわけではないことに注意すべきだろう。そうではなくて、何のために「学習」なり「模倣」なりをするのかという目的、実験自体が置かれた文脈抜きに測度を構成できないということであって、「学習」なり「模倣」なりを自己目的化した実験は、実はおのれの抽象性故に評価の基盤を自ら破壊してしまっていることに気付くべきなのだ、ということに他ならない。

 自分が開発したソフトウェアが生成した音楽の評価に対するデイヴィッド・コープの不満は、それ故二重に不当なものに見えてしまう。まずそれは自分の実験の枠組みの、上述の意味合いでの救い難い抽象性を棚に上げて、自分で破壊した評価基準の不在を評価者に不当に押し付けているに過ぎないし、次に自分が開発したソフトウェアが生成した音楽のみを聴かせて、どういうサンプルを与え何に適応させたかを示すことなく評価を求めるという姿勢の不当さを棚に上げて評価者の反応を批判するのも責任転嫁であると言わざるを得ない。以下にも述べるように、この実験結果を公開することを決断した背景の一つは、まさにデイヴィッド・コープが自分が開発したソフトウェアが生成した「マーラー風」の作品を少なからず発表していることを知ったからなのだが、私の公開の目的は、コープの「マーラー風」作品との結果との「優劣」の比較ではなく(工学的な評価としては、コープの業績に異を唱える人はいないだろうし、情報工学者であると同時に作曲家でもあるコープの業績に対して私のようなアマチュアが付け焼刃の俄か実験をもって何かを言う事自体、こちらはこちらで不当で、身の程をわきまえない暴挙であろう)、寧ろコープがマーラーを素材にしてやったことの「全体」に対する疑問の表明にあり、謂わば「メタ批判」であることをここで明記しておきたい。

 最後に今度はマーラーの側からではなく、機械学習の側からの釈明をさせて頂くならば、端的に実験結果のみを知りたい方にとっては煩わしいだけかも知れず、その場合には本稿末尾の実験結果の紹介までスキップして頂いて構わないが、まずもって機械学習を専門とする研究者でもなく、マーラーの音楽を研究対象とする音楽学者でもない、単なるマーラー音楽のアマチュアが、ごく表面的にGoogle Magentaを試したという前提抜きで実験結果として生成された音響のみを評価されてしまうと、色々な意味でミスリーディングであるという懸念がある。最も端的には、ここで報告する実験の生成結果自体は「出来の良い」ものではなく、だがそれはGoogle Magentaに代表される人工知能の技術的限界を示すものではなく、多くは更に改善の余地があるに違いない。ではなぜそのような箸にも棒にもかからないレベルものを敢えて公表するのかについては、ここまでお読み頂いた方に対しては既に十分にお答えしたつもりでいる。釈明の必要性自体、結局のところ背景と目的の説明は欠かせないということでご了承頂く他ないと考えるが、一つだけ記しておきたいのは、MIDIファイルを解析するプログラムの自作(C言語を用いて行った)から始まって、一通りハンドメイドでMIDIファイルを用いた和音の出現頻度などの集計・分析の仕組み(主としてExcelとS言語を用いて行った)を作るきっかけは、着手時点では先行事例を知らなかったから、知りたいと思えば自分でやってみるしかなかったからであり、だがその後、作業を進めていくうちに、類似の研究があることは確認できたものの、ことマーラーの作品を対象にしたものとなると、現時点でも確認できていないのと同様、ここで報告するような実験の報告のようなものを目にしたことがないということである。勿論、マーラーの作品の人工知能による模倣は既に行われて結果も示されているし、この手の話には格好の題材であろう第10交響曲の補筆完成版の作成を人工知能で行った結果が披露されたという報せを知らないわけではないことは、既に本ブログの過去の記事「デイヴィッド・コープのEMI(Experiments in Musical Intelligence)によるマーラー作品の模倣についての覚え書」でも報告している通りだが、そこで私が個人的に不満なのは、既に述べた通り、人工知能が「創作」したとされる「結果」のみが示され、それがマーラーの音楽に「似ているかどうか」のみが論じられるという点である。そこでここでは、どのようなことを考え、どのような準備をして、どのような条件を設定して、どのようなプロセスで処理がなされた結果、どのような結果が得られたかの詳細についてここまで報告することもまた、実験結果自体と同様に意義があると考えていることをお断りして、背景についての説明を終えることにする。

 なお、上述の背景の説明から、マーラーの作品の「模倣」の実験は可能だが、「学習」の実験は意味がないと考えていると受け止められてしまうかも知れないが、実際にはそういうことではないことを最後にお断りしておきたい。機械学習の対象として捉えた場合にマーラー固有の問題として思いつくのは、作品数が少なく、しかも様式的に多様で、作品・楽章間での多様性が大きいということだろうか。例えばバロック期や古典期の作曲家や、近年ではポピュラー音楽におけるようにある程度決まったパターンに基づき、消費のニーズに応じるべく大量に作品を「生産」「製造」するようなケースと比べれば、「マーラーの場合」が機械学習に馴染まないのは直観的には明らかなことだろう。作品の完成度に拘るスタイリッシュな寡作家というわけではなく、単純にシーズン中は歌劇場監督としての職務の多忙から、パートタイムの「夏の作曲家」たることを余儀なくされたという事情(それゆえ彼の作曲活動は、楽長の道楽として揶揄されさえした)に由来する作品数の少なさのみならず、アドルノが「マーラーがいつもどのように作曲するかは、伝来の秩序の原則にではなく、その曲独自の音楽内容と全体構想とに従っている。」(アドルノ, 『マーラー 音楽観相学』, 龍村あや子訳, 法政大学出版局, 1999, p.56)と言う「唯名論的」(同書, p.83)な傾向を踏まえ、「作品のいずれもが以前に書かれた作品を批判しているということにより、マーラーはまさに発展する作曲家となっている。言うならば、彼の量的には決して多くない作品にこそ、進歩ということを語ることができる。」(同書, p.111)というアドルノの見解を受け入れるならば、「マーラーの場合」の特徴は、そもそも統計的な処理に馴染まない性質のものでさえありうる。

 だがそれでもなお、そうした傾向が結果としてミクロな系列が持つ特徴となり、その特徴を検出し、学習することでマーラーの独自性、「マーラーらしさ」を言い当てることが可能かも知れない。数は少ないとはいうものの、マーラーの作品全体の量を、例えば小節数や演奏時間という尺度で捉えたならば、統計的な学習を行うに十分な分量であるという見方も可能だろう。(単純な比較ができないことは断った上で、例えばGoogle MagentaのPolyphony RNNモデルのモデルケースであったバッハのコラールへの和声付けに基づく学習に用いられるサンプルの規模と比べて、量的に少ないということはないだろう。)既に別のところでは、いわゆる「スモールデータ」でも適用可能な分析ということで主成分分析等のような手法を用いて、和音の出現頻度という、ごく表層的なテクスチュアに関する特徴量だけからではあるが、マーラーと他の作曲家の作品の比較やマーラーの交響曲作品の間の比較を試みた結果を別の記事で公開している(その概要については、記事「MIDIファイルを入力とした分析:データから見たマーラーの作品 これまでの作業の時系列に沿った概観」を、その結果の要約については記事「MIDIファイルを入力とした分析:データから見たマーラーの作品 和声出現頻度の分析のまとめ」を参照)が、そこから更に、そもそもアドルノの上記の主張の裏付けとなる結果をデータ分析から得られないかというアプローチも考えられるだろうし、そこから更に踏み込んで、特にその後期作品について、ベルクやベッカーの言葉を踏まえてアドルノが「(…)マーラーだけに、アルバン・ベルクの言葉によれば、作曲家の威厳の高さを決定するところのあの最高の品位の後期様式というものが与えられる。すでにベッカーは、五十歳を過ぎたばかりのこの作曲家の最後の諸作品がすぐれた意味での後期作品である、ということを見逃さなかった。そこでは非官能的な内面のものが外へと表出されているというのだ。」(p.112)と述べている点について、それに対応する何らかの特徴量を検出できないかという問題設定を行うことで、マーラーの音楽における「老い」について実証的な仕方で語ることさえ可能かも知れない。

 要するに特定の楽曲、例えばここで取り上げられている交響曲第3番第6楽章の主要部分「っぽい」作品を生成することを目的とした「学習」ということならば、こちらは統計的な「学習」の問題として設定しうるかどうか、そもそも問題の設定の水準において疑問の余地がないとは言えないということなのであって、一般に「学習」の問題が設定できないと言っているわけではない。実際、本稿執筆後、問題設定を変えて、1曲毎の規模が小さい歌曲については、全歌曲を一まとまりとして見て、交響曲については各交響曲毎に、Magentaで用意されたツールを用いて訓練用/評価用データを抽出したらどうなるのか、抽出されたデータを用いて訓練したらどうなるのかという実験は継続して実施しており、その結果については別途公開の予定である。(2022.7.7 公開, 7.16 語句の調整。22.11.12誤字修正および若干の補足を加筆, 2023.3.9-10追記, 独立の記事として本文から独立)

0 件のコメント:

コメントを投稿