お知らせ

GMW(Gustav Mahler Werke, グスタフ・マーラー作品番号:国際グスタフ・マーラー協会による)を公開しました。(2025.4.20)

2025年6月10日火曜日

マーラーについて生成AIに聞いてみた(17):生成AIがマーラーの「後期様式」について論じる(無料版標準モデルの場合・検証を終えて)

(承前)

 最後に、Deep Research との比較検証を目的tとして行った、各商用AIの無料版の標準モデル(ChatGPT 4o, Gemini 2.5 Flash, Claude 3.7 Sonnet およびClaude Sonnet 4)の出力した結果について簡単にコメントします。

 (C) 比較検証(1):ChatGPT 4o

 まずChatGPT 4oの出力は「マーラーにおける「後期様式」:アドルノとジンメルの理論に基づく音楽的形式の分析」と題されたレポートです。 このレポートの率直な印象は、体裁に比して内容が貧弱であることで、しかも(これはChatGPTに一貫して見られる傾向に感じられますが)第9交響曲第1楽章の具体的な細部の記述には誤りや、誤りとまでは言えなくても不自然、不適切に感じられる表現が散見され、些か問題含みの結果と思いました。例えばアドルノの主張の要約は「雰囲気」としては構わないのかも知れませんが厳密さには欠けているように感じられます。マーラーの後期様式の特徴の要約も、大筋としては間違っていなくとも、細かい言い回しについては不適切でミスリードだと思います。また参考文献についても、最初のアドルノのベートーヴェン論は、そのものずばりの論文、著作はありません。恐らくは断片のまま遺された『ベートーヴェン 音楽の哲学』のことを指しているのではないかと推測されますが、フェイクと取られても仕方ないように思います。この場合プロンプトがかなり具体的なこともあり、関連した文献からそれらしい語句を拾ってきて継ぎ接ぎしたといった感じが強く、如何にも生成AIらしい出力だと思いますが、内容は貧弱なものに感じられます。

 (D) 比較検証(2):Gemini 2.5 Flash

 Gemini 2.5 Flashの出力は、そのように明示的に指示した訳ではないのですが、レポートそのものではなく、「リサーチ計画」でした。先行してDeep Researchに同一の内容を問い合わせたことが影響している可能性があるように思います。しかしながら、その内容は妥当なもので、この計画に沿ったリサーチを行うよう指示を出したくなるレベルのものと感じました。(以下に見る通り、Claudeの出力は、レポートと謳って、それらしい体裁にはなっているものの、箇条書きを多用しており、アイデアの羅列に近いものなのに対し、Gemini 2.5 Flash の回答の方は、「リサーチ計画」と言いながら、かなり実質的な内容も含むものであり、両者の差はあまり大きくないようにさえ感じました。)その一方で、Deep Researchの「リサーチ計画」との関係が気になりますが、ざっと比較してみた限りにおいては、細部において少なからぬ相違があることから、基本的には独立したものと思われます。また細かく見れば気になる点がないわけではないですが、はっきりと指摘できる誤りが見当たらない点も評価できます。

 (E) 比較検証(3):Claude 3.7  Sonnet

 ClaudeはDeep Researchに該当するOpus 4が無料版では利用できないため、比較検証のみとなりましたが、そのかわりに、検証のタイミングが3.7から4へのバージョンアップのタイミングと重なったことから、新旧2バージョンのSonnetでの検証が行えました。3.7 Sonnetでは、本検証共通のプロンプトを与えたところ、自動的にレポート作成のモードになり、レポートが出力されたのですが、同様のことをSonnet 4で試したところ、インラインでの回答が返ってきたため、「レポートを作成する」という指示を明示的にプロンプトに含めてレポートを作成させました。両者の結果は構成面ではほぼ共通しており、論旨も大筋では一致している一方で、細部には少なからぬ差異があることが確認できます。タイトルに既に差異があり、3.7 Sonnetのレポートは「マーラーの後期様式と音楽的形式の変容 ジンメル・アドルノ・マーラーの美学的連関」であるのに対し、Sonnet 4のレポートのタイトルは「マーラーの後期様式 ジンメル・アドルノ理論を通した音楽的形式の分析」です。後者はごく普通のものだと思いますが、前者は副題においてジンメル、アドルノとマーラーが並置されてその連関をテーマにするという表現になっている点に微妙な違和感を感じます。そしてこの違和感はタイトル限定のものではなく、本文においても同様であることが読み進めていくうちに明らかになります。(なおClaudeではレポート本文とは別にレポートの要約が示されますが、ここでは割愛させて頂きます。)

 私見では、3.7 Sonnetのレポートは稍々勇み足気味なところがあり、特に結論においてその傾向が目立ちます。何度も繰り返しになりますが、第10交響曲が未完成であることを「後期様式」と結び付けることには無理があると私は考えますが、ここでは未完成であることが意図されたものであり、「完成」概念を問い直すものであるという主張が為されていて、これは明らかに行き過ぎです。(私はその立場を採りませんが、百歩譲って)仮に「未完成」がマーラー自身によって意図されたものであるとしても、それが美学的な意図をもって為されたものであり、「後期様式」の一部を為すというのは全く別の次元の話であり、その主張は、「大地の歌」や第9交響曲に見られる「後期様式」の特徴とは相容れないものでしょうし、クックが補作した全五楽章よりなる第10交響曲の構想(それこそがマーラーが意図したものであると私は考えていますが)とも決定的に背馳するもので、完成された作品の「様式」としての「解体」とか「断片化」を、不当な仕方で敷衍したものと考えます。(そのメカニズム上、いかにも生成AIがやりそうなことではあるのですが。)Claudeのレポートは、(これは3.7, 4の両方に共通することですが)箇条書きを多用したスタイルであり、論考というよりは、アイデアの素描に近いものですが、3.7のそれは内容が拡散気味で、その行間を埋める作業は必ずしも自明の手続きであるとは思えません。特に影響を論じた箇所にその傾向が著しく、必ずしも誤りとは言えないものの、論証抜きでの列挙には堪えない内容に感じられました。結論部分についても同様で、きびらやかな表現が散りばめられていますが、箇条書きでの列挙は明らかに論証不足と思われます。

(F) 比較検証(4):Claude Sonnet 4

 それに比べると、Sonnet 4のレポートの内容は説得力のあるものになっていると思います。第10交響曲への言及も、未完成であること自体を問題にするのではなく完成された作品の構造や音響にフォーカスしており、その主張の当否は措いて、議論の組み立て方として、段違いに妥当なものになっていると思います。影響についての言及も、今度はおとなしくなり過ぎて面白くないかも知れませんが、マーラーの「後期様式」と所謂「新音楽」との連関を正しく指摘しており、申し分ないものです。

 とは言いながら、Sonnet 4のレポートにも誤りがないわけではありません。明白な誤りとして指摘できるのは、第10交響曲第1楽章アダージョのクライマックスにおける三度の累積による9音からなるクラスターについて言及している箇所で、「9度の不協和音」というのは恐らくは英語からの翻訳の過程で生じたミスではないかと推測されます。更に参考文献にも問題があります。どの著作を挙げるかの選択については様々な立場・考え方があるとはいえ、アドルノの著作を一つ挙げるのに『美の理論』というのは、このレポートがマーラーの「後期様式」論であることを思えば、やはり稍々妥当性を欠くきらいがあると感じます。また、(翻訳により生じた氏名の表記の不自然さについては目を瞑るとして)ド・ラ・グランジュの『グスタフ・マーラー』というのは情報不足で不親切でしょう。ド・ラ・グランジュのマーラー伝には3巻からなうフランス語版と、4巻からなる英語版(但し、第1巻は大幅な改訂がなされた新版の準備中に著者が没したため、死後刊行)がありますし、日本で編まれた論文集『グスタフ・マーラー 失われた無限を求めて』(船山隆、井上さつき訳、草思社, 1993)もありますから、少なくともそのうちのどれかが判別できる情報が必要です。しかしもっと問題なのは、最後に掲げれたコンスタンティン・フローロスの論文で、私の知る限り、フローロスには掲げられた題名の論文はなく、フェイクの可能性があります。生成AIが出力したレポートの文献にフェイクが混じることはごくありふれた事のようで、それが問題を引き起こした事例が度々報告されていますが、この点については、Deep Researchは使用したWebサイトが明示されるため、問題が起きにくいのに対して、標準のモデルの出力では、今回のみならず、本ブログのこれまでの検証においてもかなりの高頻度で存在しない文献が示されるケースが見受けられます。最新版でもフェイク一掃という訳でないようですので、引き続き注意が必要と思われます。ちなみに事後に

「あなたのレポート「マーラーの作品における「後期様式」」の参考文献に示された文献の書誌情報を示してください。」

というプロンプトをClaude 4に送ったところ、下記のような回答が返ってきました。

申し訳ございません。先ほどのレポートで示した参考文献について、正確な書誌情報をお示しする必要があります。実際のところ、私が作成したレポートの参考文献欄に記載した文献は、一般的にこの分野で重要とされる文献の例として挙げたものであり、具体的な書誌情報(出版社、出版年、ページ数など)を正確に把握しているわけではありません。

レポートに記載した文献:

- アドルノ, テオドール・W.『美の理論』

- ジンメル, ゲオルク『ゲーテ論』

- デ・ラ・グランジュ, アンリ=ルイ『グスタフ・マーラー』

- フラーロス, コンスタンチン『グスタフ・マーラーと現代性の弁証法』

これらの文献について、正確な書誌情報(出版社、出版年、翻訳者、ISBN等)をお求めでしたら、図書館のデータベースや学術文献検索システムでご確認いただくか、具体的にどの文献の詳細情報が必要かお教えください。そうすれば、ウェブ検索を通じて正確な書誌情報を調べてお示しすることができます。

学術レポートにおける参考文献の記載について、不正確な情報を提示してしまい、申し訳ありませんでした。今後は、具体的な書誌情報が必要な場合は、その旨を明確にお伝えするよう気をつけます。

指示対象が正しく同定でき、自分の作成した参考文献リストの内容も正しく把握できていることは窺えます。しかし「一般的にこの分野で重要とされる文献の例として挙げたもの」というのは正直だとは思いますが(笑)、レポートの参考文献の付け方としてはやっつけに感じられます。Cluadeは相対的には慎重な印象があったので、これは稍々意外に感じました。ともあれ「具体的にどの文献の詳細情報が必要かお教えください。」とあるので、更に以下のプロンプトを投げてみます。

「フラーロス(ママ), コンスタンチン『グスタフ・マーラーと現代性の弁証法』の書誌情報を示してください。」

回答は以下の通りで、どうやらやはりフェイクであったようです。

申し訳ございません。検索結果を確認したところ、私が先ほどのレポートで言及した「フラーロス, コンスタンチン『グスタフ・マーラーと現代性の弁証法』」という特定のタイトルの書籍は見つかりませんでした。

検索結果から判明したのは以下の通りです:

Constantin Florosの実際の主要著作

  • 『Gustav Mahler: The Symphonies』(英語版)
  • 出版社: Amadeus Press(推定)
  • ISBN: 1574670255
  • これは「Professor Florosのマーラーに関する記念碑的研究の第3巻」で、「最初と2番目の巻はまだ英語に翻訳されていない」とあります。

つまり、私が参考文献に記載した「『グスタフ・マーラーと現代性の弁証法』」という特定のタイトルは、実際には存在しない、あるいは正確ではない可能性が高いです。これは私の誤りでした。

正確な書誌情報を提供できず、また存在しない可能性のある文献を参考文献として記載してしまい、深くお詫び申し上げます。学術的なレポートにおいて、このような不正確な情報を含めることは適切ではありませんでした。

今後は、具体的な書誌情報を求められた場合は、事前に正確性を確認するか、一般的な参考として挙げている旨を明記するよう注意いたします。

ちなみにCluadeの検索結果にある「最初と2番目の巻はまだ英語に翻訳されていない」は、確かに上記翻訳の出版時点(1993年、なお出版社に「推定」とありますが、これは正しく、何かちぐはぐな印象です)では事実でしたが、現時点では事実ではありません。第1巻は、Gustav Mahler’s Mental World: A Systematic Representation. Peter Lang, 2016 として、第2巻は、Gustav Mahler and the Symphony of 19th Century. Peter Lang, New York 2014 として翻訳・出版されていますので、念のため補足します。少なくともweb検索の品質に関しては、Claudeにはやや難があることが確認できたように思います。

*     *     *

 以上、生成AIが出力したレポートについて個別に確認してきましたが、最後に改めて全体を俯瞰して感じたことを記して、本稿を終えたいと思います。

 今回の検証結果を俯瞰してまず気づくことは、多少の抜き差しはあるものの、基本的にどの出力も類似した内容であることです。ここではその類似の度合いを定量化することは行いませんが、今回検証対象とした6種類のモデルを、6人の人間に置き換えたとしたら、良かれ悪しかれ、そのアウトプットはもう少し多様なものになるのではないでしょうか?

 これは生成AIが、学習とチューニングの方向性の違いはあれ、基本的にはいずれも共通して、Transformerという手法をベースとした大規模自然言語モデルに基づいていることに由来すると考えられます。事前学習の結果や検索して得られた情報の違いにより、多少のばらつきは出るものの、得られた情報をどのように組み合わせて出力するかに関する基本的なメカニズムは同一ですし、事前学習にしてもWeb検索にしても、対象としてはWeb上に存在する同じ情報源を用いている訳ですから、特定のテーマについてのリサーチの結果が似たようになるのは或る意味では当然のことと言えるでしょう。特に比較検証の対象とした各生成AIの無料版の標準モデルの出力は(Gemini 2.5 Flashのそれは、レポートではなくリサーチ計画という違いはありますが)、まとめ方のスタイルの違いや細部の題材の取捨選択、更には同一の内容についてもちょっとした言い回しにおいて無視できない違いはあり、レポートとしての完成度については少なからぬ差が出ているものの、大きく見ればその内容の方向性については似たりよったりのものになっていると感じました。

 標準モデルの結果と比べると今回のメインの検証対象であったDeep Researchの結果は、あくまでも相対的にではありますが、より多様性に富むと言えると思います。これは単に検索対象となるWebサイトの量が多いだけではなく、検索と情報の取捨選択・要約を複数回繰り返すことから、獲得される情報とその取捨選択や関連付けに多様性が生じうる余地が大きいからと考えられます。

 生成AI間の「個性」の違いについて言えば、Deep Researchか標準モデルかに依らず、一定の傾向があり、しかもそれは基本的には今回検証したバージョン固有のものではなく、既に旧バージョンで確認できたものと変わらないように感じられます。感覚的でくだけた言い方を許してもらえるならば、ChatGPTがアグレッシブでやんちゃで多少の傷を懼れない印象なのに対し、GeminiとClaudeは慎重派ですが、Geminiが周到なのに対し、Claudeはスマートな印象があります。

 個性の違いとは別に、今回の検証対象の中心であるDeep Researchのアウトプットのクオリティに関して言えば、少なくとも今回得られた結果から判断する限り、明らかにGeminiのアウトプットの方が正確さにおいて勝り、また組み立ても自然であり、相対的に優れたものと評価できます。Deep Researchの結果のみならず、無料版の標準モデル間の比較についても同様で、構成の自然さ、内容の正確さ、妥当性のいずれの面でもGeminiが一歩抜きんでているように思いました。Geminiの技術的アドヴァンテージとして、特にWeb検索の精度や推論との融合が進んでいる点が挙げられるようですが、今回の検証結果はそのことを裏付ける結果となり、Web検索のレベルがレポートの品質に大きく影響していることを感じました。Claudeは3.7から4 へのバージョンアップにより、より慎重になった一方で、内容の自然さや妥当性については明らかに向上しており、Deep ResearchのベースとなっているChatGPT o3, Gemini 2.5Proに相当する推論モデルであるOpus 4の検証ができないのか惜しまれます。しかしながらCluadeはWeb検索の精度において他の後塵を拝している感じがあり、そのことが回答の質においても足かせになっている感があります。ただしこれは、ピンポイントでのレポート作成1件のみ、しかもかなり特定したテーマに関する問い合わせの結果でしかないため、一般化は慎むべきかと思います。

 とはいうものの、最も優れたGeminiのレポートですらその内容は、本質的には検索で見つかった文献の引用のパッチワークに過ぎません。問い合わせた領域について利用者自身が全く不案内である場合には、フェイクに気づかない危険に晒されることになる一方、その領域について自分なりの展望を持ち、問題意識が明確である場合には、生成AIのレポートは、その内容に多くを期待することは無理であり、せいぜいが自分では探索しきれない文献の調査や、所謂「ありがちな」議論がどのようなものであるかを確認する程度の役割を果たすので精一杯というのが、現状の偽らざる評価なのではないかと思います。確かにDeep Researchにおいて示されるような、多段階よりなるサーベイの計画を立てる能力は従来の生成AIにはないものであり、これまで苦手としてきた複雑な課題を解決する能力が確実に向上していることは本稿の報告で明らかなことと思います。それでもなお現状の生成AIの能力は、人間がレポートを書く際に求められている視点の新規性とか分析の独自性といったものとは依然として無縁のものである、というのが今回の検証を終えての偽らざる印象です。

 必ずしも読むに値しない内容と感じたからということは決してないのですが、各生成AIの出力したレポートを読んでいて感じたのは、(これだけのアウトプットを短時間で可能にする技術の進展への驚きは勿論それとして、)何となく皮相で上滑りしたような印象、どこかで微妙にずれてしまっていて嚙み合っていないような感覚を伴う違和感でした。これは生成AIに対して不当な(それを道具と割り切る立場からしたら誤ってさえいる)姿勢かも知れませんが、率直に言って私はそれらのレポートに「感心」することはできても「共感」することができませんでした。しかしその理由はもしかしたら別の処にあるかも知れませんので、この違和感については後で別途、改めて立ち戻ってみたいと思います。

*     *     *

 勿論、調査には定型的で、寧ろ「没個性的」であることが望ましいタイプのものもありますから、そうした領域においては、生成AIは既に現状においても有能なエージェントとしての活用が可能でしょう。そうでない領域であっても、レポートの作成には少なからぬテクニカルな側面がついて回るため、校正は勿論、企画や編集の補助として生成AIを活用することは有効だと思います。更に現在の技術的進歩のスピードを考えれば、近い将来に、人間の活動の或る側面をそっくり代替するといったことが生じても不思議はありません。しかしながら、生成AIの基本的な構造が変わらない限り、現在の技術の延長線上には、創造性や独創性といった特性が備わることは考えにくいように思います。なぜならば、結局のところ、生成AIは、与えられた問題を解くことが出来たとしても、新たな問題を考え出すことができないからです。そしてその理由は、事実に即してごく簡単に述べれば、AIには問題を発見してそれを解決することを自らに促す「動機」が欠けているからだと思います。

 生成AIにも人間の「個性」に似たものは認めることができるかも知れません。実際に体感としても、ChatGPTとGemini, Claudeでは同じ問いに対する回答の仕方には違いがあり、しかもその違いには、複数の問いを横断して見られる一貫性のようなものを認めることができるのは既述の通りです。そして履歴を保持することができ、履歴を参照した回答を生成することができるようになったからには、同一の生成AIでも或る人が利用し続けた時の応答と別の人が利用し続けた時の応答は異なったものになり、それぞれに、やはり複数の問いを横断して見られる一貫性のようなものが出てくるかも知れません。その場合、ここで言う「個性」のようなものは、つまるところその生成AIの来歴、どのようなデータで、どのようなバイアスの下に学習を行って来たか、どのような質問に答え、どのように評価されて来たかという履歴と、履歴に応じたフィードバックの累積によってもたらされるものです。つまり「個性」の由来は、その個体の「過去」の「記憶」に存すると言えると思います。

 一方、創造性や独創性における「新しさ」というのは、単にそれまでに現実に実現したことがないという意味合いではありません。これまでに実現していない事象でも、それが統計的に推定可能な「空き」であるならば、推定し補完することで発生を予測することは技術的に十分に可能でしょうが、ここでいう「新しさ」というのは、、統計的には例外、外れ値として除外されてしまうかも知れないような、過去の履歴に基づく予測をはみ出るような出来事のことです。とはいってもそれは単に予測不可能な出来事ではありませんし、いわゆる「奇跡」の如きものを思い浮かべるのも適当ではありません。一見したところ矛盾するようですが、ここでの「新しさ」は反復可能でなくてはならず、一度限りの再現不可能な偶然によってもたらされるものであってはならないのです。そして「新しさ」が反復可能でなくてはならないという条件下である系が「新しさ」を生み出すことができると言いうるには、その「新しさ」が、単にその系を観察する時間が十分ではなく、挙動に関する情報が不足しているが故に、その系の挙動について十分な精度が予測できないといった理由に基づく予測の困難によってもたらされるものであってはならず、その系自身にとっても「新しい」ものでなくてはならないでしょう。同じ問いについて常に同一の答を返すのではなく、その時々に文脈に応じて異なった答を返すのでなければならず、同じ問いを、異なった風景の中に位置づけ、異なった角度から回答をし、なおかつそれについて系が自覚的でなくてはならないでしょう。極論をするならば、仮に外部から見れば既知の回答であったとしても、回答する系がその回答に「新しさ」を感じ取るのであれば、そのような系は創造的で独創的でありうる可能性を持っているというように言えるのかも知れません。自分自身にとっても予測不可能な回答を返すことができる可能性を備えた系、そしてその「新しさ」を自覚することができる系こそが創造的、独創的と呼ぶ条件を備えているのではないでしょうか?

 それではそうした「新しさ」は、どのようにして可能になるのでしょうか。勿論、この問いに対して十全な答えを持ち合わせている訳ではありませんが、それにしても、必要条件を示唆することであれば可能であると思います。ごくシンプルに言えば、これまでの述べてきたような意味合いでの「新しさ」が可能であるためには、リサーチの履歴の「外部」が、「言説の空間」の「外部」が必要なのではないでしょうか。そしてそれは、閉ざされた「言説の空間」の住人である生成AIにとっては(原理的に不可能とまでは言わないまでも)困難なことである一方で、環境の中で常に動き回り、探索を行い、変化を感じ取り、その感じに応じて次の行動を起こすことで環境に対するフィードバックを行うことを続ける或る種の生物にとってはごく当たり前のことなのかも知れません。

 人間は言語を獲得し、言語によって膨大な情報を蓄積し、再利用することで、謂わば「言説の空間」を通して世界を眺めるようになり、ややもすれば「言説の空間」だけが存在し、それ以外のものは存在しないかのように思いなす(所謂「唯言論」)ようにさえなりました。そして生成AIはそうした「言説の空間」の更に一部のみの中で動き回り、情報を探索し、取捨選択を行って回答を返す存在です。しかしながら人間は如何にそれが占める割合が大きくなったとしても「言説の空間」のみに住んでいる訳ではありません。「言説の空間」とは別の現実に接地しており、そうした現実と「言説の空間」を往来しつつ、変化を感じ取っては反応を返して生きています。或る事象に関する「言説の空間」の情報は、人間にとっては最早その事象の不可分の一部になっていますが、それでもその情報が全てではありません。そして「新しさ」というのは寧ろ、「言説の空間」の外部である現実との関わりにおいて生じて来るものではないでしょうか?ここでいう外部の現実には、物理的な外部環境の知覚も含まれますが、身体的な内部事象も含まれます。意識が直接アクセスできない無意識的な記憶の中でも、非言語性のもの、例えば動作性記憶のようなタイプのものは「外部」になるのではないでしょうか。そして「外部」の変化は常に「感じ」を通じて主体に届くことで反応を促し、自分の反応そのものが再帰的に更に新たな「感じ」を惹き起こします。「新しさ」もまた、そうした「感じ」の一部として捉えるべきであって、それは「言説の空間」の外部にしかないのです。そしてそうした「感じ」に促されて、人間は新たな問題を発見し、作り出し、それを解決するのではないでしょうか。それは人間にとっては当たり前のことですが、少なくとも現時点の生成AIには無縁のものあり、この点をもって私は、AIには「動機」が欠けているという言い方をしたのでした。勿論そこには原理的に乗り越えられない断絶がある訳ではなく、ロボティクスのような身体性AIの研究も進められており、将来この溝が乗り越えられる可能性を否定するものではありませんが、今日の生成AIは、言ってみれば「記号接地問題」をすっ飛ばしてしまって「言説の空間」の内部だけで「知的な」応答ができるようになってしまったという点が驚きをもって迎えられているくらいですから、現時点での懸隔は未だ非常に大きなものであると思います。それが「知性」であるとしたら、それは生物学的基盤を持つ人間のそれとはかなり異質のものと言うべきでしょう。

*     *     *

 生成AIを情報収集と情報集約の道具として見做す限りでは、こうした議論は無意味なものと見做されることでしょうが、その道具に、創造性や独創性を求めていった時に、いずれこうした議論が意味を持ってくるのではないかというのが私の実感です。そしてそれは、今回の検証結果に感じる違和感とどこかで繋がっているように思うのです。勿論、生成AIに与える課題は多様であり、こうしたことが問題にならない領域も存在し、そうした領域で生成AIを利用する分には問題は起こらないでしょう。そもそも、こと「知性」に関して言えば、ここでの議論とは無関係に成り立つものなのかも知れません。けれども今回の検証に用いた問、マーラーの「後期様式」についての問いに関する限りでは、AIの「知性」の異質性は致命的な点であって、くだんの違和感は寧ろ感じられて当然のことではないかと思うのです。

 それは恐らくマーラーの「後期様式」に関する問が幾つかの点で「言説の空間」の外部に関わる問であることに由来します。一つには、ここで問題になっているのが「音楽」であるという点があります。音楽についての言説の空間の中を幾ら動き回っても、音楽そのものに辿り着くことは決してなく、言ってみればそれは音楽についての「うわさ話」だけに基づいて話をしているようなものなのです。勿論生成AIのマルチモーダル化もまた着々と進んでいるので予断は許しませんが、少なくとも現時点では、生成AIは音楽を「聴いた」上で答えているわけではありません。それ故、音楽を聴いたことがありさえすれば起こりえないようなフェイクが平気で発生することにもなります。

 更には「音楽」は、まさに「感じ」に関わるものであるという点で「言説の空間」の外部にあります。「音楽」は「ことば」とは異なった仕方で人間に働きかけるものであり、「ことば」の始まりと、少なくとも等根源的に、ことによったらそれに先行してコミュニケーションを可能にするモードであることが研究によって明らかにされつつあります。「音楽」は「言説の空間」の「外部」に直接アクセスすることを可能にするものであり、寧ろこちらこそが「共感」の領域なのです。けれどもそれは生成AIにとっては存在しない領域です。人間にとっては本来「言説の空間」へのアクセスにも豊かな「情動」が付き纏っており、そうした「感じ」を完全に遮蔽することは困難なのですが、「言説の空間」の内部での操作に関する限り、あたかもそうした「感じ」がないかの如く思いなして操作を行っているに過ぎないのに対し、生成AIははじめからそうした「感じ」を持つことなく「言説の空間」における情報処理を行っているのです。そして「言説の空間」の内部の情報処理については、そうした情動的側面が問題になることはありませんし、実際に生成AIはマーラーの音楽に関して十分な程度に正確な情報を返すことが出来ています。けれどもそれは「音楽」の現実の裏づけを欠いた、非常に脆い性質のものであり、それが時として回答の質に影響していることも否めませんし、その回答にどことなく「実感を伴わない」皮相な印象をもたらしているのだと思います。いや、実際に生成AIには「実感」などないのですから、そうした印象は専ら人間の側の受け止め方の問題に過ぎないですが、こと「音楽」が対象になっている限り、そうした側面を全く捨象してしまえるものなのか疑問ですし、そもそも捨象すべきではないように私には思えるのです。

 しかしそれと同じ位重要なのは、「後期様式」というのが作品を生み出す人間の「老い」に関わるものであるという点ではないでしょうか?「後期様式」というのは、単なる年表上の作品創作の順序に還元されるものではありません。それは作品が持つ特徴の一つですが、定義上、完全に作曲者の側の事情を捨象することはできない性質のものです。ただ安直に作曲者の伝記的事実を作品に押し付ける類の説明が不十分であるというだけで、「老い」と「老いの意識」がどのように作品の巨視的な時間的構造や細部の様々な特徴に影響しているかという関連づけの問いを避けて通ることはできません。更に言えば、マーラーの「後期様式」についいての問は何故立てられたのでしょうか?それは音楽作品の様々な特徴づけの仕方の一つに過ぎませんが、音楽作品を分析するにあたって、より形式的な操作によって可能なレベルではなく、敢えてそのような特徴づけをすることが意味を持つのは、問う側の人間もまた、作曲者と同様に「老い」てゆく存在だからではないでしょうか?そうした問いを立てたくなる「衝動」は、従って「人間的な、あまりに人間的な」ものなのであり、それだけに(少なくとも私にとって)切実なものなのです。

 けれどもそうした切実さを、「老い」を知らない生成AIが共有することはありません。その問いに秘められた衝動を感じ取り、共感するということも(少なくとも現状は)ありえません。既に使い方によっては、共感するふりをすることに関して、生成AIがかなり高度なレベルになっており、ケア等への適用が期待される一方で、弊害も指摘されるようになってきているという事情があることは承知していますが、そのこととここで述べている「共感」とは、一先ずは別のものだと私は捉えています。そうした言語行為論的な、或いは精神分析的な言語使用の次元はそれとして、一見そうした次元とは無縁に見えて、情動的なものが捨象された「言説の空間」にのみ専ら属すると(もしかしたら建前上は)了解されているような問いですら、実際には、人間の生物学的・実存的な条件に根拠づけられ、自己の内なる「外部」からの衝動に突き動かされ、豊かな情動に彩られたものであるという点が、人間に対してではなく、AIに対して問いかけを行うという、未聞の状況(こうしたことが、ごく自然に、日常的に行われるようになったのは、人類史上初めてのことに違いありません)において露呈されたということではないかと私には思えてならないのです。

 繰り返しになりますが、生成AIに投げかける問の全てがそうであるわけではありません。しかしここで主題としているマーラーの音楽作品における「後期様式」の問題に限って言えば、「言説の空間」の「外部」を持っているかどうかは決定的な違いとなると私には思えます。更に生成AIの性能が向上すれば、「言説の空間」の内部においては、人間の回答と全く見分けがつかないような答が返され、チューリングテストと見做せば、テストにパスするという事態が生じることは確実でしょう。しかしそれは、この問いについては副次的な意味合いしか持たないのではないでしょうか。自ら「老いる」ことなき存在が「後期様式」について十全に「論じる」ことができたとしても、結局それは「老いる」存在の生きる現実には接地していません。「言説の空間」内においては、この差異は潜在的なものでしかないでしょうが、だからといってその差異がなくなることはありません。今回の検証の時点で既に明らかであり、なおかつ今回の検証を通して実感したことは、生成AIに「問う」ということ自体が一義的なものではなく、問いによっては、本当の意味で「問う」他者に生成AIは始めからなりえないのだということなのだろうと思います。そして今回の問いは、少なくとも私にとってはまさにそのタイプの問いだったということです。

 私が生成AIの出力したレポートを確認している時に感じた違和感、どこかで微妙にずれてしまっていて嚙み合っていないような感覚は、事によったら、そのレポートの内容自体よりも、それが生成AIが出力したものであるという事実により多く依拠しているのかも知れません。何しろ私はその事実を知った上で、検証を目的としてその出力を読んでいるわけで、そうしたフレームを、恰も知らなかったかの如く括弧入れすることなどできないからです。もしそうであるならば、将来、チューリングテストとしてはパスしてしまうようなレポートを手にしたとしても、それがAIによって生成されたものであるというのがわかった時点で、事後的に同じ結果になることは予め決まっていることになります。これは後だしジャンケンなどでは決してありません。寧ろチューリングテストという枠組みの方が限定的なのであり、ここでの問題はゲームの内部ではなく、外部にあるのだということに過ぎません。

 それともいつの日か、シンギュラリティの彼方において、AIもまたそうした問いを投げかけるに相応しい相手になるのでしょうか?そうかも知れません。しかし私の予感では、寧ろ「後期様式」の問いは、シンギュラリティの彼方においては最早意味を持たない、実感を伴わない過去の遺物になっているのではないかというように思います。もしかしたら私たちは二分心崩壊以降、シンギュラリティ以前のエポックを生き、そうした問いを発する最後の世代であり、「ひとのきえさり」の後にはマーラーの音楽は、かつて「人間」と呼ばれた種族がどんな存在であったかを知るための考古学的な手がかりになるのではないでしょうか?今から半世紀以上も前にシュトックハウゼンが想定した、地球を訪れた宇宙人にとってそうであるように。

(2025.6.10 公開, 6.11 Sonnet4のレポートの書誌情報に関して補足)


0 件のコメント:

コメントを投稿