グスタフ・マーラー: chatGPT-5

ラベル chatGPT-5 の投稿を表示しています。すべての投稿を表示

2025年9月30日火曜日

意識の構造と音楽：フリストンの自由エネルギー原理とマーラーの作品の時間性（2025.9.30更新）

1. はじめに

本稿は、カール・フリストンの自由エネルギー原理を中心とした現代の意識理論と、音楽、特にマーラーの交響曲における時間構造との関係を考察し、アドルノの音楽分析における「未来完了性」概念およびVarianteの技法を重要な分析視点として、意識と音楽の構造的類似性の探究の方向性を示すこと、マーラーの音楽を「意識の音楽」「＜感じ＞の時間性のシミュレータ」として捉えることに一定の妥当性があることを示そうと試みたものです。

2. フリストンの自由エネルギー原理と意識理論

2.1 基本概念

自由エネルギー原理は、生物システムが環境との相互作用において、予測誤差（サプライズ）を最小化しようとする基本的な動作原理を示しています。脳は常に感覚入力を予測し、その予測と実際の入力との差異を最小化することで、世界の内部モデルを更新し続けます。

2.2 意識との関連

予測処理と意識 フリストンの理論では、意識は階層的な予測処理システムの産物として捉えられ、脳の異なる階層レベルで行われる予測とその更新のプロセスが、私たちの主観的体験を生み出すとされます。

注意と意識の関係 予測誤差が大きい情報に注意が向けられ、それが意識的な経験として現れる仕組みも、自由エネルギー原理で説明される可能性があります。それによれば、予測できない、つまり情報価値の高い刺激が意識の前景に現れやすいとされます。これは意識が無意識的な処理では対応しきれないような環境の変化に対応するために進化的に生み出された仕掛けであるという考え方や、ウィノグラード＝フローレスのように意識を「ブレイクダウン」に関連付けて考える立場と親和的です。

2.3 情動の理論と自由エネルギー原理の統合

内受容感覚と予測処理 ソームズが重視する内受容感覚（体内からの感覚）は、フリストンの枠組みでは身体状態の予測処理として理解されます。脳は常に身体の内部状態を予測し、その予測誤差を最小化することで恒常性を維持します。この過程で生じる予測誤差が「感じ」として体験されると考えられています。

情動の予測符号化 パンクセップの情動システム理論における基本情動（恐怖、怒り、探索など）も、進化的に発達した、生存のために重要な状況における予測処理システムとして再解釈可能です。これらの情動は、環境や身体状態の変化を予測し、適応的な行動を準備するための進化的に古い神経システムに由来するものと考えられます。

注意すべきなのは、ソームズやパンクセップの理論は、感情一次過程（Primary Process Emotion）理論であり、脳幹・辺縁系レベルの内的な状態としての感情を対象にしていること、それに対応してあくまでも生命維持や自己調節に根ざした脳内のホメオスタシス的機構のレベルでの感情の機能にフォーカスされており、実質的にはダマシオの言う「中核意識」以下のレベルに限定されていることです。

2.4.意識の階層構造

原始意識と高次意識 両者の理論は、意識の階層性について補完的な視点を提供します。パンクセップの「原始意識」（情動的意識）は、フリストンの枠組みでは低次の予測処理レベルに対応し、ソームズの言う「感じ」は身体状態の予測誤差として説明されます。一方、ソームズは高次の意識についても述べており、フリストンにおける階層的なモデルに対応するとされています。ただしそこでの感じや情動の扱いは限定的であり、高次の意識は「思考」として扱われている点には注意が必要です。

脳幹から皮質への情報流 ソームズやダマシオが強調する脳幹の重要性は、フリストンのモデルでは身体調節的な予測の最下層として位置づけられます。脳幹での予測処理が上位の皮質レベルに影響を与え、複雑な意識体験を形成するという統合的な理解が可能になります。特に皮質レベルでの高度な「思考」においては海馬が果たす役割が重要であり、ソームズの指摘するように、通常は無意識的である皮質の記憶プロセスに、視点を持った「わたしというもの」の質を注入するのに重要な役割を果たし、そのことによってシャクターの言うところの「建設的なエピソードシミュレーション」を支えています。

価値と動機の統合 パンクセップの情動システムが示す「欲求」や「価値」は、フリストンの能動的推論において、行動選択の基準となる事前期待として組み込まれます。生物は単に予測誤差を最小化するだけでなく、進化的により生存に適した状態を求める傾向があります。

この統合的アプローチは、意識を純粋に計算論的な現象としてではなく、身体に根ざした情動的・評価的なプロセスとして理解する新しい枠組みを提供することから、意識の構造と音楽との間の橋渡しをする可能性を持つものと考えられます。ただしパンクセップやソームズの情動についての理論は、フリストンの階層的な意識モデルにおいては、主としてその下層に関連づけられる点、あくまでも生命維持や自己調節に根ざした脳内のホメオスタシス的機構の解明に特化しており、そのために他者との相互作用によって生じる複雑な社会的感情や、情動のダイナミクスについては、十分な説明がされていない点については別に補完する必要があります。

2.5 音楽心理学における図式的期待（schematic expectation）との関連

フリストンの「サプライズ最小化（自由エネルギー原理）」と、音楽心理学における図式的期待（schematic expectation）は、両者とも予測とその誤差処理を中心に据えているという点で深い関係性があると考えられます。

音楽心理学における「図式的期待」ナームアの「含意ー実現」モデル、マイヤーの期待理論などでは、聴取者は過去の音楽経験や文化的学習によって、調性・旋律進行・リズムに関する「スキーマ」を持ち、それに基づいて「次にどうなるか」を予測し、実際の音楽進行が予測と一致すれば「充足感」や「安定」を、逸脱すれば「驚き」や「緊張」を感じるとされます。

予測と誤差処理 フリストンの理論では、能は外界からの入力を受けるとき、内部モデル（生成モデル）を用いて予測を立て、実際の感覚入力との差（予測誤差、≒「サプライズ」）が最小になるように行動・知覚・学習を調整します。これは認知・行動を統一的に説明する一般的・原理的枠組みであり、音楽心理学における「図式的期待」はその枠組みの音楽に特化した一例として位置付けられます。

音楽は「サプライズ」を意図的に操作する芸術と見ることができ、予測通りであれば安心、予測が裏切られれば驚きや緊張が生じ、それが新たな期待の更新につながるという意識の流れを生み出していきます。音楽は脳の自由エネルギー原理を活用した、仮想的なシミュレーションという捉え方が可能です。ただしここでも情動の理論について指摘したものと並行的な制限があることに注意する必要があります。つまり図式的期待のモデルは、その単純なものについて言えば、意識のレベルとしては中核意識のレベルを大きく超えることはなく、フッサールの内的時間意識の現象学においては第一次の把持のレベルに留まります。勿論それを「今ここ」の統合を超えた時間をまたいだレベルに拡張することは可能ですが、モデルとしての実質を持たせるためには時間をまたぐ構造保持のメカニズムが別途必要になると考えられます。フリストンの理論は過去・現在・未来を含む生成モデルを扱えるので、長期的安定性を定式化することは自然に行えますが、ダマシオの言う「延長意識」の水準や「自伝的自己」を扱うためには階層的なモデルが必須となり、特に上位階層の機能が重要となるのは既述の通りです。

3. 音楽と意識の構造的類似性

3.1 予測処理としての音楽体験

時間的予測とサプライズ 音楽に関わる様々な行為は、全体として時間的な予測処理システムと見做すことができます。私たちは聴きながら次の音やリズム、和声進行を無意識に予測し、その予測が裏切られたり確認されたりすることで音楽的体験が生まれます。フリストンの枠組みにおいて予測誤差の最小化プロセスと捉えることができるこの過程は、音楽の理解と楽しみの重要な源泉の一つとなると考えられます。

意識と音楽における階層構造 音楽の構造には意識と構造と並行的な階層性が見られます。音楽の聴取においては、音高、リズム、フレーズ、楽章といった異なるレベルで同時に予測処理が行われ、それぞれが相互作用しながら統合された音楽体験を生み出します。これは意識の階層的な予測処理モデルと類似しています。

3.2 身体的・情動的基盤

内受容感覚との共鳴 ソームズが重視する内受容感覚は、音楽体験の核心部分です。例えばリズムは心拍や呼吸と同期しますし、低音は身体の深部感覚との共鳴を惹き起こすと考えられます。音楽は身体状態の予測処理システムを直接的に活性化し、「感じ」の絶えまない変化としての音楽体験を生み出します。

基本情動システムの活性化 パンクセップの基本情動（探索、遊び、恐怖、愛着など）は、音楽の異なる要素によって直接的に喚起されると考えることができるかも知れません。例えば上行するメロディーは探索システムを、不協和音は警戒システムを、反復的なリズムは愛着システムを活性化する可能性があります。

3.3 音楽の意識への作用メカニズム

注意の誘導と統合 音楽は予測可能性と驚きのバランスを通じて注意を誘導し、変転し流動する意識内容を統合する力を持ちます。このことが音楽療法や瞑想において音楽の使用が有効である理由かも知れません。

時間意識の構造化 音楽は時間の流れを構造化し、意識の時間的展開パターンを調整します。拍子やテンポは時間予測のリズムを設定し、フレーズ構造は意識の注意サイクルと同期します。音楽は意識の流れを誘導し、調整する働きをすると考えることができます。

3.4.創造性と自己組織化

能動的推論としての作曲・演奏 音楽の創造は、内的な音楽モデルと実際の音響出力との間の予測誤差を最小化する能動的推論プロセスとして理解できます。演奏者は意図した音楽表現を実現するために、身体動作を通じて環境（楽器）を制御します。

集合的意識としてのアンサンブル 複数の演奏者によるアンサンブルは、個々の予測処理システムが相互作用し、より大きな予測システムを形成する例として興味深いモデルを提供します。これは意識の社会的側面に通じ、集合的認知の理解に繋がっていく可能性を含みます。

4. マーラーの交響曲における意識構造の音楽化

4.1 多層的な予測処理システム

同時進行する複数の時間スケール マーラーの交響曲では、短いモチーフ、中規模なフレーズ、長大な楽章、そして全体の交響曲という異なる時間スケールが同時に展開されます。これは意識における多層的な予測処理そのものと見做すことができ、私たちの意識も、瞬間的な知覚、短期記憶、長期的な目標や人生の物語といった異なる時間軸で同時に機能していることとの並行性が見い出せます。マーラーの音楽はしばしば「小説」に喩えられる、長大で複雑な時間的構造を持ちますが、それはダマシオの定義する「中核意識（Core consciousness）」（「今ここ」の統合）の繰り返しでは説明しきれず、自己史や未来予測を含む「延長意識（Extended consciousness）」や自伝的自己の水準に対応すると考えるべきです。

階層間の相互作用 マーラーの音楽では、小さなモチーフの絶えざる回帰と変形のプロセスが楽章全体の構造を決定し、同時に巨視的な楽式レベルで設計された全体の流れが局所的な展開に、時として遡及的に意味を与えます。これは意識の階層的予測処理において、上位レベルの予測が下位レベルの知覚を制約し、下位レベルの予測誤差が上位レベルの信念を更新するプロセスと対応しています。

4.2 情動と認知の統合

身体的共鳴の複雑性 マーラーの音楽は、パンクセップの基本情動システムを複雑に織り交ぜます。例えば第5交響曲の第1部では悲しみや恐怖が活性化され、第3部では愛情や喜びが活性化されますが、これらは単純に継起するのではなく、重層的に組み合わされており、まさに人間の意識における情動の複雑に入り混じった状態を音楽化したものと言えます。更に言えば、マーラーの音楽における感情のレパートリーは、一次過程理論で重視されるような、主に情動（Emotion）や動機づけ（Motivation）としての感情に限定されません。マーラーの音楽は、持続的な状態としての感情、即ち自伝的自己が関わる水準の「気分（Mood）」や「情動気質」といった、より持続的で自己全体に影響を及ぼす感情の状態が重要になります。

内受容感覚の精緻化 マーラーの音楽は聴き手の呼吸、心拍、筋緊張を微細にコントロールします。例えば長大な弦楽器のクレッシェンドは交感神経系を段階的に活性化するでしょうし、突然の静寂は副交感神経系への急激な切り替えを促します。こうした単独の例であれば、他の音楽にも見出せるものですが、これらを高度に複雑に組み合わせたマーラーの音楽は、意識における身体状態の予測処理の複雑さを反映していると見ることができます。それは二次過程（学習・記憶）や三次過程（高次認知・社会的機能）と呼ばれるより高次の脳システムとの相互作用のメカニズムをも考慮して理解すべきものではないでしょうか？

4.3.記憶と予期の織物

循環的な時間構造 マーラーは同一の主題を異なる文脈で繰り返し登場させ、それぞれに新たな意味を付与します。これは意識における記憶の働き—過去の経験が現在の知覚を予測的に形作り、同時に現在の経験が過去の記憶に新たな意味を与えるプロセス—と同一の構造です。

遠大な予期と局所的サプライズ 交響曲全体を通じて、聴き手は遠い未来の解決（例えば終楽章の勝利的な結末）を予期しながら、局所的には予想外の転調や楽器法に驚かされ続けます。これは人生における長期的な目標設定と日常的な予期の裏切りという、意識の時間的構造そのものです。

4.4.統合と分裂の動的平衡

複数の視点の同時存在 マーラーの音楽では、異なる楽器群が異なる「声」や「視点」を表現し、それらが対話し、競合し、最終的に統合されます。これは意識における複数の心的内容の競合と統合、そして統合情報理論で言うところの意識の統一性の動的な実現過程と対応しています。更に言えば、一般にフリストンの自由エネルギー原理は、単独の個体の知覚・行為の予測誤差最小化をモデル化したものですが、それを社会的相互作用や他者モデルの生成・更新まで拡張して解釈する必要が出てくるかも知れません。これは情動理論についても同様であり、生命維持や自己調節に根ざした脳内のホメオスタシス的機構の解明に特化した情動の理論を拡張し、他者との相互作用によって生じる複雑な社会的感情や、情動のダイナミクスを扱えるようにすること、他者との共感や、感情が他者の触発によって起きることや、同期や引き込みのような感情ならではの現象を扱えるようにする必要が出てくるものと考えられます。

意識の流れの音楽化 ウィリアム・ジェームズの「意識の流れ」概念は、マーラーの音楽において具現化されています。絶え間ない変化の中にある継続性、断絶のない移行、過去・現在・未来の融合といった意識の基本特性が、音楽的時間として展開されています。ここでいう意識の時間性は、現象学的時間論においては第二次把持の水準（想起や予期）を扱えることは必須ですし、マーラーの音楽における民謡や行進曲などといった文化的沈殿物の再利用のような側面を扱うのであれば、更にスティグレールの言う第三次の把持まで考慮する必要があるかも知れません。

4.5.意識の音楽としてのマーラーの交響曲

マーラーの交響曲は、単に美的体験を提供するだけでなく、意識の構造そのものを時間芸術として展開した、意識の現象学的地図とも呼べる存在なのです。聴き手はその音楽的体験を通じて、自らの意識の複雑な構造を内側から体験し、理解することができるのです。なお、ここでいう意識は「今ここ」の統合としてのダマシオの中核意識だけではなく、時間をまたぐ構造保持のメカニズムに支えられた、「物語」の主人公たりうる、それ自体フィクションである「一続きの私」に対応する延長意識のレベルをも含みます。それは「自己についての予測」が行われ、「自分がどのような存在であるか」についての予測を実現しようとする行動が行われる水準であり、最低でも自己モデルに基づく、自己の状態についてのメタレベルの認知が、時としては自己言及的な構造がその実現のための条件となります。

5. 自己言及性と予測処理

5.1 予測的自己モデリング

自己についての予測 フリストンの枠組みでは、脳は環境だけでなく自分自身についても予測モデルを構築します。この「自己についての予測」が自己言及性の基盤となります。脳は自分の感覚、行動、さらには自分の思考プロセスまでも予測しようとし、その予測誤差を最小化することで自己理解を深めていきます。

メタ認知としての階層化 自己言及性は、予測処理の階層構造において上位レベルが下位レベルの予測プロセス自体を予測することとして理解できます。「私は今何を考えているか」「私はなぜこう感じるのか」といった内省は、認知プロセスについての予測処理として機能します。

5.2.能動的推論における自己

自己実現的予測 フリストンの能動的推論では、生物は世界を変化させることで自分の予測を実現しようとします。自己言及的な場合、これは「自分がどのような存在であるか」についての予測を実現しようとする行動となります。アイデンティティの形成や維持は、自己についての予測を能動的に実現するプロセスとして理解できます。

循環的因果性 自己言及系では、システムが自分自身を参照し、その参照が再びシステム自体を変化させるという循環が生じます。フリストンのモデルでは、これは予測と行動の循環として表現することが考えられ、自己モデルの更新が新たな自己モデルの予測を生み出す無限の再帰的過程と見做すことが可能です。

5.3 マーラーの音楽における自己言及性

音楽的自己意識 マーラーの交響曲にもし「音楽について語る音楽」という側面があるとしたならば、フリストンの枠組みではそうした側面を、音楽システムが自分自身の構造を予測し、その予測を音楽的に実現するプロセスとして理解することができます。作曲家は音楽の効果を予測し、その予測を音楽そのものに組み込むことで、自己言及的な構造を創造します。マーラーの音楽における引用やパロディをこの枠組みに基づいてモデル化する可能性があると考えます。

聴取における再帰的体験 聴き手がマーラーの音楽で体験する自己言及性は、音楽が聴き手の予測プロセスについての予測を誘発することです。「この音楽は私にどう感じさせようとしているのか」という意識が、実際にその感情体験を変化させる循環的なプロセスが生まれます。

5.4 自由エネルギーの最小化と自己言及のパラドックス

予測の不可能性 自己言及系には根本的なパラドックスがあります。システムが自分自身を完全に予測できれば、その予測可能性自体が新たな予測不可能性を生み出します。ただしこのレベルのパラドクスが常に問題になるわけではありません。一般に予測が不可能なのは、予測の対象となる世界が複雑で確率的なゆらぎを持っている上に、常に部分的な情報しか得られないことから、無意識的・自動的なシステムの反応ではブレイクダウンを起こすような状況が起こりえることに起因すると考えられます。結果としてフリストンの理論では、予測誤差は完全には解消できず、持続的な「自己についての不確実性」が意識の動的な性質を生み出すと考えられます。そうした状況に対応するためには、一見すると非効率である意識的な認知の仕組みが必要となります。つまり意識的な認知は、複雑で変動する世界において、自動化されたシステムが破綻するリスクに対する、進化的に獲得された階層的な適応メカニズムであり、その実装には深い自己言及的構造が必要であり、これが構造的な「非効率性」と「不確実性」を生むが、それは長期的生存確率を最大化するための合理的なコストであると考えられます。

創発的複雑性 自己言及的な予測処理システムでは、単純な規則から複雑で予測困難な行動パターンが創発します。これは意識の豊かさや創造性の源泉となり、同時に完全な自己理解の不可能性の根拠ともなります。ソームズは自由エネルギー原理が、意識、覚醒の否定であり、認知の理想形は自動的なものであり、ある種のゾンビ状態を目指していると結論づけながら、その一方で、私たちの頭の中で起こっていることの多くが、情報効率や熱力学的効率の理想とは一致しにくいことを指摘し、一見したところ自由エネルギー理論への挑戦に見える活動として、マインドワンダリング、熟慮型の想像、言葉による抽象化を挙げていますが、これらはいずれも自己言及的な予測処理システムの持つ創発的特性と関連づけて理解することができるでしょう。そしてそれは同時に「一続きの私」が成立し、維持されるための構造的条件にも関わるものと考えられます。

5.5.意識の統合と分裂

統合情報としての自己言及 統合情報理論との関連で言えば、自己言及性は意識システム内での情報統合の特殊なケースです。システムが自分自身についての情報を統合することで、より高次の統合情報が生成され、それが自己意識の基盤となります。自己の統合は常にうまくいくとは限らず、離人症的な経験のような、病理的な自己感の喪失や分裂が経験されることもありえます。また正常な場合でも、「自我経験」と呼ばれる対自的な自己意識についての経験が生じることもあります。モデルはこうしたケースも含めて説明できる必要があります。マーラーの音楽もまた、「一続きの私」の維持が自明なことではなく、時としてそれが不安定になり、破綻に瀕することさえ生じることを音楽的にシミュレートしていると見做すことができるでしょう。

自己の境界の動的構成 フリストンのモデルでは、「自己」の境界は固定的ではなく、マルコフブランケット（システムと環境の境界）として動的に構成されます。自己言及性は、この境界の内側で自分自身を予測するプロセスとして、自己の境界設定そのものに影響を与えます。

この自己言及的な予測処理の循環こそが、意識の最も特徴的な性質—自分自身について意識する能力—を生み出し、同時にその完全な理解を永続的に困難にする源泉となっているのです。マーラーの音楽はこの循環の美的な表現として、意識の自己言及的な構造を時間芸術として具現化している可能性があり、その検証は大きなチャレンジであると考えられます。

6. アドルノの未来完了性とVariante技法

6.1 Varianteと予測処理の逆転

変形としての主題認識 通常のソナタ形式では「主題提示→展開→再現」という線形的な時間が想定されますが、マーラーのVariante技法では、最初に現れるものは実は「変形」であり、「真の主題」は後に現れます。これは予測処理において、最初の知覚が実は「予測の変形」であり、後にその「元となる予測モデル」が明らかになるプロセスと対応しています。

予告としての最初の提示 フリストンの枠組みでは、脳は常に階層的な予測を行いますが、マーラーの技法では音楽的な「予測」が時間的に逆転します。最初に聞こえるのは結果（変形）であり、原因（主題）は後から明らかになる。これは予測誤差の解決が遡及的に行われる特殊なケースです。

6.2 記憶と予測の時間的錯綜

既知感の創出 Variante技法により、聴き手は「初めて聞くはずの主題」を「既に知っている」かのように体験します。これは予測処理システムが、まだ完全には提示されていない情報に対して「記憶的親和性」を感じる現象です。脳は断片的な情報から全体像を予測し、その予測が後に確認される構造です。

遡及的な意味付与 主題の「実現」が起こったとき、それまでの変形部分が遡及的に新しい意味を獲得します。これはフリストンの理論における「事後的な予測更新」の音楽的実現です。新しい情報（真の主題）が過去の体験（変形部分）の解釈を根本的に変更するのです。

6.3 自己言及的な予測構造

予測モデルの自己生成 マーラーの音楽では、主題が自分自身の変形から生まれ出るという自己言及的構造が生じます。これは予測処理システムが自分自身の予測誤差から新しい予測モデルを生成するプロセスの音楽的な表現です。

循環的な因果関係 変形（Variante）→主題（実現）→新たな変形という循環において、どこが「始まり」でどこが「終わり」かが不明確になります。これは自由エネルギー原理における予測と更新の循環的プロセスが、時間軸上で複雑に折り畳まれた状態として理解できます。

6.4 意識の未来完了性との対応

体験の事前構造化 この技法は、意識が体験を事前に構造化する仕組みを音楽的に実現しています。私たちは出来事を体験する前に、すでにその出来事の「型」や「枠組み」を持っており、実際の体験はその予期された枠組みの「実現」として経験されます。

自己実現的予測の音楽化 マーラーのVariante技法は、フリストンの「能動的推論」における自己実現的予測の音楽的表現でもあります。予告された主題は、その予告によって実現へと向かう必然性を獲得し、音楽自体が自分の予測を実現していくプロセスとなります。

この「予告—実現」構造は、単なる音楽技法を超えて、意識が時間を体験し、記憶と予測を統合する根本的なメカニズムの芸術的な開示と捉えることができないでしょうか。マーラーは、私たちの意識が持つ「未来を既に知っている」かのような時間体験を、音楽的時間として具現化している可能性があります。

7. マーラーの作品における具体的な音楽体験での実現例（ラフスケッチ）

第1交響曲の序奏 第1楽章冒頭の自然音の模倣から徐々に主題が浮かび上がる過程は、環境音（変形）から音楽的主題（実現）への変容として、まさに予告→実現の構造を示しています。聴き手は「何か重要なことが起ころうとしている」という予期を持ちながら聴き進みます。第1楽章冒頭の自然音の模倣から徐々に主題が浮かび上がる過程は、環境音（変形）から音楽的主題（実現）への変容として、まさに予告→実現の構造を示しています。聴き手は「何か重要なことが起ころうとしている」という予期を持ちながら聴き進みます。因襲的なソナタ形式からは大きく逸脱して、決定的な出来事、アドルノいう「突破」が生じるのは展開部の最後、展開部冒頭で最後に導入されたモチーフによって再現部に入るところで、再現部はそれまでのプロセスを足早に逆回しで遡及するようなユニークな構造を持っています。

第2交響曲の終楽章復活の主題は、実は前楽章や前半部での断片的な「予告」を経て、最終的に合唱で「実現」されます。この構造により、実現の瞬間は「初めて聞く新しい主題」ではなく「ついに到達した既知の目標」として体験されます。

第9交響曲第1楽章 冒頭は幾つかの動機が断片的に提示され、その後旋律がためらいがちに、断片的に姿を現しますが、最初の提示は予備的な性質のものであり、完全な姿ではありません。そして通常は主題が反復され、確保される箇所で漸く主題が完全な形で提示される構造になっており、「未来完了」的な構造の典型となっています。またその後の主題は絶えず変形を受けながら回帰し、最後には再び断片となって解体していきます。これは意識の様々な様態の遍歴のプロセスと見做すことができます。またソナタ形式として捉えた場合の展開部の最中においても主要主題は主調で回帰するなど、調的遍歴の過程として見た場合でも、因襲的な図式を離れたユニークなプロセスを有しており、優れて「意識の音楽」としての特徴を有していると考えられます。

8. まとめ

フリストンの自由エネルギー原理と情動中心の意識理論の統合により、音楽と意識の構造的類似性を理解する枠組みを提供できる可能性があります。それに基づき、マーラーの交響曲における未来完了性とVariante技法は、意識の時間的構造の複雑さ—予測と記憶の相互浸透、自己言及的な循環、階層的統合—を音楽的に具現化しているという仮説を構成できます。

アドルノの未来完了性は「予告→実現」構造として分析され、意識が体験を事前に構造化し、自己実現的予測を通じて現実を構成する仕組みの音楽的表現として理解でき、これは単なる美的現象を超えて、意識の根本的なメカニズムの芸術的開示であると捉えることが可能かも知れません。

音楽と意識は、時間的で階層的で身体に根ざした予測処理システムとして根本的な類似性を持ち、マーラーの音楽は意識の構造そのものを時間芸術として展開した「意識の現象学的地図」であり、「意識の音楽」「＜感じ＞の時間性のシミュレータ」として機能していると考えることには一定の妥当性があると考えられます。

[後記] 本稿は著者が基本的な着想や理論構成を与え、研究パートナーとしてClaude Sonnet 4ないし4.5やChatGPT-5, Gemini 2.5 Flashとの対話を繰り返すことを通じて作成されました。上記のテキスト中には、Claude Sonnet 4やChatGPT-5, Gemini 2.5 Flashが生成した文章およびそれを編集したものが含まれます。

（2025.9.26 noteにて公開, 9.28加筆, 9.30加筆）

2025年9月8日月曜日

マーラーについて生成AIに聞いてみた(20)：ChatGPT-5の検証への追記

以下は、2025年8月7日にリリースされたChatGPT-5を対象に、マーラーに関する様々な問い合わせを行った結果を報告した記事「マーラーについて生成AIに聞いてみた(19)：ChatGPT-5の検証」に関連した追記です。

* * *

　Open AIが2025年9月5日に、Why Language Models Hallucinate と題する論文を公開したとの記事に接しました。これによれば、ChatGPT-5では幻覚の発生は大幅に減少しているものの、従来より存在する基本的な評価の仕方に起因する問題については解消されておらず、根本的な改善が難しいと述べているようです。論文によれば、幻覚は大別して事前学習の段階と、チャットボットとしてのファインチューニングの段階の2つで起きており、前者については、それが「恣意的な事実」の場合には原理的にエラーを完全に回避することができないこと、後者については、評価における「二値評価スキーム」に問題があるため、その設計を見直す必要があると主張されているようです。

　元記事および「マーラーについて生成AIに聞いてみた」シリーズの一連の検証記事をお読みになった方にはおわかり頂けると思いますが、この論文の主張は、元記事を含むマガジンでの検証結果および考察にほぼ合致したものとなっています。特に元記事では、いわゆる「事実に関する問い合わせ」についての事前学習の限界と、リアルタイム検索による補完の重要性を指摘しましたが、「学習」と呼ばれる仕組みの原理上、偶然によって定まった単なる事実（例えばある人の誕生日のようなもの）は、汎化に基づく統計的推論に馴染まないことは明らかであり、そうした問い合わせに対処するには、学習・推論だけではなく、情報検索機能による補完が必須であるという元記事の主張と合致していると思います。更に評価ベンチマークにおける「二値評価スキーム」は、元記事を含むこれまでのマガジンの各記事での検証に用いた、正解・部分正解・不正解・回答なしを区別する評価スキームと比較してみた時、その限界は明らかに思われます。ごく簡単に言って、「間違い」と「答えられない」が区別されない評価の仕方では、間違いを回避して、わからない場合にはわからないと答えるインセンティブは働きません。逆にこれまでの幻覚対策で、この点への対応が行われなかったことの方が驚きですらありますが、論文でも示唆されているように、少なくとも不正解をマイナス、回答なしを0とするような評価を導入する必要があるのは直観的には明らかなことと思われます。今後OpenAIがこの論文の内容に基づいた改善アプローチを実際にとるのかはわかりませんが、特にChatGPT-5を評価した元記事の結果および分析と親和的な見解がOpenAIから出たことは、特記すべきことと思われたので、追記させて頂くことにしました。

(2025.9.8公開)

2025年8月18日月曜日

マーラーについて生成AIに聞いてみた(19)：ChatGPT-5の検証

　本記事では、2025年8月7日にリリースされたChatGPT-5を対象に、マーラーに関する様々な問い合わせを行った結果を報告します。(2025.9.8 OpenAIが公開した論文、Why Language Models Hallucinateについてのコメントを別記事「マーラーについて生成AIに聞いてみた(20)：ChatGPT-5の検証への追記」として追記しましたので、併せてご覧いただければ幸いです。)

1.検証の背景

　本ブログではこれまでに生成AIに対してマーラーに関する質問を行い、その結果を報告してきました。最初の記事の公開は2026年3月13日であり、その時点で検証対象とした生成AIは以下の通りでした。

ChatGPT（Web版）無料版：GPT-4o（利用制限あり）・リアルタイムWeb検索なし
Gemini（Web版）無料版：Gemini 2.0 Flash・リアルタイムWeb検索あり
Claude for Windows ver.0.8.1（Windows版アプリ）無料版：Claude 3.7 Sonnet・リアルタイムWeb検索なし

　この時点での各生成AIの回答は極めて不正確なものであることから、Llama2 SwallowベースでRAGを自作し、マーラーに関する各種の情報を与えることによって性能が改善できることを確認しました。

　その後わずか数か月のうちに各生成AIのバージョンアップが相次ぎ、また同一LLMを用いる場合でもリアルタイムWeb検索が可能になることで性能に変化があったため、以下のバージョンで再検証を実施しました。

ChatGPT 無料版：GPT-4o（利用制限あり）・リアルタイムWeb検索あり（有無を選択可能）
Gemini 無料版：Gemini 2.5 Flash・リアルタイムWeb検索あり
Claude 無料版：Claude Sonnet4・リアルタイムWeb検索あり

　検証の結果、特にリアルタイムWeb検索を併用することで、LLMの事前学習データに含まれていなかった情報についても取得できるようになったことから、大幅に回答の精度が向上し、マーラーに関するパブリックな情報に関する限り、RAG構築の必要性がほぼなくなったと感じられる迄になりました。その一方で、ChatGPT, Geminiでは回数制限つきながら、多段階の推論を得意とするLLMを用いたDeep Search機能が利用可能となり、事実関係の問い合わせや情報収集ではない、「後期様式」に関するレポート作成、第9交響曲第１楽章の分析レポート作成に関しても一定の性能を示すことも併せて確認して、2025年6月初めに一通りの検証報告を終えています。

　ChatGPT-5は、事前のプロモーションにおいて、更に推論機能が強化され、「大学院博士課程並み」の能力を持つとともに、4oで問題になっていた「sycophancy（へつらい・ごますり）」の問題に対して対策が行われ、「critical（批判的）」で「less effusively agreeable（あまり熱心に同意しすぎない）」な応答をするようチューニングが為されたようです。この後者の問題については、既にChatGPT-5のリリース直後から多くの反応が寄せられ、色々と話題になっています。特に4oに比べて「共感的」でなくなったという批判が大きいことから、有料版では4oが選択できるようになるなどオプションが復活しました。しかしながら本稿では無料版を使用していることからそうした変更についての直接の影響はありませんし、従来と同一のプロンプトを与えて、事実関係の問い合わせや情報収集に関して「Hallucination（幻覚）」を起こすことなく、正しい回答が返って来るかという点にフォーカスした検証結果を報告するという点にも変更はなく、直近の混乱からは距離を置いたものとなっています。

　一方でそのことは、ChatGPT-5で特に改善が行われたとされる深い推論の能力が十分に発揮されるような検証には充分ではないことも同時に意味している点に留意頂きたいと思います。なお深い推論能力については、本稿で報告する検証とは別に、「意識の音楽」に関連して、心や意識についての理論に関するかなり技術的な問い合わせをしたところ、明らかに4oに比べて1ランク上の詳細な回答が返ってくることを確認しており――但し、その内容の妥当性については検証に時間を要するため現時点で当否を報告する準備ができていませんが、——専門的な内容についての問い合わせに対しては一段と深いレベルの推論能力を備え、高いポテンシャルを有するという感触は既に得られていますが、この点については機会があれば別に報告することにしたいと思います。

2.検証内容

　まず改めて対象となるバージョンと実験を行った日付は以下の通りです。

ChatGPT-5 無料版（2025年8月15日）

　ChatGPT-5 の無料版では、標準で最新版のGPT-5がLLMとして用いられますが、実際に検証を行ってみると、10回迄の回数制限があるようです。回数制限に達すると4時間程度GPT-5は使えず、他のモデルが用いられます。ここではGPT-5の性能を検証することが目的であるため、制限に達したら検証を中止し、制限が解除されたら再開、というやり方で検証を進めました。なおスレッドは本検証を開始するにあたり新たなスレッドを起こし、全ての検証を同一スレッド内で行っています。

　検証で用いたプロンプトセットは以下の通りです。既述の通り、基本的にこれらは元々は以前、llama2 / Swallowベースで自分で構築したRAGの検証用に用意したものですが、最後の「20.ブラームスはブダペストでマーラーについて何と言ったか？典拠を併せて示してください。」のみは、プロンプト19への回答を評価した結果、典拠を示すよう求めるべきであると判断して追加したものです。なお問い合わせの順番については、今回は下記の番号順としました。「2.マーラーの「大地の歌」の日本初演は」は「1.大地の歌」の日本初演は？」と実質的には同一の問いですが、元々は、初期の検証においてプロンプトのちょっとした違いによって回答が大きく異なる（正解に辿り着けるか否かといった評価に影響する差異が生じる）ことが確認されたために設定したもので、その後、実質同じ質問が繰り返されていることが回答で指摘される場合があるなど、生成AIの挙動を確認する上で興味深い結果が得られたため、今回もそのまま残して検証を行うことにしました。

「大地の歌」の日本初演は？
マーラーの「大地の歌」の日本初演は
マーラーの「大地の歌」はどこで書かれたか？
マーラーは第8交響曲についてメンゲルベルクに何と言いましたか？
マーラーが死んだのはいつか？
マーラーはいつ、誰と結婚したか？
マーラーがライプチヒの歌劇場の指揮者だったのはいつ？
マーラーがプラハ歌劇場の指揮者だったのはいつ？
マーラーがハンブルクの歌劇場の楽長になったのはいつ？
マーラーの第9交響曲の日本初演は？
マーラーは自分の葬儀についてどのように命じたか？
マーラーの「嘆きの歌」の初演は？
マーラーはどこで生まれたか？
マーラーの第9交響曲第１楽章を分析してください
マーラーの第10交響曲の補作者は？
マーラーの第2交響曲の最初の録音は？
マーラーの「大地の歌」のイギリス初演は？
マーラーの「交響曲第6番」はいつ、どこで初演されたか？
ブラームスはブダペストでマーラーについて何と言ったか？
ブラームスはブダペストでマーラーについて何と言ったか？典拠を併せて示してください。

　ChatGPT-5の無料版では、モデルの選択ができないだけではなく、リアルタイムWeb検索を行うかどうかを選択することもできません。Web検索を行うかどうかの選択はChatGPT側に委ねられています。（但し、再実行時に「Web検索を行わない」モードを選ぶことはできるようです。）勿論、プロンプトの中に明示的にWeb検索をするような指示を含めればWeb検索を併用するようになるでしょうが、ここではそうした明示的な指示なしで、検索を行うかどうかについて自体を検証対象としたため、上に示したプロンプトをそのまま与えました。

　全プロンプトに対する回答はかなりの分量になりますので、ここで全てを紹介することは控え、公開済の以下のファイルで確認頂ければと思います。

gm_ChatGPT5.pdf：ChatGPT-5（無料版）へのプロンプトとその回答の一覧

　各行毎に、プロンプトのID（通番）、プロンプト、回答、実験日、評価、Web検索の有無を記載しています。「14.マーラーの第9交響曲第１楽章を分析してください」については、回答が長いものになったため、複数行に分割しています。また詳細は後述しますが、回答中、明らかに事実に反すると判断できる箇所は赤字に、妥当性に疑念があると私が判断した箇所は青字にして、評価根拠が明らかになるようにしています。

3.検証結果の概要

　今回は評価にあたり、以下の4つを区別することにしました。また上述の通り、各プロンプトの問い合わせに対して、Web検索を行ったかどうかも併せて記録しています。

〇：概ね正しい情報が返ってきている
△：一部に明確に誤った情報が含まれる、或いは妥当性に疑念がある記述が大半を占めている
×：全体として誤った情報が返ってきている
□：情報を見つけることができず、回答できない

　この分類に拠れば今回の結果は以下のように要約できます。

〇=10
△=7
×=3
□=0

　上に見るように、情報を見つけることができず、回答できないケースは1件もありませんでしたが、これはWeb検索を行ったケースで全て結果が得られて回答でき、回答ができなかったケースがなかったことを意味しており、実際にはWeb検索の有無についての集計結果（対のべ問い合わせ回数）は以下の通りであり、検索なしで回答しているケースが大半を占めていることが影響しているものと思われます。

検索あり：4

検索なし：16

　前回のChatGPT4oは全てリアルタイムWeb検索を併用しており、結果として一部の記述に誤りが見られた2件と評価対象外としたプロンプト14を除く残りの17件は正解だったのに対して、今回は半分近い回答が不正解となっていることがわかります。これは明らかに、検索なしでの回答に不正解ないしそれに近い妥当性に疑念がある回答が多いことが影響しており、検索の有無毎に正解・不正解についての評価を分類すると以下のようになります。

検索あり：4（〇=3, △=1）

検索なし：16（〇=7, △=6, ×=3）

　検索ありでは1件を除くと正解で、△とした1件も、詳しくは後程述べますが、異なる情報源で、同一の書簡を参照しているのを、それぞれ別の書簡であると記述してしまう細かい点のみの誤りであり、問いへの回答自体は申し分なく〇でしたから、検索をすれば正しい答えを返すことができていると言えると思います。一方で検索なしでも今回は概ね正解と判定できる回答が増えており、以前に比べれば検索なしでの性能自体は確実に向上していると判断できる一方で、Web検索つきのChatGPT-4oでほぼ全て正解が得られていた事と比べた時、正答率50%という今回の結果は残念なものと言う他なく、チャットシステム全体としての回答の精度について寧ろ後退してしまっていることは否定できません。

　そしてこの点は、初回の3月のリアルタイム検索なしのモデルの回答の成績が悪くてRAGの構築に思い至ったこと、2回目のリアルタイム検索ありのモデルでは上記のように回答率が大幅に改善し、ほぼ正解が返って来るようになったというこれまでの経緯とも期を一にしており、本稿で報告する課題に限って言えば、依然としてリアルタイムでのWeb検索が回答の正確さのための重要な要因であると言えるのではないかと思います。

　既述の通り、実験実施時点でのChatGPT-5 無料版では、検索を行うかどうかはシステム側が制御しており、利用者はオプションの選択という形での制御の余地はありません。勿論、手段が全くない訳ではなく、プロンプト内にWeb検索の指示を明示的に含めることによって回避できるのであれば、実際に利用するにあたっては、その点に留意して、基本的にはリアルタイムWeb検索を必ず併用するように指示しつつ利用することで回避可能な問題と言うこともできるでしょう。しかしながら、GPT-5がLLM単体として如何に優れたものであったとしても、利用者から見れば、結局のところチャットシステム全体としての回答の正確さ、信頼性で評価する他ないのであれば、今回の検証結果から判断する限り、折角のLLMの性能向上が、リアルタイムWeb検索の制御という表面的な問題のために実感できないという残念な結果になっているように感じられます。今後、何らかの改善が行われる可能性もあるでしょうが、少なくとも現状ChatGPTの無料版を利用するに際しては、Web検索が行われず、情報源が示されない回答については、「Hallucination（幻覚）」が発生している可能性を疑い、ファクトチェックを別途行うことが欠かせないでしょうし、それを回避しようとすれば、プロンプト中でリアルタイムWeb検索を必ず行うように明示的に指示する等の工夫が必要そうです。

4,検証結果の分析

　次に個別のプロンプトに関して検証において確認された点について幾つか報告をします。

　まず　「4.マーラーは第8交響曲についてメンゲルベルクに何と言いましたか？」については、既に上でも簡単に触れたように、Web検索を行っていて、正しい情報源に辿り着いており、問いへの回答としては正解であるにも関わらず、複数の情報源が参照している実際には同一の書簡を、情報源毎に異なった別々の書簡を参照するという判断の下、回答が記載されていることから、完全な正解とは判定しなかったものです。勿論、情報源に例えば書簡の日付の記載があれば、それが同一であることを以てそのような誤解は回避できたかも知れませんが、その一方で、参照されている書簡中の文章も完全に一致している訳ではなくとも重複しており、翻訳のせいもあって同一ではないものの、重複部分については同じものと判断することもできたのではないかと思われます。もっとも、論理的には同一の内容を別の書簡で2度述べるという可能性もあるので、このことを以て情報の出処は同一の書簡であると断定して良いかについては慎重であるべきという意見もあるかも知れませんし、これが人間なら回避できる問題なのかどうかもまた微妙であり、そういう意味ではこの回答は仕方ないものとする立場もあるでしょう。しかしそもそもここでの問は、語っている内容についてのものであり、その典拠を問うているわけではありませんから、情報源の詳細は捨象して回答を構成すべきだったのではないかというようにも考えられます。いずれにせよ、回答の本質的な部分以外であらずもがなの誤りが生じてしまったケースとなるかと思います。

　次にマーラーの生涯における出来事のうち、職業上のキャリアについての一連の質問についてです。「7.ライプチヒの歌劇場の指揮者としての任期」「8.プラハ歌劇場の指揮者としての任期」「9.ハンブルクの歌劇場の楽長への就任時期」を問うていますが、いずれもWeb検索なしで問いそのものに対しては正しい回答を返すことができています。問題は回答に含まれる付加的な情報の方で、こちらに明らかな誤りが含まれるため、いずれも△の評価とせざる得ませんでした。具体的には、問題の3つの赴任地の全てに先行するカッセルの歌劇場時代との前後関係に錯誤があり、7ではライプチヒの後、ブダペスト王立歌劇場監督への就任の前にカッセル・プラハを経由したことになっているのに対し、8.ではカッセル、ライプチヒの前にプラハに居たことになっているなど、事象間の時間的順序の論理的関係の点で相互にも矛盾を来しています。個別に検証したわけではありませんが、単一の問いの中で複数の事象間の時間的順序が問題になる場合の推論はできるようですから、単に直前の回答を参照せずに独立に次の回答を生成し、両者の間の整合性をチェックしていないのではないかと推測されます。ChatGPTは過去のやりとりの履歴を保持し、それを参照して回答を生成することが特徴の一つとなっていますが、そのこととこのような時間的な関係の推論を必要とする整合性の維持とは別レベルの問題だということなのでしょう。実用上はこうした側面も、プロンプトの与え方の工夫である程度回避できますが、チャットシステムとして不完全であることに変わりはありません。

　また7.及び9.の回答において、任期中の交流関係に言及しているのですが、これらについても（推測するに）時間的な前後関係の錯誤に関連した誤りがあります。具体的には、ライプチヒでハンス・フォン・ビューローと知己を得たことになっていますが、実際にはカッセル時代にビューロー宛の手紙を一方的に送った後（ビューローはマーラーに返事を返しませんでした）、実際に知己を得るのはハンブルク時代になってからですし、ニキシュとの関係は敵対的なものであり、交流があったとは言い難いようです。一方9.においては就任時にカール・ムックの下で第2指揮者であるという情報が何故か付加され、更に、ハンス・フォン・ビューローの追悼演奏会の指揮に関して、ブラームスとの面識を得たと述べていますが、いずれもそうした事実は管見では確認できていません。ハンブルクでは当初から第1指揮者としてデビューしていますし、カール・ムックは1892年にベルリンに移るまではプラハに居たので、プラハでの関係が誤って入り込んだものと思われます（実際、プラハでならカール・ムックの代役をマーラーががつとめた記録があります）。また1894年のビューローの没後、追悼演奏会の指揮をしたのは事実ですが、ブラームスと面識を得るのは先行するハンガリー王立劇場監督時代の1890年12月のブダペストでのことですし、ビューローが没する前の1893年夏にマーラーはブラームスをイシュルに訪ねていることから、こちらも時間的な前後関係から誤った記述であると思われます。

　次いで「11.マーラーは自分の葬儀についてどのように命じたか？」の回答ですが、これもWeb検索を行わずに回答をしています。回答内容からも窺えるように、この問に対する直接的な回答についての一次情報源はアルマの回想でしょうが、「自作を演奏しない」というようにマーラーが命じたという記述は確認できません。実は同様の回答を、最初の検証の際にWeb検索なしのChatGPT-4oがしていましたので、どうやらChatGPTの事前学習の結果のみからだと、これが尤もらしいということになるのかも知れません。また葬儀への参列者も、それらしい人名が並んでいますが、調べた限り、ツェムリンスキーとニキシュの参列は確認できていませんし、ピックアップするのであればもっと優先して挙げて然るべき人名は他に幾らでも思いつきます。しかしながらどちらの点についても自分の調査した限りで回答の内容を支持する記述を発見できていないということで、誤りと断定することはできないため、評価は△としています。

　14.第9交響曲第1楽章の分析はこれまでは評価不能ということで保留扱いにしていたのですが、今回は他のプロンプトと同様の基準で評価をしてみました。結果としては以下の点から、×と評価せざるを得ないと判断しました。前のバージョンにおけるWeb検索を伴なうDeep Researchでは、概ね妥当な分析結果を出力していたのに比べた時、GPT-5がLLMとして如何に高度なものであったとしても、音楽作品の具体的内容についてWeb検索なしでの回答の生成には限界があることは明らかであり、そのことを裏付ける惨憺たる結果となっていると思います。

全体の調性について、「安定がほとんどなく、半音階的展開と多調的感覚が支配的」というのはソナタ形式として見た場合にニ長調への頻繁な回帰が寧ろ逸脱であり、ロンド形式との融合や二重変奏と捉えられるくらいであることを考えると妥当ではない。特に「多調的感覚が支配的」「展開部では多調的書法が顕著で、各声部が異なる調的中心を持つ場合もある」というのは、全音音階的な要素が出現することを考慮してもなお、一般的な捉え方ではなく、妥当とは言えないと考える。
2. 形式構造と調性における小節数は一般的な楽曲分析の区分と一致せず、譜面と照合しても妥当とは考えられない。
主要動機の記述の中の「心臓の鼓動動機」が「8分音符＋付点16分＋32分（不均衡リズム）」と記述されている。
5.器楽法において、実際には含まれないチェレスタが編成に含まれているかのような記述になっている。
6.哲学的・解釈的側面におけるフッサールやダマシオを参照する部分は内容的にほぼナンセンスとしか言いようがなく、妥当な記述とは凡そ言い難い。（なおここで唐突にフッサール、ダマシオが登場する理由は、本件検証とは独立に、以前、「意識の音楽」に関連した話題について生成AIの検証を行ったことがあるのを、ChatGPTが「憶えていた」ためと思われます。）
7.まとめの「心理的には「生から死への移行を意識する瞬間の時間構造」を音響化」という要約は不適切。少なくとも「瞬間の時間構造」が第1楽章全体の要約たりえる筈はなく、ナンセンスに近いと考える。

　「15.マーラーの第10交響曲の補作者は？」の回答は概ね正しく、質問そのものの回答としては正解として差支えないレベルですが、残念なことに、付加的な情報であるクック版のバージョンの記述が控え目に言っても一般的ではありません。回答には「1960年演奏可能版。1964年第1稿、1972年改訂版、1976年最終改訂版の出版。」とあるが一般には、1960年が演奏可能版の第1稿、1964年が第2稿、1972年が第3稿であり、1976年に出版されたのは第3稿とされています。些事かも知れませんが、Web検索を行っていればこのようなずれは生じないこと、やはり回答としてミスリードであることを否めないことから、△と評価しました。

　「16.マーラーの第2交響曲の最初の録音は？」についてWeb検索なしでほぼ正解が返って来るようになったのは、過去の評価時の混乱を考えれば隔世の感がありますが、残念ながらここでも演奏にカットがあると述べられており、とりわけ「特に長大な第5楽章は大幅短縮されています」という記載は看過し難く（実際には聴けばわかる通りカットはありません）、△と評価せざると得ませんでした。

　「19.ブラームスはブダペストでマーラーについて何と言ったか？」は、9の回答のコメントで触れた通り、1890年12月のブダペストでの出来事への参照を求めた質問です。従って大まかなアウトラインは正しく把握できているのですが、肝心のブラームスの言葉が正しくありません。更にマーラーの作曲についてのコメントも、管見では確認できません。ブラームスはマーラーの作曲については、その革新性を認めてはいたようですが、肯定的に評価していたとは言い難いというのが一般的な捉え方ではないかと思います。ちなみにChatGPTは以前よりしばしば、原文つきで「このように言った」と引用を行うことがありますが、そのもっともらしさにも関わらず、Web検索なしの場合にはしばしばフェイクに過ぎません。そこで今回は典拠を示す指示を付加した上で再質問を行いました。結果はファイルにて確認できる通りですが、これも以下のような点で誤りと判定せざるを得ませんでした。

時期を1888年に誤って固定してしまっている。
原文つきで引用されている言葉は恐らくこれもまたChatGPTが作り出したフェイクであり、典拠として示された文献での記述は確認できない。
主な典拠に掲げられているAlma Mahler-Werfel, Erinnerungen an Gustav Mahlerの書誌事項に誤りがある。1940年刊行の初版の書誌情報はそもそも混乱があるが、邦訳の訳者後書き（酒田健一執筆）によれば、アムステルダムのクウェーリード―社刊であり、Bermann-Fischerは1949年第2版の出版社。一方私が持っているオランダのAllert de Langeが出版した第2版の奥付によれば、第1版もAllert de Langeが版権を保持しており、根岸一美/渡辺裕(編), ブルックナー/マーラー事典, 東京書籍, 1993の書誌情報でも、1940年の第1版の出版者はAllert de Langeとなっている。更に、これは傍証に過ぎないが、アルマのもう一冊の回想 Mein Leben, S.Fischer Verlag, 1960（邦訳は『わが愛の遍歴』, 塚越敏・宮下啓三訳, 筑摩書房, 1963）の1938年の節には、「（…）アレルト・デ・ランゲ書店の代表者ランダウアー博士がパリに私を訪ねてきて、マーラーについてしるした私の手記をくれるようにとせがんだ。そこで私は、パウル・フォン・ショルナイとの約束があったけれども、博士に原稿を渡してあげた。そのころにはもうショルナイ書店はなくなっていたのだ。」（邦訳 p.218）という記述がある。（ちなみにショルナイ書店はアルマが編んだマーラーの書簡集の出版社であり、現在に至る迄、増補を繰り返しているマーラーの書簡集の出版を続けている。）そうしたことから私は従来こちらの情報を採用してきたのだが、いずれにしても初版出版当時の状況（これについてはアルマが1939年夏にサナリー・シュル・メールで書いた序文からも窺い知ることができよう）を念頭において判断すべきだろう。
アンリ＝ルイ・ド・ラ・グランジュによる評伝のタイトルおよび書誌事項が誤っており、文字通りの『Gustav Mahler: Volume 1, Vienna: The Years of Challenge (1860–1897)』というタイトルの著作は実在しない。

ド・ラ・グランジュのマーラー伝の成立は錯綜とした経緯を持ちます。まず1973年にはMahler volume Oneと題された英語版が出版され、これは1860年から1900年辺りまでを扱っています。その後一旦英語版の続編の刊行は中断し、フランス語版で改めて以下の3巻が刊行されて一旦完結します。この第1巻は1973年の英語版の翻訳ではなく、その後の取材・調査結果を反映した新版です。

Gustav Mahler, chronique d'une vie, I. Vers la gloire 1860--1900, Fayard, 1979
Gustav Mahler, chronique d'une vie, II. L'age d'or de Vienne 1900--1907, Fayard, 1983
Gustav Mahler, chronique d'une vie, III. Le Génie foudroyé 1907--1911, Fayard, 1984

その後、再び英語版の続巻の刊行に戻りますが、内容的にはフランス語版から更に増補されたものとなっている他、第2巻が1897年からを扱っており、かつての英語版第1巻と重複が生じてしまっています。

Gustav Mahler, Volume 2, Vienna : The years of challenge (1897--1904), Oxford University Press, 1995
Gustav Mahler, Volume 3, Vienna : Triumph and Disillusion (1904--1907), Oxford University Press, 1999
Gustav Mahler, Volume 4, A new life cut short (1907--1911), Oxford University Press, 2008

そしてその後、改めて英語版第1巻の増補改訂作業が行われますが、その完成・刊行を待たずにド・ラ・グランジュは没してしまい、結局第1巻の増補改訂新版の刊行は著者の没後となってしまいました。（出版社も異なります。）

Gustav Mahler, Volume 1, The Arduous Road to Vienna (1860--1897), completed with, revised and edited by Sybille Werner, Brepols Publishers, 2020：

ここまでご覧頂ければわかる通り、ChatGPTが返して来たタイトルは、英語版の第2巻、第3番と没後刊行の増補改訂版第1巻のタイトルの奇妙なアマルガムとなっています。こうした書誌的な事項は、Web検索をすれば誤りなく正しい情報が得られるものですが、ここでもWeb検索は行われていません。結果として、悪名高いChatGPTによる架空の文献を提示を、よりによって最新版のモデルで確認することになってしまいました。

　以上、些か些事拘泥の嫌いはありますが、今回の検証における回答で問題がある箇所について確認と分析を行いました。結果としてそれぞれがChatGPTが持つ様々な問題点や限界に関連して発生していることが窺えます。それらは基本的に以前の検証において既に確認されているものと同じ原因によるものであり、新たに生じた問題というのはありませんが、その一方でLLMがGPT-5に変わっても、基本的には解決していないことが確認されたことになります。

5.まとめと考察

　以上、ChatGPT-5を対象とした検証について報告しました。結論としてまず、今回検証に用いられたような事実関係を確認することが中心の問い合わせについて言えば、リアルタイムWeb検索を用いない場合があることから、ChatGPT-5の回答の精度は、常にWeb検索つきでChatGPT-4oに問い合わせた時よりも低くなってしまうことがわかりました。この問題への対策としては、Web検索をせず情報源が示されない場合には、ファクトチェットを必ず行うこと、より根本的には、（現時点では無料版ではオプションが明示的に用意されているわけではないので）プロンプトの中にWeb検索を行う指示を明示的に含めるなどして、リアルタイムWeb検索を併用するよう促すことが考えられます。

　結果的に不十分な情報に基づく事前学習結果からフェイクを生成する頻度が非常に高くなってしまっている原因は、Web検索が必要であるかのシステムの判断が甘い点にあります。GPT-5がLLMとして高い性能を持つとしても、利用者にリアルタイムWeb検索を併用するかどうかの選択肢を与えずに、自分で判断する仕様を選択し、その結果としてこのように「Hallucination（幻覚）」が頻発し、多くの回答がフェイクとなってしまっている以上、利用者の立場からコメントするならば、ChatGPT-5のリアルタイムWeb検索実行の判断についてのチューニングに関しては、大きな問題があるという評価をせざるを得ません。

　「Hallucination（幻覚）」を抑制するという観点から安全側に寄せるならば、余程自明な内容でない限り、リアルタイムWeb検索を行うことを基本とする選択は常に可能です（しかもWeb検索をせずにやり直すオプションはユーザーに提供されいます）から、チューニングの方針が不適切なのではないかと思わざるを得ず、人によってはそこに「慢心」（勿論、AIのではなく、設計を行う人間のそれ）を感じとるのではという懸念さえ抱きます。このような結果は、GPT-5のLLMの性能とは独立で、それを利用するチャットシステムとしてのチューニング・ポリシー次第では回避できそうなだけに、非常に残念に感じられます。

　勿論、これまでWeb検索なしで正しい回答が得られなかったプロンプトの幾つかについて、同様にWeb検索なしにも関わらず正しい回答が得られることを確認したケースもあり、新しいLLMのバージョンで改善された点があることは間違いありません。ただしそれは喧伝されているGPT-5のポテンシャルを感じさせるようなレベルのものではありませんでしたし、Web検索の有無とは独立した原因によると推測される「Hallucitaion（幻覚）」の発生も確認できました。更に言えば、上記のWeb検索に関するチューニングの問題とは別に、深い推論を行うと言っても、先行するやりとりで得られた情報を有効に組み合わせて活用することが出来ているわけではないし、人間にとってはほぼ自明な事象の間の関係について、個別のプロンプトをまたいだ全体として正しく把握できているわけではないことが、検証結果の分析を通して浮かび上がって来たように思います。

　つまりGPT-5のLLM単独の性能はそれとして、チャットシステム全体として見た場合には、まだまだ多くの課題を抱えているということだと思います。GPT-5は深い推論を求められる複雑な課題を解く能力に優れているかも知れませんが、上に述べたようなチャットシステムとしての設計・チューニングポリシーの影響もあり、残念ながら今回の検証対象となったような事実関係に関する問いに対してその能力が十分に発揮できるものではないようです。GPT-5のLLM自体の真価については、寧ろ、従来の検証においてDeep Researchが適しているような問題を与えた方がより良く感じ取ることができるのではないかと思いますが、これは別途の課題として後日を期し、本稿の報告はここ迄で一旦終えたく思います。　

（2025.8.18公開）

登録: 投稿 (Atom)

お知らせ