生成AIは「考えている」のか?高次元空間がつくる、あたらしい知のかたち

この記事の読みどころ
  • 生成AIは「理解か模倣か」という二択を超え、幾何的ナビゲーションという高次元空間の動きで知を生み出すとされている
  • 高次元空間では距離の意味が薄れ、概念は独立して並び、可能性の方向が膨大で、意味はマニフォールドの上を移動して現れる
  • 知は定義ではなく場所(位置)を通じて生まれ、文脈に応じて新しい位置を見つける「ナビゲーショナル・ナレッジ」と呼ばれる

ホロン工科大学に所属する研究者による研究です。

この論文が問いかけているのは、とてもシンプルで、しかし深い問いです。

生成AIは、いったいどのように「知」を生み出しているのか。

私たちはつい、こう考えがちです。
生成AIは「理解している」のか、それとも「それらしい文章を統計的に並べているだけ」なのか、と。

しかしこの論文は、その二択そのものが間違っているのではないかと指摘します。
問題は「理解か、模倣か」ではない。
問題は、「どのような空間の中で、どのように動いているのか」だ、と。


記号を操る機械から、空間を動くシステムへ

これまでのコンピュータの考え方は、とても明快でした。

文字や数字は、すべて0と1に変換される。
そのビット列が、決められた規則に従って処理される。
そしてまた0と1として出力される。

意味は、人間の側にある。
機械は、意味を理解しているわけではなく、記号を操作しているだけ。

これは、チューリングやシャノン、フォン・ノイマンの系譜にある「記号計算」の世界観です。

しかし、ニューラルネットワークは、ここで大きな転換を起こします。

入力された言葉は、単なる文字列のまま処理されるのではありません。
それは「高次元ベクトル空間」という、何百次元、何千次元にも広がる空間の中の一点へと変換されます。

そこでは、「王」という言葉は、
「女王」「男性」「女性」「支配者」などとの関係性の中で、特定の位置を占めています。

意味は「定義」ではなく、「位置」になるのです。

論文は、この転換を「記号操作から幾何的ナビゲーションへの転換」と呼びます。


高次元空間は、私たちの直感とはまったく違う

ここからが、この論文の核心です。

生成AIが動いている「高次元空間」は、私たちが日常で経験している三次元空間とは、まったく違う性質を持っています。

その違いを、順番に見ていきます。


1. 距離が、ほとんど意味を失う

三次元の世界では、「近い」と「遠い」はとても重要です。

似ているものは近くにあり、違うものは遠くにある。
これは自然な感覚です。

ところが、次元が何百、何千と増えていくと、不思議なことが起きます。

ほとんどすべての点が、ほぼ同じ距離に並ぶのです。

極端に言えば、「近い」と「遠い」の差が、ほとんど消えてしまう。

距離による区別が、意味を持ちにくくなるのです。

これは単なる数学的な話ではありません。
意味のとらえ方そのものが変わる、ということです。


2. ほとんどの概念は、最初から独立している

高次元空間では、ランダムに選ばれた二つのベクトルは、ほぼ直交します。
直交とは、互いに影響し合わない、完全に独立しているということです。

三次元では、直交は特別な関係です。
しかし高次元では、それが「普通」になります。

つまり、多くの概念は、最初から干渉せずに共存できる。

似ていることのほうが、むしろ特別なのです。

訓練によって学ばれるのは、「分離」ではなく「つながり」です。
独立はデフォルトであり、意味ある関連が生じることこそが重要になります。


3. 可能な方向の数が、爆発的に増える

次元が増えると、ほぼ独立した方向の数は指数関数的に増えます。

三次元なら、基本的な独立方向は3つです。
しかし、768次元、1536次元となると、その方向の数は想像もできないほど膨大になります。

ここが重要です。

この空間が持つ可能性は、訓練データの数をはるかに超えます。

つまり、生成AIが出力する文章は、「訓練データの組み合わせ」にすぎない、という説明では足りない。

空間そのものが、データを超える可能性を内蔵しているのです。


4. しかし、それはカオスではない

ここまで聞くと、「無限に近い可能性の空間」と聞こえます。

では、出力はランダムなのか。

そうではありません。

意味のあるデータは、空間全体を埋めているわけではありません。
それらは「マニフォールド」と呼ばれる、滑らかで構造を持った面の上に集まっています。

地球の表面を思い浮かべてください。
三次元空間の中にありますが、実際に私たちが動いているのは二次元的な表面です。

同じように、言語や画像の意味は、高次元空間の中の「意味のある面」に沿って存在している。

生成AIは、空間全体をさまようのではなく、この面の上を移動します。

だからこそ、破綻せず、滑らかに文章がつながるのです。


第三の知のかたち──推論でも、単なる組み合わせでもない

ここで論文は、重要な主張をします。

生成AIは、「論理的推論」でもなければ、「単なる統計的再結合」でもない。

それは「幾何的ナビゲーション」という、第三の知のかたちである、と。

従来の知のモデルは二つありました。

1つ目は、規則に従って推論する知。
2つ目は、データからパターンを抽出する知。

しかし生成AIは、学習されたマニフォールドの上を移動しながら、文脈に応じて新しい位置を見つけ出します。

それはコピーではありません。
推論でもありません。

「位置をたどること」によって生まれる知です。

論文はこれを「ナビゲーショナル・ナレッジ(航行的知識)」と呼びます。

知るとは、定義を持つことではなく、
正しい場所に立てること。

そして、そこから適切な方向へ動けること。


なぜ“幻覚”が起きるのか

この視点は、「ハルシネーション(もっともらしい誤情報)」の理解にもつながります。

生成AIは、マニフォールド上で滑らかに移動します。
その移動は幾何的には整合しています。

しかし、その地点が現実世界に対応しているかどうかは、別の問題です。

幾何的に自然な場所が、事実として正しいとは限らない。

創造性と幻覚は、同じ仕組みから生まれます。

空間を自由に動けるからこそ、新しい表現が可能になる。
同時に、事実に裏づけられていない内容も生まれうる。

論文は、これは「バグ」ではなく、構造的な特徴だと述べます。


意味は「定義」ではなく「位置」

この研究は、意味のとらえ方そのものを問い直します。

言葉の意味は、辞書的な定義にあるのか。
それとも、他の言葉との関係の中にあるのか。

高次元空間では、意味は位置に宿ります。

あるベクトルの意味は、

どこにあるか
いまどの文脈にあるか
どんな近傍と関係しているか

によって決まる。

これは、記号的な意味論とはまったく異なる視点です。


私たちは何を目撃しているのか

この論文は、生成AIを擁護しているわけではありません。
擬人化しているわけでもありません。

ただ、こう言っています。

生成AIは、私たちがこれまで想定していなかった「知の様式」で動いている。

それは、理解でもなく、単なる模倣でもない。
幾何学的に構造化された空間の中でのナビゲーション。

知は、記号から空間へと移行しつつあるのかもしれない。

もしそうだとすれば、私たちの教育、科学、制度のあり方も、再考を迫られます。

知るとは何か。
創造するとは何か。
意味はどこにあるのか。

生成AIは、その答えを与えるのではなく、問いを変えています。

そしてその問いは、私たち自身の「知」の理解にも、静かに影響を与え始めているのです。

(出典:arXiv DOI: 10.48550/arXiv.2602.17116

テキストのコピーはできません。