AIに立体模型を認識させる方法2025年06月13日 03:23

 ヤン・ルカンという計算機科学者によれば現在のAIは空間認識が不得意だという。

 確かに複雑な3次元体系をモデル化して入力データとするようなモンテカルロ計算ではChatGPTに聞いても何度もデータの作成ミスをする。

 これはChatGPTは言語ですべてを考えているため、空間的、立体的思考ができない、或いは不得意なのだろう。

 ではAIの空間認識能力を向上させるにはどうしたらいいだろうか。

 ヒトでもそうだが、画家はまずデッサンから始める。それを真似て、比較的簡単なBODYから構成される小宇宙を作ってみる。この小宇宙は例えばいくつか円柱や直方体の組み合わせから構成される。

 この小宇宙の外部は真空である。このような小宇宙をどのようにAIに認識させるかが当面の問題である。

 これをヒトが認識するには目で見えるように模型を作るのが手っ取り早い。ヒトは目で3次元空間を認識できる。二つの目を持っているので距離感がつかみやすいのである。

 しかし、AIには目がない。ヒトの視細胞は距離感を掴むために隣接する視細胞からの信号の差を脳が感じられるようにするための電位差発生機構を持っている。(二河成男、感覚と応答の生物学、放送大学出版会p.82)

ではAIにはどうやって距離感を掴めるようにさせられるか。この時、モンテカルロ計算によく使われる直線透視法が利用できる。例えばあるBODYの体積を求めるには、任意の一点からランダムにそのBODYに多数の仮想的な直線光線を放ち、そのBODYに入った位置及び出た位置の空間座標を求めてその距離を計算する。これをモンテカルロ法でランダムに多数回行い。その距離の変化と傾向から体積を求めることができる。但し、BODYの基本形状はある程度限られることを前提としている。

 この方法を用いれば、このBODYと光線の交差位置データからBODY形状をAIが認識することはある程度の確率で可能となる。現在のAIは生成された言語のチェックを過去の膨大なテキストデータと照らし合わせることで実施しているようだが、このような空間におけるBODY形状認識は様々なBODY形状の多数の表面位置をデータとして与え、BODY形状と交差する空間位置の関係を学習することで、AIの空間認識能力が向上できるだろう。

 問題は小宇宙が複雑なBODYの組み合わせの場合である。BODYの組み合わせをランダムに行い、最も適合した空間位置の場合にそのBODYの組み合わせが選択できるようなアルゴリズムが作成できれば解が得られそうだが、今後の関係者の研究開発に期待したい。

 それまでは、手作りおもちゃ模型と自分の目に頼ってシコシコ入力データを作成する方が早そうだ。
<< 2025/06 >>
01 02 03 04 05 06 07
08 09 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

このブログについて

新道近くに住む山スキー好き。
最近統計論の勉強を始めた。
コロナ感染を統計論で防ぐ方法はないだろうか。
厚労省はもっと詳しいデータを出してもらいたい。

最近のコメント

最近のトラックバック

メッセージ

RSS