2025-06-13: 新道ブログ

AIに立体模型を認識させる方法 ― 2025年06月13日 03:23

　ヤン・ルカンという計算機科学者によれば現在のAIは空間認識が不得意だという。

　確かに複雑な３次元体系をモデル化して入力データとするようなモンテカルロ計算ではChatGPTに聞いても何度もデータの作成ミスをする。

　これはChatGPTは言語ですべてを考えているため、空間的、立体的思考ができない、或いは不得意なのだろう。

　ではAIの空間認識能力を向上させるにはどうしたらいいだろうか。

　ヒトでもそうだが、画家はまずデッサンから始める。それを真似て、比較的簡単なＢＯＤＹから構成される小宇宙を作ってみる。この小宇宙は例えばいくつか円柱や直方体の組み合わせから構成される。

　この小宇宙の外部は真空である。このような小宇宙をどのようにＡＩに認識させるかが当面の問題である。

　これをヒトが認識するには目で見えるように模型を作るのが手っ取り早い。ヒトは目で3次元空間を認識できる。二つの目を持っているので距離感がつかみやすいのである。

　しかし、ＡＩには目がない。ヒトの視細胞は距離感を掴むために隣接する視細胞からの信号の差を脳が感じられるようにするための電位差発生機構を持っている。（二河成男、感覚と応答の生物学、放送大学出版会p.82)

ではAIにはどうやって距離感を掴めるようにさせられるか。この時、モンテカルロ計算によく使われる直線透視法が利用できる。例えばあるＢＯＤＹの体積を求めるには、任意の一点からランダムにそのＢＯＤＹに多数の仮想的な直線光線を放ち、そのＢＯＤＹに入った位置及び出た位置の空間座標を求めてその距離を計算する。これをモンテカルロ法でランダムに多数回行い。その距離の変化と傾向から体積を求めることができる。但し、ＢＯＤＹの基本形状はある程度限られることを前提としている。

　この方法を用いれば、このＢＯＤＹと光線の交差位置データからＢＯＤＹ形状をＡＩが認識することはある程度の確率で可能となる。現在のＡＩは生成された言語のチェックを過去の膨大なテキストデータと照らし合わせることで実施しているようだが、このような空間におけるＢＯＤＹ形状認識は様々なＢＯＤＹ形状の多数の表面位置をデータとして与え、ＢＯＤＹ形状と交差する空間位置の関係を学習することで、ＡＩの空間認識能力が向上できるだろう。

　問題は小宇宙が複雑なＢＯＤＹの組み合わせの場合である。ＢＯＤＹの組み合わせをランダムに行い、最も適合した空間位置の場合にそのＢＯＤＹの組み合わせが選択できるようなアルゴリズムが作成できれば解が得られそうだが、今後の関係者の研究開発に期待したい。

　それまでは、手作りおもちゃ模型と自分の目に頼ってシコシコ入力データを作成する方が早そうだ。

<< 2025/06 >>
日	月	火	水	木	金	土
01	02	03	04	05	06	07
08	09	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

新道ブログ

AIに立体模型を認識させる方法 ― 2025年06月13日 03:23

最近の記事

このブログについて

カテゴリ一覧

最近のコメント

最近のトラックバック

バックナンバー

メッセージ

RSS

新道ブログ

AIに立体模型を認識させる方法 ― 2025年06月13日 03:23

最近の記事

このブログについて

カテゴリ一覧

最近のコメント

最近のトラックバック

バックナンバー

メッセージ

RSS

ログイン