お問い合わせ

03-5677-3930初診受付

ブログ

2014年4月3日

5316 現実世界の視覚と画像統計量:元吉勇先生の話を聞きました

心理学の立場から視覚と言うものをとらえると、視覚情報処理の基本的な枠組みは次の通り。
 画像ー→画像特徴ー→構造・反射特性の復元ー→(こうして)リンゴと認識する
(それは外界における事象の脳内での復元である)

 従来、この命題は2次元から3次元を推定するというのだから、パラメータが不足しているはずであり、不良な設定問題のはずである。つまり難しい問題を解いているはずだ。と言う考え方だったのだけれど、どうもそうばかりではないらしい。

錯覚:色の恒常性と言うのもそのような補いの例であるのだけれどもそこに鍵があるのかもしれない
現実世界の複雑さ:現実世界の物体は極めて複雑であり、その画像も複雑である。
そこで、個々に問題を解こうとしないで、画像全体の特徴やその特徴の集合を直接利用すればよいのではないか?と言う考え方が出てくる。
つまり、自然画像の法則性と画像特徴を利用するのである。それはヒューリスティクスに基づく認識と言える。
近年、このアイデアを支持する根拠が増えつつある。

たとえば画像の持つ輝度のヒストグラムの歪みから光沢感を推定することが出来る。(つまり光沢のある物体の画像はは輝度が平均よりも高いほうに裾を引くように歪んである。)

細胞レベルで論ずるならば、オン中心型細胞とオフ中心型細胞がその働きをしているのかもしれない。

別の例としては、透明なものと不透明な物の区別もその延長で影を消すように画像をいじることで透明感を出すことが可能である。つまり、映像をいじると質感を変えさせられるという事である。

周辺視ならば統計量を合わせただけで、個々のピクセルを再現しなくても元の図と同じようにに見える。

「物体の形」や「カテゴリー」の認知はそうして行われるのだ。

実際には「簡単に特徴をつかむ統計学的な分析」と、「もう少し別の詳しい分析」が同時に並行してなされているのかもしれない。

ーーー
脚注
ヒューリスティクスとは:
ヒューリスティック(英: heuristic, 独: Heuristik)とは、必ず正しい答えを導けるわけではないが、ある程度のレベルで正解に近い解を得ることが出来る方法である。また、答えの精度は保証されないが、回答に至るまでの時間が少なくて済む。主に計算機科学と心理学の世界で使われる語。どちらの分野での用法も根本的な意味は一緒だが、指示対象が違う。計算機科学ではプログラミングの方法を、心理学では人間の思考方法を指して使われる。論理学では仮説形成法と呼ばれている。 経験則と言う類の言葉。

アクティブ視野計?:中泊聡 氏への質問

Categorised in: 未分類