2020年10月24日(土) 12:26 JST

オートエンコーダを用いた設計案の管理 -AI(機械学習)メモ vol.3

  • 印刷用ページ
  • 2020年6月15日(月) 13:52 JST
  • 投稿者:

AI(機械学習)メモ vol.3は、オートエンコーダを用いた設計情報の管理(オートエンコーダを用いた外構設計情報の管理とクラスタリングに関する研究、日本建築学会大会(東北)、学術講演梗概集、(社)日本建築学会、2018.9)についてです。あまり聞き慣れないエンコーダという言葉ですが、元の情報を某かの目的に応じ符号に変換をする仕組みを意味します。変換することをエンコード(符号化)と呼び、逆に変換したものを元の情報に戻すことをデコード(復号化)、この仕組みをぞれぞれエンコーダ・デコーダと呼びます。JPEGやZIPでの圧縮も高効率符号化と呼ばれる符号化の一種ですので、JPEGエンコーダの場合は、あるビットマップ画像(元の情報:RGBの塊)をJPEG形式のエンコーダでエンコードして保存する、デコーダでデコードし画像を閲覧する、というかたちで用いられています。自分はエンコード・デコードなんて普段していないぞ、と思うかもしれませんが、これはスマートフォンやPCで自動的に行われているものです。スマートフォンで写真を撮影すると、大体高さ4,000✕幅3,000程度、計12,000,000ピクセルの画像になり、各ピクセルにRGB で3チャンネルぞれぞれ1Byte(8bit: 0~255)ずつ情報がありますので、本来であれば36,000,000Byte = 36MByteの領域を保存に要するわけですが、JPEGで高効率に符号化(エンコード)されることで2MByte程度の容量になって保存されます。もちろんこれを閲覧する際にはビューワでデコードが行われています。高効率符号化はファイル容量を小さくしますので、圧縮とも呼ばれることがありますね。

さて、オートエンコーダは、ニューラルネットワークを用いてエンコーダとデコーダを学習させるものです。オートエンコーダのうち、層が多いものは特にディープオートエンコーダとも呼ばれる、など実装の仕方によって呼び方に区別があるようですが、ここではざっくり区別せずにオートエンコーダと呼ぶことにします。オートエンコーダのネットワークは次図のようになっていて、入力した画像を前半のネットワークでエンコードして特徴量化し、後半のネットワークでデコードして元の画像に近づける、というふうに学習を行います。図では特徴量の要素数をkとしていますが、入力するイメージの要素数より小さい要素数となるよう設定します。このようにすることでイメージを表現する抽象的かつ説明的な特徴量を得ることができます。今回紹介する設計情報の管理研究では、戸建て外構のレイアウト図を対象にオートエンコーダの学習を行い、これで得た特徴量で、類似する設計案を検索することやクラスタリングを行うということを試行しています。


タイルの自動施工に向けたタイル色分類 -AI(機械学習)メモ vol.2

  • 印刷用ページ
  • 2020年4月15日(水) 15:03 JST
  • 投稿者:

AI(機械学習)メモ vol.2では、Deep Learning版の画像分類をタイル施工におけるタイル色分類に導入した例(タイルパターンの設計と自動施工に関する研究、日本建築学会大会(北陸)、学術講演梗概集、(社)日本建築学会、2019.9)について紹介します。下図のように多関節ロボットでタイル施工をしてみる、という研究で何色かのカラータイルを並べモザイクタイルを作ることを試したのですが、タイルを拾い集める際に、そのタイルの色を分類することにDeep Learningを適用した、という例です。所謂CNN(Convolution Neural Network:畳み込みニューラルネットワーク)です。この画像は犬?猫?の代わりに、赤タイル?青タイル?という分類をしています。


建築情報の画像検索システム -AI(機械学習)メモ vol.1

  • 印刷用ページ
  • 2020年4月 1日(水) 16:37 JST
  • 投稿者:

はじめに

研究室では現場支援やAR/MR/VRなどのxR系の研究で、マーカトラッキングや三次元復元(SfM)などを良く扱っています。例えばマーカトラッキングでは、映像に含まれるマーカを探し、それとカメラとの相対的な位置関係を求める、といった処理が行われているのですが、このように映像から元の世界の情報を得ようとする技術をコンピュータビジョンと呼びます。最近では、このコンピュータビジョンにも深層学習(深層学習はAI・機械学習の一種)が導入されるようになっていて、「この写真は犬?猫?」といった画像の分類を行う深層学習はニュースなどで目にしたこともある方も多いかと思います。

さて、機械学習はなかなかパワフルで、当研究室で研究しているテーマでも諸問題の解決に導入することが増えてきました。ただ、各テーマの中でスポットで使うという場合が多く、これまであまり紹介する機会がありませんでした。ということで「AI(機械学習)メモ」シリーズでは、これまでないし今取り組んでいる研究テーマについて、AI(機械学習)に重心を起きつつ、使っているAI(機械学習)関連技術の紹介を試みようと思っています。


検索対象の例(サヴォア邸)


ということで「建築情報の画像検索システム」(画像をクエリとした建築情報検索システムの実現に向けた類似画像検索技術の検証、日本建築学会技術報告集、第19巻 第42号、pp.775-778、2013.6)について。



日々の記事

Twitter ・ Facebook

Twitter 平沢研究室アカウント FaceBook 平沢研究室ページ

アクセスカウンタ

8,035,193