
こんにちは!保住です。
前回のvol.2 札幌AI道場 中間報告会では中間発表会までの取り組みや発表の様子についてレポートしました。
今回は取り扱っている技術を紹介しつつ、終盤の活動の様子をまとめたいと思います。
取り扱っている技術の紹介
私達のチームでは物体の体積を推定するという課題に取り組んでいます。
というのも、今回課題を提供された企業では、とある方法である物体の体積を計測していますが、今回はその物体の体積をAIで同等以上の精度や速度で推定することを目標に掲げ取り組んでいます。
今回調査した手法はいくつかありますが、本記事では、LiDARと深度推定による体積推定の2つを紹介します。
LiDARによる体積推定
LiDARとは「Light Detection And Ranging」の頭文字をとった技術で、レーザー光が物体から跳ね返ってくるまでの時間を知ることで、物体との距離や方向を測定することができます。また、形状も検出することができます。
Apple製品には搭載されているモデルがあり、今回はiPhoneを使用して測定しました。
LiDARでの計測アプリを使用することで、点群と呼ばれる3D空間に物体を表現するための点の集合を取得したり、点群を線で結んだ3Dメッシュを取得することができます。これらのデータを使用した体積計算を検証しています。
深度推定による体積推定
もう1つの深度推定では、静止画像から体積を推定する方法です。
ここでいう深度とは静止画像の奥行き情報であり、深度推定とは静止画像から奥行き情報を推定する手法になります。近年ではディープラーニングによって実現できます。
ただし、深度推定だけでは体積が推定できないので、他に以下のような処理を組み合わせて実現しています。
- 物体検出(物体がどんなもので画像中のどこにあるかを識別する)
- 距離計算(深度推定した結果から物体との距離を計算する)
- 体積計算(物体の形状を推定し、距離情報も用いて体積を計算する)
成果報告に向けた取り組み
第3期 エンジニアコースの成果報告は2025/02/14に開催されます。(詳細はこちらのサイトをご覧ください)
前回の記事で中間発表の様子をまとめましたが、クリスマスが近づいた頃に成果報告に向けた準備も始まりました。
資料のストーリー考案
まずは伝えるべき内容や順序を整理しました。今回課題を提供してくださった企業様に向けて約半年間で検証した結果と考察、当日来る可能性があるAIに詳しくない方に向けた前提や用語の解説など。
それらの情報を点で終わらせず線としてつなげストーリーとして理解してもらいやすくすることを意識しています。
同じデータに対して複数の手法を検証
成果発表では、複数の手法を同じデータで検証した結果が必要です。メンバー内でデータセットは同じものを扱っていましたが、一部のデータで検証した手法などもあり、完全な結果が揃っていない状況でした。そこで、新たに自分たちで撮影してそのデータに対して結果を出し直すことにしました。
発表練習
2025年になって少し経った頃から発表練習も始まりました。今回のAI道場では、チーム定例で毎週資料の構成確認や内容の議論をして、全体定例では構成、内容、時間配分などをレビューしていただきながら進めてきました。
まとめ
今回は、取り扱っている技術の紹介と終盤の活動の様子をまとめました。
1月中旬までは風呂敷を広げて検証や議論をし、現在は成果発表のためにリソースを集中させています。
いよいよ来週が成果報告となります!本連載も次回が最後となりますが、成果発表の様子をまとめたいと思います。