パナソニック、AIモデル学習時のデータ構築コストを削減する技術開発
2023/5/24(水)
パナソニック ホールディングス株式会社(以下、パナソニックHD)は5月23日、AIによる物体検出の精度低下を抑えながら学習データ構築コストを半減できる技術を開発した。
高性能なAIモデルを実現するには、データ収集とアノテーションにより大量の学習データを用意する必要があるが、多大な時間とコストを要する。このジレンマを解決するため、少数のデータでも高精度なAIモデルを実現する技術に注目が集まっている。「少数のラベル付きデータに対するドメイン適応技術(Few-shot Domain Adaptation)」では、予め公開されている多数のラベル付きデータ(ソースドメインのデータ)で学習したAIモデルの事前知識を、少数の現場データ(ターゲットドメインのデータ)の学習に利用する。これにより、現場データが少数でもAIモデルを学習できる。
しかし、従来の方法では、例えば、ソースドメインがRGB画像で、ターゲットドメインが遠赤外線画像のようにデータの“見え”が大きく異なる場合、ソースドメインとターゲットドメインの知識差(ドメインギャップ)※を埋めることができず、高い性能が得られないという課題があった。
※ 撮影するセンサや環境、明るさなどの違いによる複数のデータ集合(ドメイン)間の分布がずれていること。
そこで、同社は、複数の画像を合成するデータ拡張方法の考え方を応用した新たな手法を開発した。開発目的は、ドメインギャップの大きい条件下であっても高性能な少数のラベル付きデータに対するドメイン適応技術を実現するためだ。この手法では、単純に画像を置き換えるだけではなく、画像に写る物体(自動車や人など)の領域情報を利用。同じ種類の物体同士を置き換えることで画像中の物体位置や存在確率なども考慮しているという。※図1(a)また、同社は、敵対的学習により、AIモデルが両ドメイン共通の特徴で画像を認識できるようにした。敵対的学習とは、各画素のドメインの識別を行い、わざとドメインの識別を失敗するようにAIモデルを更新する学習方法だ。AIモデルは、ソースドメインとターゲットドメインの区別が出来なくなるため、両ドメイン共通の特徴で画像を認識するようになる。※図1(b)
これらにより、従来法では対応が困難な、ソースドメインとターゲットドメインの見えが大きく異なる場合にも適用可能な、少数のラベル付きデータに対するドメイン適応技術を実現した。※図2
今回開発した技術は、ドメインギャップの大きな環境に対しても、従来法より圧倒的に少ない学習データで高精度にAIモデルの他現場展開を実現し、くらしや社会の課題を解決するAI技術の社会実装を加速する。学習データの取得条件をコントロールすることが難しいユースケースでも、短時間・低コストで高精度なAIモデルを提供可能だ。そのため、例えば、導入先ごとにセンシング対象・状況(外観、カメラ位置、照明条件など)が異なる現場系ソリューションの導入期間短縮や、赤外線カメラなどを用いた屋外/暗所向け認識技術の開発期間短縮への貢献が期待できる。なお、同社は、今後もユーザーの幸せに貢献するAI技術の研究・開発を推進していくと述べている。
さらに、同社は、今回開発した技術の一部を、トップカンファレンスACCVで発表を行った。そして、開発成果が国際的にも認められているという。
(出典:パナソニックHD Webサイトより)