特集

自動運転の機械学習を効率化、各社が頼るKognicの日本進出

2024/7/3(水)

自動運転の開発が無人運転中心となるにつれて、要求される安全性は加速度的に高まっている。自動運転車の走る・曲がる・止まるを判断するAIの機械学習に用いる画像データセットは質量両面で高い水準が求められる。「使える」データの収集は開発企業にとって大きな課題だ。スウェーデンに本社を置くソフトウェア企業、Kognic(コグニック)は2018年以来、欧州・米国の自動車OEMやティア1と強い関係を持ち、小規模なプロジェクトからボッシュ、クアルコムといった大企業の複数のチームまで規模を問わず自動運転や先進運転支援システム(ADAS)開発を支援してきた。

Kognicは今年1月、日本に進出し、支社を設立して日本企業を手助けする考え。日本代表を務めるSales Executive 海保常毅氏がKognicの実績を紹介する。また、日本のSDV戦略にも深く携わる名古屋大学の高田広章教授にも、自動運転とデータの課題を聞いた。

Sponsored by Kognic


機械学習のエンジニアが自身の悩み解決で創業

Kognicは2018年に創業した。データセットのアノテーション(データにタグ付けすること)の最適化ソフトウェア「The Kognic Platform」提供が事業の中心。加えて、高品質のデータセットを提供するベンダーとしての顔も持つ。各専門家がADASや自動運転システムを顧客との共同開発に近い形で支援する「プロフェッショナルサービス」も手掛ける。

「ソフトウェア、ツール、ベンダーといった単一の機能に限定することなくどんな使い方をしてもらってもADAS、自動運転の開発をお手伝いしますよという柔軟性をもった会社」(海保氏)だ。


海保氏は国内外を問わずADAS、自動運転など自動車先端技術関連の業務で12年の経験をもつ。企画営業のほか、技術購買・技術営業・プロジェクトマネジメント・マーケティング・プレゼンテーションと、その時・場所で必要な役割をマルチに担当してきた。

Kognic創業者のダニエル・ランキルデCEOは、マサチューセッツ工科大学とカリフォルニア大学バークレー校で主任研究員を務めたロボティクスの研究者。The Kognic Platformは「ランキルデ本人がロボットや自動運転の機械学習開発をしていて困ったところを解決するために作った製品。エンジニアの悩みを押さえています」(海保氏)。

そして、Kognicには、実際にADASや自動運転の開発に携わった技術者が集まる。技術者が多数の企業の課題解決に関わることでノウハウがさらに蓄積され、製品にフィードバックされていく。乗用車、バス、トラック、タクシー、ボッシュが手掛ける救急車専用の自動運転といった特殊な領域まで適用例は幅広い。スウェーデンのボルボ・カーズや傘下のソフトウェア会社ゼンセアクトとは自動運転車を初期から共に開発してきた。

複数社と課題を解決することで顧客に共通する悩み、企業ごとに異なる問題に対する対処法や各社の開発手法を学び、「実際に自動運転を開発する企業と同じかそれ以上の知見を持っています」(海保氏)。自動運転の後発企業でもスムーズに開発を進めるノウハウを提供できるという。

また、Kognicの自動運転に関する知識はクルマだけにとどまらない。クルマが主力ではあるが、ロボティクスやドローンの自動運転支援も行い、これらの分野でも日本市場で企業のパートナーになりたいと海保氏は意欲を見せる。

Kognicの社風を象徴するエピソードを海保氏は話してくれた。海保氏が入社する際、ランキルデCEOと交わした問答だ。

海保氏の「それほど自動運転を知っているのに自社で作らないのはなぜ?」という問いにCEOは「一つのやり方でシステムを作るより、いろんな企業の方法を知ったほうが知識欲を満たせるから」と答えたのだという。「一つの方法にこだわらず、お客様が見えていないものを気づかせる柔軟な姿勢」が表れている。

データの課題、Kognicの経験から

さて、Kognicが解決してきた機械学習とデータとの課題とは何か? 海保氏が起こりがちな問題3つを紹介してくれた。

まずは「データを集める」上での問題。その方法は大きく分けて2種類で、「自分で集める」か「購入する」か。「自分で集める」場合は「データ量の不足」が目立つ。これが1つ目の問題。カメラやセンサーを積んだクルマで事業所の周辺を走っても近所以外の自動運転の役には立ちづらい。

購入の場合、大量のデータは集められても結果的に無駄になる事例が少なくないと海保氏は言う。プログラミング途中で予期しない問題が起こって購入したデータが開発の目的に合わなくなったり、アノテーションの品質が低かったりが原因。「資産であるデータが無駄になっている」。これが2つ目の問題だ。

アノテーション作業では、AIに読み込ませるために、車両の正面、後部のバンパー部分といった具合に枠で囲んでタグ付けする。外注を受ける業者も多いが、発注通りの画像が得られずに差し替えの連続で人手と時間をとられることも多い。

アノテーションの品質は常に課題(Kognic提供)

アノテーションの品質は常に課題(Kognic提供)



海保氏によると、「AI自身にアノテーション作業をさせて、シミュレーションで自動運転車を動かして、開発を自動化すればいいのでは?」と顧客から聞かれることが多いという。

だが、「80点の自動運転を作るなら自動アノテーションとシミュレーションで十分ですが、本当に安全にかかわる部分を開発し、100点を目指すには、人間によるアノテーションとフィードバックが不可欠。この工程を効率化するためにThe Kognic Platformがあります」(海保氏)。

全て自動化でたどり着いた先には人の手が必要な「80点の崖」とでも言うべきポイントがあり、それを越えるには多大な労力・コストを必要とする。「崖」を越えた成果を生み出すために顧客企業はKognicを活用。「崖」を越えるまでの全工程を1社で担当できるのがKognicの強さだと海保氏は胸を張る。

図の左から右まで、赤く囲った崖を越えていく(Kognic提供)

図の左から右まで、赤く囲った崖を越えていく(Kognic提供)



また、「集めたデータが共有されていない」3つ目の問題も、特に大企業で起こりがちだ。例えば、世界各地でいくつものチームが開発しているOEMでは、各チームが持っているデータについて共有がされず「自動運転チームがもっているデータをADASチームが使っていない」「各チームがばらばらにデータやツールを購入・収集してコストも時間も無駄になっている」「せっかく買ったり、集めたりしたデータが一回限りの使い捨てになっている」実例をKognicは多々見てきた。

Platformで一元管理、計画に的確な助言、規模問わず

では、3つの問題に対してKognicはどういったソリューションを提供するのか?

まず、「データ量の不足」と「データが無駄になっている」ことに対して。機械学習モデルの育成では「高品質なデータが大量に」必要となる。「低品質・大量」でも「高品質・少量」でもいけない。さらに軌道修正を迫られる局面も多い。

「だいたいのお客様は大量のラベルデータを買いたがる傾向にあります」と海保氏が明かす。まとめて買えば、コストが安いし、効率もよくて開発スピードも上げられるだろうとの考えが顧客にあるためだ。しかし、「例えば高速道路のシーンのデータばかりをたくさん買ったとしても決して安定したモデルにはなりません」。

「そういう場合は似たようなシーンをまとめ買いするのではなく、小分けに買ったり収集したりして、少しずつ大きくしていくことをアドバイスします。ポイントは同じようなデータに何億ものお金をかけるのではなく、バラエティ豊かに揃えることです」。開発に想定外の事態はつきもの。小さく始めて軌道修正しながら大きく育てることが大事という。

開発者がデータの収集・購入計画や、仕様書の内容について意見を求めることも多い。「某OEMも似たような悩みがあり、こうやって解決しました」と豊富な知識により顧客の開発段階に合ったアドバイスをする。

購入データの差し替え率で悩んでいるなら、Kognicがアノテーション業者のとりまとめもし、リアルタイムに作業を確認・修正指示することも可能。

また、アノテーションを自動化しているなら人間の手によるフィードバックを簡単にするプログラムも多数用意している。「『うちのツールに合わせてもらわないと困る』というありがちなスタイルをとらなくていいのが僕たちのメリットです」と海保氏。

Kognicの顧客企業は長距離自動運転トラックを手掛ける社員200人ほどの米スタートアップKodiak(コディアック) Roboticsから世界的大企業までさまざま。顧客企業の成功事例やPlatformの詳細は後述する。

名大・高田教授に聞く どう進める?日本の自動運転開発

自動運転システムの開発について学識者はどんな見方をしているのか? 名古屋大学の高田広章教授は、自動運転とも関りの深い組み込みシステム研究の第一人者。同大 未来社会創造機構のモビリティ社会研究所所長や経済産業省モビリティDX検討会座長なども務める。Kognic海保氏の紹介してくれた内容も踏まえ、意見をうかがった。

国のモビリティ戦略にも携わる高田広章 名大教授

国のモビリティ戦略にも携わる高田広章 名大教授



――近年の日本における自動運転開発の流れからうかがえますか?
自動運転開発は、自家用車と、バスやトラック、タクシーなどの商用車の2つの流れがあるわけですが、今は商用車がアクティブに動いていると思います。政府目標として25年度に全国50カ所でレベル4サービスを実現するという目標があって、国も補助金を出して自治体や会社、我々大学も研究開発や実証実験を進めているというのが現状です。

ただ、自家用車はもちろん商用車でも大きいのはコストの問題です。レベル4自動運転ができて、地方の交通手段に乏しいところから実装となると、走らせる難易度は低くても、ビジネス的に成立するのには時間がかかるでしょう。なので、地方で補助金を使うなり赤字覚悟で走らせて経験を積み、徐々に難易度の高い都会でも走らせてビジネスになればシステムのコストも下がってくる。そういう循環ができると持続可能なのかなと。

――自動運転システムとデータ、機械学習の関係についてご説明いただければと思います。
当然、機械学習ってデータがないと何も覚えないですから、画像認識であればさまざまな状況の画像データを用意してアノテーションで正解を与えないとシステムは判断できません。めったにない状況ですが、AIが学習していなければ、道路に寝ている人の前で止まれません。幅広いデータセットが必要で、とても重要というのは分かると思います。

自動運転は認識・判断・制御の3段階からなるとされています。この判断の部分ですが、歩行者や自転車が行き来する一般道で自動運転車を走らせようとすると、『対向車が来たら、こう動く』といったルールを膨大にプログラミングしないといけません。

そこでルールを機械学習で覚えさせようであったりさらに、認識・判断・制御を一体にして、車載カメラの画像を元に直接クルマを動かすエンドツーエンドであったりの考え方も出てきています。そうすると、ますます大量のデータが必要になってくると思いますね。

――データ関連の現状と課題はいかがでしょうか?
やっぱり質の高いデータをいかにたくさん集められるかがAI・機械学習を使ったシステムの勝負となるわけですね。開発したものを現場で使ってみて出てきた課題をつぶしていくことで完成度が上がるという定石があるわけですが、米国や中国で無人タクシーを走らせているのを見ると、その点で日本が遅れをとっているのではという指摘はあります。自動車メーカーなど関係者は危機感をもっていると感じています。

データをどう集める、データの正解をどう作るか=アノテーションするというのは手作業だとすごい労力がかかるので、そこはもう常に課題です。AIに学習させるデータ品質を研究する研究者もいて、画像にわざとノイズを入れて認識するかといった研究も行われています。

――自動運転を成功させるには、いろいろなデータを持っておく必要があると。
それは、間違いなくそうですね。

――先生の目から見て、日本の自動運転開発に対する提案などありますか?
日本ではツール導入のコストと人件費の比較に目が向きがちで、ツールの導入が進まないというのは、自動運転に限らずとも言われます。私は欧州の文化にそう詳しいわけではありませんが、「機械ができることを人にやらせるのは非生産的」というマインドがあると聞いています。技術者不足が言われる中で、機械にできることは機械に任せて、できない仕事にもっと人をシフトすることが必要と思います。

Kognic採用事例 ボッシュとクアルコム

企業はKognicの手を借りることでどんな成果を得られるのか? それぞれ異なる形でKognicを採用している大企業、ボッシュとクアルコムの事例を紹介する。

まず、海保氏は「企業によって面倒事は異なります。ある企業は気にしなくても別の企業にとってはすごく面倒だったりします」と話す。

例えば、ボッシュはデータの収集とアノテーションは自社でするが、「効率化ツールの開発はコストも時間もかかって仕方がない」とKognicを頼る。一方、クアルコムは「整理された高品質のデータをクアルコムに面倒がないよう納めてほしい」とベンダー利用に徹している。

助け求めたボッシュ「カオスな状況」が一変

ボッシュは、世界各地でいくつものADASや自動運転の開発チームがばらばらにデータ収集・アノテーションをし、ツールやソフトウェアも自作していた。各チームの流儀で顧客であるOEMの注文に合わせて開発を進める「カオスな状況」では、OEMを満足させる成果をなかなか出せずにいた。

そこでボッシュ社内の複数の部署から、担当者同士が互いをよく知っているKognicに対して「いろんな方面で『手伝ってくれ!』とお声がけがありました」。

そしてThe Kognic Platform(以下、Platform)を採用し、データ管理を一元化した。例えば南米と欧州のチームが同じデータを見られるようになり、各地で死蔵されていたデータ資産を活用して開発効率を大きく高めることができたという。

ボッシュの機械学習エンジニアは同じ専門領域のKognic技術者の技量を見て「分かっている」と意気投合。また、購買の担当者からはうれしい予想外の反応があった。「データを購入するべき量と内容は開発者と開発状況次第でとても流動的。大きく増やすときも減らすときもあって、一定量を仕入れる物とはまったく違うと分かった」と話してくれ、「いい関係を結べたと思います」(海保氏)。

ボッシュは、事業部「クロスドメイン・コンピューティング・ソリューション」を新設した。全社横断の電子システムとソフトウェア開発組織で、Kognic採用前後の変化を教訓としたのだという。

Kognicの知見を頼りにする企業群(Kognic提供)

Kognicの知見を頼りにする企業群(Kognic提供)


アノテーション差し替え大幅減、テラバイトでも1社で用意

「クアルコムはよりシンプルなケース」(海保氏)。いろいろなアノテーション業者に「仕様通りのデータを用意して」と注文していた同社だが、高い差し替え率が悩みだった。そこでPlatformを導入した。

クアルコム・アノテーション作業者・Kognicがオンラインで同じ画面上でアノテーションの全工程を見られるようになり、「Kognicが監督・修正指示をすることで高品質なデータを効率的に準備」。また、「クアルコムが発注するようなテラバイト単位の量を1社で賄えるのもKognicの強み」(海保氏)だ。

自動運転・ADAS開発がうまくいっている企業には「細かく軌道修正する」共通点があると海保氏は体験から指摘する。一気に開発を進めようとしても意図しない問題が発生し、難しい。開発状況に合わせた柔軟な軌道修正はPlatformを採用した2社にも当てはまるという。

Kognic Platformの機能

自動運転・ADAS開発でKognicが提供する機能を、これまで紹介してきた。最後に、その中核製品Platformについて説明する。

点線内がPlatformによって効率化する機械学習の工程

点線内がPlatformによって効率化する機械学習の工程



Platformは、以下4つの機能から構成される。

1.「Explore」 受け入れ基準を設定することで、画像データが意図する運転設計領域(ODD)基準を満たすか自動識別する。
2.「Shape」 マルチセンサーフュージョン分析によって「アノテーション及びデータを形作る」。LiDARとの組み合わせ分析はKognicが優位性を持つ点。
3.「Explain」 データセットのパフォーマンス分析で、開発の進捗度を定量評価する「データの説明ツール」。
4.「Orchestrate」 前出の3つのツールを社内の他のチーム、外注先やKognicと共有する。作業のリアルタイム分析や進捗管理で連携や開発工程を効率化する。

開発者にとって、きっと魅力的な各機能を、海保氏は詳しく情熱をもって解説してくれる。読者にはぜひ問い合わせてほしいと思う。

情報保護も万全、日本に根を下ろす

Platformはクラウドベースで、通常のPCやウェブブラウザー上で動かすことができ、Kognicのサーバーを介しても、顧客企業のサーバーに直結しても利用できる。

顧客企業の開発の深いところに関わるKognicは、もちろん欧州連合(EU)の一般データ保護規則(GDPR)やTISAX (ドイツのデータ・ITセキュリティ認証)をはじめとする各国の法規・認証に適合する情報保護の認証や措置を講じている。

欧米の主だったADAS・自動運転の開発企業から信頼されるKognic。海保氏は日本市場の開拓に汗をかく。支社を設立して現地のエンジニアを採用し、日本に根差して企業の開発支援に全力を注ぐ。

Kognic・Platformの詳細はこちらを参照

get_the_ID : 226563
has_post_thumbnail(get_the_ID()) : 1

ログイン

ページ上部へ戻る