公共交通のオープンデータ化で、もっと乗りやすいバスを!
2017/5/9(火)
東京大学生産技術研究所 助教 伊藤 昌毅 氏
バス業界にもオープンデータ化の流れがきている。しかしその一方で、公共交通の利益とオープン化が並行できるのかという不安感は事業者にとってジレンマである。
そこで、国土交通省「バス情報の効率的な収集・共有に向けた検討会」の座長や、国土交通省「公共交通分野におけるオープンデータ推進に関する検討会」の委員等である東京大学生産技術研究所附属ソシオグローバル情報工学研究センター助教の伊藤昌毅先生に、現在のバス業界のオープンデータ化の流れと課題について見解を伺った。
―まずは、簡単にこれまでの取り組みについて教えてください。
もともとはIT分野の人間です。コンピュータといっても画面に閉じた話ではなくて、コンピュータがどんどん実世界の中に出ていくという流れの中で、私は地図や地理情報などに興味を持ち、研究してきました。慶応大学で学位をとった後、2010年から、鳥取大学に着任しました。
その研究室は以前からバスの乗換案内サービスをやっていて、そのデザインを今風にしたりしました。乗換案内は、経路検索のアルゴリズムをきちんとしなくてはならないし、各バス業者とコネクションを持ちきちんとデータを集められないといけないし、あるいは県や県のバス協会とコネクションを持たないといけません。社会的な部分と技術的な部分の両方を見ながら、こういったサービスを動かさなければいけませんでした。
乗換案内サービスは、始まったころにはバスの乗換案内ができるシステムというのはあまりありませんでした。全部のバスにスマホ上で動くアプリが入っていて、スマホの位置情報をGPSで取得し、それが乗換案内にも反映されていて、遅れた場合には、5分遅れで案内されたりというようになっていました。私は、鳥取大学に参画した2010年から3年間このようなシステムをやっていました。
その後に東大にきましたが、このような研究は、やはり地元の方とのコネクションがあるからこそできるもので、コネクションがなければ同じようにはできません。そこで、これをオープンデータにする必要がある、ということで、オープンデータに非常に興味を持ちました。やはり世の中もオープン化の方向に動いてきていて、いろいろな自治体の方がデータをオープン化したいんだということをおっしゃっていました。
―伊藤先生が行ってきた静岡での取り組みについて教えてください。
私は出身が静岡なのですが、世の中のオープンデータ化の流れの中で、特に静岡県は非常にオープンデータに熱心です。2014年ごろ、バスのオープンデータ化をするプロジェクトを少し手伝っていました。
その後、東大に移ってすぐにOpenTrans.itというものをやっていました。そこで静岡県のコミュニティバスのデータをオープンデータとして配信しました。実はただ配信する取り組みは2013年、2014年の段階ですでにいろいろとありました。ただPDFやCSVだけど独自フォーマットで形式がよく分からないというような配信ばかりでした。
小さな町のためにわざわざCSVの独自ローダーみたいなものは作らないのです。このように統一されていないため、公開はしたけどなかなか広がらないという状況があり、その時に我々はどうしようかということで採用したのがGTFSというフォーマットです。
GTFSは、もともとGoogleが決めた規約で、交通事業者の電話番号や住所を載せるCSV、バス停の緯度経度を載せるCSV、停車時刻のCSVなど、いくつかCSVファイルを用意してZIP化するというもので、Googleは2005年ぐらいに作っていて、少なくともGTFSでデータを出せばグーグルが載せてくれるのではないかという見通しがありました。
そこで、2014、2015年頃に静岡県で、静的なデータもCSV(GTFS)で、さらにバス車両に全てスマホを載せて、スマホで位置情報を測り、乗降客センサーも付けることにより位置情報と乗降客数もオープンデータ化するという実験を行いました。
しかし、運転手に負担がかかり、地元の自治体にも負担があり、一方で乗客が何人なのか分からないという事態もあって、続けるのが難しくなりました。2015、2016年も細々とGTFSのフォーマットによる静的なデータの配信だけはやっており、それからグーグルともやりとりをして、2016年ぐらいからグーグルに載せられるようになってきました。
そして、そのころ私は他地域への横展開を効率的に行うため、データの整備をみんなで考える場で、国交省や地域交通のコンサル企業、コンテンツプロバイダーの企業の方に来ていただいて、公共交通データの話をしていただきました。私の関心は、地方の小さなバスのデータはどうするのかということなのですが、それに関してみなさんそれぞれ態度が違いました。
田舎のバスは、データがPDFでしかなかったり、わけの分からないエクセルのデータが北から南から何百、何千近くあったり、そもそもデータがない場合もあります。
この話を聞いていて、ダイヤ改定の度にデータを送ってもらい、フォーマットを整える作業を、究極的には各プロバイダーがそれぞれやるというイメージが描けていないように感じました。
田舎で乗換案内システムを利用する人はいないという意見もありますが、今まで3人だった利用者が4人、5人に増えるという程度でも、それなりにメリットはあるはずです。
―オープンデータ化について、オープンになることに対する抵抗感やコツコツやっていたものがゼロになるという不安感を感じたり、バス会社的にも自社のビジネスの収益がなくなるのではという不安を感じますが、そのあたりについてどう思われますか。
実際それはそんなに間違ったことではないと思います。
ただ、そこに踏み込まない限り、全体として伸びてはいけないと思います。
各社ばらばらの情報フォーマットを一つの形にするというのは、バス事業者さんにものすごく負担をおかけするような話ですが、コンテンツプロバイダーにとってはおいしい話なので、統一するというような話をしたほうが良いでしょう。
さらに、すでに直接契約できている大手のバス事業者さんを除いて、コストがかかるけど1日に何件も検索がないような中小の事業者や、載せてほしいけどコンテンツプロバイダーとしては収益にならないような地元のバス会社に限って考えましょう、というフレームの中でフォーマットの話をする場を作れました。
この検討会では、各社第一線のエンジニアが真剣に一つ一つのフォーマットを検討しました。交通事業者同士でエリアが重なっていなかったりするので、協力できる部分もかなりあるようです。
―開発に関してある程度共通解の部分はバス会社同士で集まって共有できないのでしょうか。
いろいろなところに問題があると思っています。そもそもIT企業ではないので技術的に弱いということ、運賃箱などいろいろなものを連携しなければならないですが、そこについていけていません。かつバス事業者の方もオペレーションはできてはいるけれど、ITの部分をちゃんと将来まで考えて設計できる人がいません。
バス会社側のIT人材の不足がいろいろなところにあり、とりあえずコストだけが大きくなるのに、ろくなものができてこないという問題があります。IT分野の者としてはもどかしさを感じます。
バス事業者の中の話をすると、フォーマットを出発点とした標準化というやり方が良いのかという部分は分からないのですが、データのやりとりという点を考えると、バスデータのフォーマットを皮切りに標準化するというのは仕方ないかなと私は思っています。
―バス会社さんが自社のオリジナルサービスとしてGTFSのような形式で作っていると情報を提供しやすいのですか。バス会社さんが自分たちのWebページやアプリで時刻表や乗換案内をユーザー向けに出しているときに役立ってきたりするのではなく、コンテンツプロバイダーが集まりやすくなるという認識で良いですか。
GTFSは、Googleが作ったフォーマットなので、Googleマップに取り込むには、どういうデータ項目がいいかというとこから出発しているので、まず第一はGoogleへの情報提供がしやすくなります。
このフォーマットは、交通事業者がきちんと管理しているような時刻表のデータベースを比較的素直にCSVに落とし込むというような、交通事業者にとってあまり負荷がないような作りです。公共交通のデータを、意味をそのままに表現しようと思うと、誰が作っても似たようなものになります。
GTFSの非常にいいところは、すでに世界的にも検証されており、かつ時刻表、特に乗換案内に必要な情報を不足なく取り出せることです。
例えば、駅単位の時刻表を作るなど、別の形に編集することが可能です。もちろん乗換もできます。時刻表のデータの中で一般的に必要な情報が不足なく、重複せず必要十分に網羅されている情報です。日本の場合は料金という鬼門があります。料金体系が複雑な路線が多くあります。これは実はGTFSでは表現できません。
GTFSは、最初はGoogleが作ったものですが、現在はGoogleのものというわけではなく、AppleもMicrosoftも使っています。Googleマップで検索できるようになると世界にデータが広まっていくので、このデータを集めたtransit.landなどのGTFSデータリポジトリなどのサイトにデータが登録されます。
また、TRAVICという世界の公共交通マップのようなものもあります。そういったサイトには、オープンデータになっているところだけが載るんです。ヨーロッパやアメリカ、オーストラリアなどの路線が載っているのですが、日本は新幹線も山手線も載っていないのに静岡県のコミュニティバスが載っているという状況です。
交通事業者にとっては、GTFSさえ用意すればGoogleには今まで通り載せられ、それ以外のところにも受け付けてもらえて、各社の交渉次第でtransit.landやTRAVICに載るかどうかというのが2016年度の現状です。
もう一つこれから必要になるのは、GTFSでオープンデータを公開したら、それ以上は(ダイヤ改正などの)申請がいらなくなるプロセスをつくることです。国交省といえども、そこに踏み込むのはなかなか大仕事のようです。
申請の書類をある程度自動的に作れるシステムができないかの検討はしています。GTFSフォーマットでデータを作れば、それが標準的なバス情報フォーマット、国交省のフォーマット準拠になるというところは守っていますが、そこから申請の書類を自動作成するようなことができれば、それがバス事業者さんにとっての一つのインセンティブになるのではないかと考えています。
データの整理をすれば、事業者の日々のオペレーションが楽になり、データ管理ができるツールが入っていれば、ダイヤの改正もでき、車の管理や運転手の割り当てもできるというような、全体的なIT化を進めることが重要です。その中で、ダイヤのデータを一貫管理してダイヤをシステム化し、そこからデータを吐き出せるような形になるのが本当は正しいんです。
なので、フォーマットを決めるところから始めた私たちのやり方が正しいのかどうかは難しいところです。バス事業者に関しては、GTFSのフォーマットでデータを出すということよりも、業務全体のIT化が本当は大事なんです。
一方で、コンテンツプロバイダー側も全てのバスのデータを網羅するということはできると思っていません。小さなバス事業者では、ぜひともGoogle、Yahooに載せたいという気持ちを持っている会社が結構あります。この両者がどうしていいか分からないいときに、県の情報政策課や交通課が「このかたちで整備してくれればGoogleとかコンテンツプロバイダーまでいきます」はっきりと答えられるような形をとれたのは非常によかったなと思います。
しかし、フォーマットを決めただけでは惜しいので、どこかフィールドを決めて実践という形までやらないといけないと思っています。
―オープンデータ化が最終的にバス事業者の活性化につながるなどは見通しはありますか?
肝心なのは担い手なんです。バス会社がオープンデータを担うのはもう無理ではないかと思います。地域の自治体や住民がいろいろな形で、オープンデータを扱っていくのかなと思っています。
例えば、地元のIT企業の人がバスの運営をしてみるとか、バスの運営に興味のあるバスマニアがデータを作ってみたりなど、担い手の発掘ができるのかなと思っています。オープンデータになってスマホなどが関わってくると、新しいタイプの担い手が入ってくるきっかけになるかなと思います。
―大きなバス事業者はデータを整備するだけで大変でまた乗降客データなどはマーケティングに使えるので売りたいというニーズが高いと思うのですが、オープンデータ化の流れと公共交通の利益のジレンマについてどうお考えですか。
今この瞬間、公共交通データは結構な値段がついて売買されています。オープンデータと逆行しますが、今まで無料で出してきたものをこれから有料にしたいという話もあります。コスト負担はどうしてもあるので、そこは考えないといけませんが、なかなか一つの動きになっていません。
やはり公共交通事業者は、1社のデータには価値がないのですが、何社か集まってエリアを面的にカバーできるとはじめてそこに価値が生じます。では、それを1社1社の足並みもそろわないまま別々に値段つけていくと、なかなか立ち上がるものも立ち上がってこない、というところが非常に難しいと考えています。
バス業界にもオープンデータ化の流れがきている。しかしその一方で、公共交通の利益とオープン化が並行できるのかという不安感は事業者にとってジレンマである。
そこで、国土交通省「バス情報の効率的な収集・共有に向けた検討会」の座長や、国土交通省「公共交通分野におけるオープンデータ推進に関する検討会」の委員等である東京大学生産技術研究所附属ソシオグローバル情報工学研究センター助教の伊藤昌毅先生に、現在のバス業界のオープンデータ化の流れと課題について見解を伺った。
―まずは、簡単にこれまでの取り組みについて教えてください。
もともとはIT分野の人間です。コンピュータといっても画面に閉じた話ではなくて、コンピュータがどんどん実世界の中に出ていくという流れの中で、私は地図や地理情報などに興味を持ち、研究してきました。慶応大学で学位をとった後、2010年から、鳥取大学に着任しました。
その研究室は以前からバスの乗換案内サービスをやっていて、そのデザインを今風にしたりしました。乗換案内は、経路検索のアルゴリズムをきちんとしなくてはならないし、各バス業者とコネクションを持ちきちんとデータを集められないといけないし、あるいは県や県のバス協会とコネクションを持たないといけません。社会的な部分と技術的な部分の両方を見ながら、こういったサービスを動かさなければいけませんでした。
乗換案内サービスは、始まったころにはバスの乗換案内ができるシステムというのはあまりありませんでした。全部のバスにスマホ上で動くアプリが入っていて、スマホの位置情報をGPSで取得し、それが乗換案内にも反映されていて、遅れた場合には、5分遅れで案内されたりというようになっていました。私は、鳥取大学に参画した2010年から3年間このようなシステムをやっていました。
その後に東大にきましたが、このような研究は、やはり地元の方とのコネクションがあるからこそできるもので、コネクションがなければ同じようにはできません。そこで、これをオープンデータにする必要がある、ということで、オープンデータに非常に興味を持ちました。やはり世の中もオープン化の方向に動いてきていて、いろいろな自治体の方がデータをオープン化したいんだということをおっしゃっていました。
―伊藤先生が行ってきた静岡での取り組みについて教えてください。
私は出身が静岡なのですが、世の中のオープンデータ化の流れの中で、特に静岡県は非常にオープンデータに熱心です。2014年ごろ、バスのオープンデータ化をするプロジェクトを少し手伝っていました。
その後、東大に移ってすぐにOpenTrans.itというものをやっていました。そこで静岡県のコミュニティバスのデータをオープンデータとして配信しました。実はただ配信する取り組みは2013年、2014年の段階ですでにいろいろとありました。ただPDFやCSVだけど独自フォーマットで形式がよく分からないというような配信ばかりでした。
小さな町のためにわざわざCSVの独自ローダーみたいなものは作らないのです。このように統一されていないため、公開はしたけどなかなか広がらないという状況があり、その時に我々はどうしようかということで採用したのがGTFSというフォーマットです。
GTFSは、もともとGoogleが決めた規約で、交通事業者の電話番号や住所を載せるCSV、バス停の緯度経度を載せるCSV、停車時刻のCSVなど、いくつかCSVファイルを用意してZIP化するというもので、Googleは2005年ぐらいに作っていて、少なくともGTFSでデータを出せばグーグルが載せてくれるのではないかという見通しがありました。
そこで、2014、2015年頃に静岡県で、静的なデータもCSV(GTFS)で、さらにバス車両に全てスマホを載せて、スマホで位置情報を測り、乗降客センサーも付けることにより位置情報と乗降客数もオープンデータ化するという実験を行いました。
しかし、運転手に負担がかかり、地元の自治体にも負担があり、一方で乗客が何人なのか分からないという事態もあって、続けるのが難しくなりました。2015、2016年も細々とGTFSのフォーマットによる静的なデータの配信だけはやっており、それからグーグルともやりとりをして、2016年ぐらいからグーグルに載せられるようになってきました。
そして、そのころ私は他地域への横展開を効率的に行うため、データの整備をみんなで考える場で、国交省や地域交通のコンサル企業、コンテンツプロバイダーの企業の方に来ていただいて、公共交通データの話をしていただきました。私の関心は、地方の小さなバスのデータはどうするのかということなのですが、それに関してみなさんそれぞれ態度が違いました。
田舎のバスは、データがPDFでしかなかったり、わけの分からないエクセルのデータが北から南から何百、何千近くあったり、そもそもデータがない場合もあります。
この話を聞いていて、ダイヤ改定の度にデータを送ってもらい、フォーマットを整える作業を、究極的には各プロバイダーがそれぞれやるというイメージが描けていないように感じました。
田舎で乗換案内システムを利用する人はいないという意見もありますが、今まで3人だった利用者が4人、5人に増えるという程度でも、それなりにメリットはあるはずです。
―オープンデータ化について、オープンになることに対する抵抗感やコツコツやっていたものがゼロになるという不安感を感じたり、バス会社的にも自社のビジネスの収益がなくなるのではという不安を感じますが、そのあたりについてどう思われますか。
実際それはそんなに間違ったことではないと思います。
ただ、そこに踏み込まない限り、全体として伸びてはいけないと思います。
各社ばらばらの情報フォーマットを一つの形にするというのは、バス事業者さんにものすごく負担をおかけするような話ですが、コンテンツプロバイダーにとってはおいしい話なので、統一するというような話をしたほうが良いでしょう。
さらに、すでに直接契約できている大手のバス事業者さんを除いて、コストがかかるけど1日に何件も検索がないような中小の事業者や、載せてほしいけどコンテンツプロバイダーとしては収益にならないような地元のバス会社に限って考えましょう、というフレームの中でフォーマットの話をする場を作れました。
この検討会では、各社第一線のエンジニアが真剣に一つ一つのフォーマットを検討しました。交通事業者同士でエリアが重なっていなかったりするので、協力できる部分もかなりあるようです。
―開発に関してある程度共通解の部分はバス会社同士で集まって共有できないのでしょうか。
いろいろなところに問題があると思っています。そもそもIT企業ではないので技術的に弱いということ、運賃箱などいろいろなものを連携しなければならないですが、そこについていけていません。かつバス事業者の方もオペレーションはできてはいるけれど、ITの部分をちゃんと将来まで考えて設計できる人がいません。
バス会社側のIT人材の不足がいろいろなところにあり、とりあえずコストだけが大きくなるのに、ろくなものができてこないという問題があります。IT分野の者としてはもどかしさを感じます。
バス事業者の中の話をすると、フォーマットを出発点とした標準化というやり方が良いのかという部分は分からないのですが、データのやりとりという点を考えると、バスデータのフォーマットを皮切りに標準化するというのは仕方ないかなと私は思っています。
―バス会社さんが自社のオリジナルサービスとしてGTFSのような形式で作っていると情報を提供しやすいのですか。バス会社さんが自分たちのWebページやアプリで時刻表や乗換案内をユーザー向けに出しているときに役立ってきたりするのではなく、コンテンツプロバイダーが集まりやすくなるという認識で良いですか。
GTFSは、Googleが作ったフォーマットなので、Googleマップに取り込むには、どういうデータ項目がいいかというとこから出発しているので、まず第一はGoogleへの情報提供がしやすくなります。
このフォーマットは、交通事業者がきちんと管理しているような時刻表のデータベースを比較的素直にCSVに落とし込むというような、交通事業者にとってあまり負荷がないような作りです。公共交通のデータを、意味をそのままに表現しようと思うと、誰が作っても似たようなものになります。
GTFSの非常にいいところは、すでに世界的にも検証されており、かつ時刻表、特に乗換案内に必要な情報を不足なく取り出せることです。
例えば、駅単位の時刻表を作るなど、別の形に編集することが可能です。もちろん乗換もできます。時刻表のデータの中で一般的に必要な情報が不足なく、重複せず必要十分に網羅されている情報です。日本の場合は料金という鬼門があります。料金体系が複雑な路線が多くあります。これは実はGTFSでは表現できません。
GTFSは、最初はGoogleが作ったものですが、現在はGoogleのものというわけではなく、AppleもMicrosoftも使っています。Googleマップで検索できるようになると世界にデータが広まっていくので、このデータを集めたtransit.landなどのGTFSデータリポジトリなどのサイトにデータが登録されます。
また、TRAVICという世界の公共交通マップのようなものもあります。そういったサイトには、オープンデータになっているところだけが載るんです。ヨーロッパやアメリカ、オーストラリアなどの路線が載っているのですが、日本は新幹線も山手線も載っていないのに静岡県のコミュニティバスが載っているという状況です。
交通事業者にとっては、GTFSさえ用意すればGoogleには今まで通り載せられ、それ以外のところにも受け付けてもらえて、各社の交渉次第でtransit.landやTRAVICに載るかどうかというのが2016年度の現状です。
もう一つこれから必要になるのは、GTFSでオープンデータを公開したら、それ以上は(ダイヤ改正などの)申請がいらなくなるプロセスをつくることです。国交省といえども、そこに踏み込むのはなかなか大仕事のようです。
申請の書類をある程度自動的に作れるシステムができないかの検討はしています。GTFSフォーマットでデータを作れば、それが標準的なバス情報フォーマット、国交省のフォーマット準拠になるというところは守っていますが、そこから申請の書類を自動作成するようなことができれば、それがバス事業者さんにとっての一つのインセンティブになるのではないかと考えています。
データの整理をすれば、事業者の日々のオペレーションが楽になり、データ管理ができるツールが入っていれば、ダイヤの改正もでき、車の管理や運転手の割り当てもできるというような、全体的なIT化を進めることが重要です。その中で、ダイヤのデータを一貫管理してダイヤをシステム化し、そこからデータを吐き出せるような形になるのが本当は正しいんです。
なので、フォーマットを決めるところから始めた私たちのやり方が正しいのかどうかは難しいところです。バス事業者に関しては、GTFSのフォーマットでデータを出すということよりも、業務全体のIT化が本当は大事なんです。
一方で、コンテンツプロバイダー側も全てのバスのデータを網羅するということはできると思っていません。小さなバス事業者では、ぜひともGoogle、Yahooに載せたいという気持ちを持っている会社が結構あります。この両者がどうしていいか分からないいときに、県の情報政策課や交通課が「このかたちで整備してくれればGoogleとかコンテンツプロバイダーまでいきます」はっきりと答えられるような形をとれたのは非常によかったなと思います。
しかし、フォーマットを決めただけでは惜しいので、どこかフィールドを決めて実践という形までやらないといけないと思っています。
―オープンデータ化が最終的にバス事業者の活性化につながるなどは見通しはありますか?
肝心なのは担い手なんです。バス会社がオープンデータを担うのはもう無理ではないかと思います。地域の自治体や住民がいろいろな形で、オープンデータを扱っていくのかなと思っています。
例えば、地元のIT企業の人がバスの運営をしてみるとか、バスの運営に興味のあるバスマニアがデータを作ってみたりなど、担い手の発掘ができるのかなと思っています。オープンデータになってスマホなどが関わってくると、新しいタイプの担い手が入ってくるきっかけになるかなと思います。
―大きなバス事業者はデータを整備するだけで大変でまた乗降客データなどはマーケティングに使えるので売りたいというニーズが高いと思うのですが、オープンデータ化の流れと公共交通の利益のジレンマについてどうお考えですか。
今この瞬間、公共交通データは結構な値段がついて売買されています。オープンデータと逆行しますが、今まで無料で出してきたものをこれから有料にしたいという話もあります。コスト負担はどうしてもあるので、そこは考えないといけませんが、なかなか一つの動きになっていません。
やはり公共交通事業者は、1社のデータには価値がないのですが、何社か集まってエリアを面的にカバーできるとはじめてそこに価値が生じます。では、それを1社1社の足並みもそろわないまま別々に値段つけていくと、なかなか立ち上がるものも立ち上がってこない、というところが非常に難しいと考えています。