2022-09-30
いままでの記事の中でも触れてきたように、データサイエンスはまだまだこれから活用が進んでいく領域です。
サイエンスという名がつくように、まさに、日々試行錯誤が繰り広げられ実用されるべく日進月歩で進化し続けていく領域となります。
昨今になって、実際にデータの活用を行う企業が増えて来ていますが、まだまだ日本全体で活用が盛んとは言い難い状態です。
そのような中で、実際にその日進月歩で活用のための試行錯誤が繰り広げられる現場を見ることで、今後どのような発展が見込まれていくのか、予測を立てることが出来るとも言えます。
今回は、企業のデータ活用の前身として、多数のデータサイエンティスト達と共同でデータ活用を進めるプロジェクトを推進するKaggleと呼ばれるプラットフォームと、その取組について焦点を当てていきます。
1.
Kaggleとは何か
2.
事例紹介「GNSS」とデータ活用
3.
GNSS(全球測位衛星システム)について
4.
GNSSの仕組み
5.
Kaggleコンペ「GNSSのデシメートルチャレンジ」
Kaggleとは、データサイエンティスト達が、自分たちのデータ分析力を磨く場として機能しているプラットフォームとなります。
カグルとは「カグル」と読み、カグルに参加し、スキルを磨く方々をカグラーと呼びます。
「the home of Data Science & Machine Learning」
と表記されるように、データサイエンスと機械学習の家と呼ばれ、世界中の、機械学習・データサイエンスに携わる約40万人が集まるコミュニティです。
Kaggleの中では、企業や政府などの組織と、データ分析のプロであるデータサイエンティストや機械学習エンジニアを繋げるプラットフォームとして機能しており単純にエンジニアと企業をマッチングするのではなく、コンペも行われ盛り上がりをみせています。
さて、今回はそんなKaggleのコンペで実際に行われた「GNSS」の精度向上を目的としたコンペについてご紹介をしていきます。
とはいえ、GNSSという言葉や仕組み、そしてそのどの領域にデータ分析が活用されているのか?等不明点も多々あることかと思いますので、まずはテーマとなる「GNSS」について理解を深めていきましょう!
「GNSS」と聞いて、まず思い浮かべる単語として「GPS」が馴染み深いですね。
スマートフォンやカーナビに用いられていて、どうやら位置の測定に関係がありそう。ということは皆さんご存じかと思います。
「GPS」はGlobal Positioning Systemと呼ばれ全地球測定システムと訳されます。
要は人工衛星を用いて、位置情報を特定する通信システムと考えられるでしょう。
一方で、普段あまりなじみのない「GNSS」はGlobal Navigation Satellite Systemと呼ばれ全球測位衛星システムと訳されます。
いったい何が違うのか、わかりにくく感じるかもしれませんが、GPSはアメリカが開発したGNSSという関係性があります。
要は、衛星を用いて位置情報の測定を行うシステムの総称がGNSSであり、その中にアメリカが開発したGPSがある。という関係性となっています。
他にも、GNSSとしては日本の準天頂衛星(QZSS)やロシアのGLONASS、欧州連合のGalileoなどがあります。
GNSSが私たちの生活に役立っていることには疑いがありませんが、ところでGNSSがどのような仕組みで私たちに位置情報を届けているのか、ご存じでしょうか?
なんとなく「人工衛星の電波が関係してるのでは…?」ということはわかるのですが、実際はどのようになっているのでしょうか。
GNSS衛星は、地上から約2万キロメートルの上空の衛星軌道を周回しており、またその数は30個以上存在し、それぞれ6つほどの軌道を12時間かけて一周しています。
GNSSはこれらの衛星のうち、4つの衛星から電波を受けて位置の計測を行っているのですが、その際に利用されているのが3次元測位法という計算となります。
平たく説明すると、地球上で異なる3か所からの距離を導くことが出来れば、その位置を特定することが出来るというものです。
つまり、3つの衛星があり、その衛生からの距離がわかれば位置の特定が可能ということになります。
その3つの衛星に加えて、時間によるズレ等、測定の誤差を少なくする目的で、合計4つの人工衛星を用いて計測を行っているのがGNSSの仕組となります。
ただし、受信状態が悪い場合や、3つ以下の衛星からの電波しか受信できない。といった場合正確な測定を行うことが出来ません。
例えば、高層ビルの陰になってしまったり、建物の中や地下鉄などの地下空間では、衛星からの電波を受けることが出来ず、途端に位置の特定が出来なくなってしまいます。
では、普段私たちがスマートフォンの位置情報サービスや、カーナビゲーションシステムを利用している際に、地下であろうと建物の中であろうと、問題なく利用できているのはなぜでしょうか?
実は、上記のように建物などが妨害となって電波の受信ができない場合に備えて、携帯基地局(携帯電話やスマートフォンの電場を送受信する設備)からの電波や、Wi-Fiスポットからの情報を元に、位置情報を補正することで、地上のどこに居ながらでも位置を特定できるようになっています。
また、近年の通信技術の発達やIOTによって、物そのものがインターネットと繋がり、データを収集できる環境が整ったために、互いに位置を補足し合い、より正確な位置情報の特定が可能となりました。
そのような状況下では、膨大なデータを変数として、距離を割り出し続けるといった処理が必要となり、その領域にデータ分析が用いられているというわけです。
さて、GNSSの大枠を理解したところで、本題のKaggleのコンペのご紹介に移ります。
実際にKaggleのコンペで行われた実例ですと、スマートフォンの位置情報をセンチメートル単位の解像度で計算することを目的として開催された「デシメートルチャレンジ」というものがあります。
こちらのコンペでは、Androidスマートフォンからの生の位置測定値から正確な位置情報を導き出すモデルを開発するもので、571チーム、9,940エントリーを誇るコンペとなりました。
現在のスマートフォンの測定精度だと、おおよそ3~5メートルほどの距離までしか測位ができないため、例えば徒歩移動や、車移動での目的地までの到着時間を正確に予測する場合や、より細かな位置の測定が必要になるシーンでは、不十分な精度となってしまう現状があります。
また、今回のコンペで用いられたデータは開けた空の元収集されたスマートフォンの位置情報が元となっているため、実用のレベルを想定すると電波の障害が起こりやすいビル群がある都市部や、地下環境などを想定した取り組みが必要になりますが、そのような状況下でも、正確な位置測定が可能になる未来はそう遠くないでしょう。
前述した取り組みや、近年の通信環境の向上、そしてIOTといった技術革新によってGNSSによる位置測定の未来はどのように変わっていくのでしょうか?
一つの大きなトレンドとしては、自動運転の領域が考えられます。
現在は、人間の運転をAIが、環境データや位置データに基づく情報を元にサポートを行うという範囲に限られていますが、ゆくゆくは、自動車自身が自律的に収集した情報を元に、様々なリスクを考慮して、安全に人間を目的地まで届けるというレベルでの活用が想定されています。
しかし、そのためには正確な位置情報の測定は必須となります。
数センチ、実際の道路状況からズレるだけで事故に繋がりかねないトラブルを引き起こしてしまう恐れがある為です。
そのような状況を回避するためには、常に膨大なデータを分析し、リアルタイムに現在位置を特定し続けることは必要不可欠になっていくというわけです。
その他にも、位置情報を発信するビーコンなど筆頭に、大規模なマーケティング施策に活用されたり、乗換案内や目的地に対しての想定時間の精密化等、様々な分野への応用が期待されています。
いかがでしたでしょうか。
このようにKaggleのコンペの内容を見ることで、発行元の会社の業界内での戦略や置かれている状況について、大枠の様子が見えてきます。
次回以降もKaggleのコンペを中心に多種多様な業界の取組の紹介や業界でのデータ活用の様子をご紹介していきますので、どうぞお楽しみに。
それでは、ここまでお読みいただきありがとうございました。
次回の記事でまたお会いしましょう。