Kaggle事例紹介「環境保全のための生態系調査」
  • タグ画像

    Kaggle

2022-11-06

本記事の読み切り時間は約3分となります。

本記事の対象者は

・環境保全事業DX化に携わる方。
・生態調査関連のDX化に携わる方。

となります。
それでは、お楽しみください!

目次

いままでの記事の中でも触れてきたように、データサイエンスはまだまだこれから活用が進んでいく領域です。

サイエンスという名がつくように、まさに、日々試行錯誤が繰り広げられ実用されるべく日進月歩で進化し続けていく領域となります。

昨今になって、実際にデータの活用を行う企業が増えて来ていますが、まだまだ日本全体で活用が盛んとは言い難い状態です。

そのような中で、実際にその日進月歩で活用のための試行錯誤が繰り広げられる現場を見ることで、今後どのような発展が見込まれていくのか、予測を立てることが出来るとも言えます。

今回は、企業のデータ活用の前進として、多数のデータサイエンティスト達と共同でデータ活用を進めるプロジェクトを推進するKaggleと呼ばれるプラットフォームと、その取組について焦点を当てていきます。

Kaggleとは

Kaggleとは、データサイエンティスト達が、自分たちのデータ分析力を磨く場として機能しているプラットフォームとなります。

kaggleとはカグルと読み、kaggleに参加し、スキルを磨く方々をカグラーと呼びます。

the home of Data Science & Machine Learning

と表記されるように、データサイエンスと機械学習の家と呼ばれ、世界中の、機械学習・データサイエンスに携わる約40万人が集まるコミュニティです。

Kaggleの中では、企業や政府などの組織と、データ分析のプロであるデータサイエンティストや機械学習エンジニアを繋げるプラットフォームとして機能しており単純にエンジニアと企業をマッチングするのではなく、コンペも行われ盛り上がりをみせています。

どういう目的で利用している人がいるか

企業や政府などの組織とのコンペとは、企業や組織が競争形式で課題を提示し、賞金と引き換えに制度の高い分析モデルを買い取るという仕組みです。

開催されるコンペは多種多様で、

・住宅価格の予測を行うために、間取りや、駅からの距離等といった複数の要因から、戸建て住宅の最終的な価格を予測する。

・有事の際のTwitterの投稿の有用性に目を付け、災害の発生状況を正しく測定するために、tweetの内容と状況から、自動で災害に関するリアルタイムの情報を収集するアルゴリズムを作る。

・飛行機内のパイロットの状況をリアルタイムで観察し、危険な状態になった場合自動でアラートをあげるアルゴリズムを作成する。

といったコンペが行われています。

事例紹介、データ分析を用いた生物生態調査

今回焦点を当てていくのは生態調査に関してです。

これまでの記事で、AIの経済的な利便性に注目して紹介をしてきましたが、AIやビッグデータの活用は、なにも人間だけの豊かさの為に役立てられているわけではありません。

昨今、注目される概念にSDGsがありますが、地球の生態系や環境を守るという点に関してもデータ分析は活用されています。

現在、地球上には様々な種類の生き物が存在しており、海底に存在する微生物から、地上の動植物、菌類、そして我々人間まで、その数は動物だけで125万種、植物は30万種にも及ぶと言われています。

それらが互いに補完し合うことで、生態系が成り立っており、一つの種が減少することでその他の種にも影響を及ぼします。

例えば、ある一つの植物が絶滅したとします。

すると、その植物を主食にしていた小型の草食動物は別の植物を食べる必要性にかられ、その他の植物の生息数に影響を及ぼします。

場合によっては、別の地域に新たな食糧を探しに移動を余儀なくされ、移動後の動植物に影響を及ぼすことも考えられます。

その結果、小型の草食動物を食用にしていた、中型の肉食動物にも影響が及び、その影響は中型の肉食動物を食用にしていた大型の肉食動物へ…といった具合で、時間差を置いて連鎖的に他の種にも影響を与えていきます。

実際に、国際自然保護連合(IUCN)が2019年12月に発表した「レッドリスト」によると、世界の絶滅危惧種は30,178種に及ぶとされており、同年7月時点の28,338種と比べると、たった5ヶ月で1,840種もの生物が新たに絶滅の危機に瀕することになったというわけです。

このような絶滅の危機に陥ってしまう要因としては、外来種の侵入や、森林の伐採、地球温暖化等様々な要因が考えられますが、いずれにしても、地球の生態系をも守り、数多くの生き物と共存共栄をしていくためには、その生態系調査を行っていくことは非常に重要となります。

いままでの生態調査方法とその課題

ところで、一口に生態調査といっても、どのようにして実施をしているのかご存じの方は多くはないのではないでしょうか。

生態調査の多くは、特定の動植物を膨大な自然のなかから、見つけ観察し、その生態や外部への影響を理解するところからスタートします。

ところが、その調査一つを取っても、生態系に影響を与えないように注意をする必要があります。

例を挙げると、うっそうとした熱帯雨林が広がるジャングルの生態系を調査する必要があったとします。

足場が悪く、調査する範囲も膨大になるジャングルでの調査を円滑に進めるために、複数台の調査車両を用いて、探索し交通の邪魔になる木々は、適宜切り倒しながら調査を進めていくことはできるでしょうか。

答えは明確にNoです。

当然、生態を調査するためには、その調査自体が生態系に悪影響を及ぼさないように細心の注意を払って行われます。

特定の生物を守るために、その生態を調査するはずが、かえって悪影響を与えてしまうなんてことはもってのほかです。

その為従来の調査は基本的にフィールドワークが用いられ、自分たちの足と耳と目でもって、その生物を探し、生態を調査してきました。

当然、膨大な手間がかかりますし、人間では到底足を踏み入れることが出来ない環境下では、調査自体が行うことが出来ないというケースもままあります。
そこで登場するのが、近年のテクノロジーを活かした調査手法となります。

たとえ、人間が足を踏み入れることが出来なくても、ドローンであれば環境への負荷も最小限に、様々な環境下での調査が可能ですし、様々なセンサーを取り付けることで、肉眼で確認するよりもはるかに精度が高く、かつ効率的に調査を行うことが出来るというわけです。

Kaggle事例紹介「熱帯雨林での生物の検出」

前述の通り、生態系の調査において、人間が足を踏み入れにくい場所での調査や、膨大な手間と時間がかかる調査を、テクノロジーを用いてより効率的に実行することは非常に重要であることは理解できたかと思います。

Kaggleのコンペにおいても、生態系の調査をテーマとしたコンペが実際に行われ、1143チーム、33,339エントリーを記録する取り組みとなりましたので、今回はそちらの内容をご紹介していきます。

参考記事はこちら

約2年前に実施された本コンペは、Rainforest Connection (RFCx) が作成した、遠隔地の生態系の調査や保護を行うためのリアルタイム監視システムのデータを用いて行われました。

同システムは、ドローンや衛星などの視覚ベースのシステムとは異なり、音響センサーを用いて、特定の場所で年間を通して音を収集し、分析することで調査を行うというものでした。

実際に行われたコンペでは、熱帯雨林で収集した音声の中から、特定の鳥やカエルの鳴き声を自動で検出するというものでした。本コンペの肝となる部分は、特定の鳥やカエルの膨大なサンプルデータを用いた、検出ではなく、限られた量で、かつ音響的に複雑なデータをもとに特定を行うという点にありました。

そのような音響データをもとに、水音や葉の擦れる音、昆虫の鳴き声が絶えず鳴りやまない熱帯雨林の環境下で特定するということを想像すると、それがいかに難易度が高いかお分かりいただけるかと思います。

事例紹介「ザトウクジラの保護」

上記は、熱帯雨林における特定の鳥やカエルの特定を行うコンペでしたが、実際に同様の技術を用いて、絶滅危惧種の生物の保護を行っている事例をご紹介いたします。

AIを社会の為に、というスローガンを掲げるGoogleのAI関連プログラム「AI For Social Good」の一環として、アメリカ海洋大気庁(NOAA)の一機関である「Pacific Islands Fisheries Science Center (PIFSC:太平洋諸島漁業科学センター)」とのパートナー関係を結び、ザトウクジラの生態把握のために畳み込みニューラルネットワークを利用する取り組みを進めていました(参考記事はこちら)。

世界中に分布するザトウクジラは、1700年の後半から1900年代の半ばにかけて捕鯨の対象となっており、1830年には個体数として2万7000頭だったザトウクジラは1950年にはなんと450頭にまで個体数が減少し、絶滅の危機に瀕してしまいました。

そんなザトウクジラを保護すべく、NOAAの研究者を中心に、海中にマイクを設置し、ザトウクジラの声を捉えることで、その生息数を正確に把握しようという試みを行っていましたが、様々な雑音が多く存在する海中では困難を極め、ザトウクジラの声だけを正確に抽出することはできなかったとのことでした。

そこで、Googleと提携し、海中の音声を分析し、ノイズを取り除き、正確にザトウクジラの音声のみを抽出することに成功することで、ザトウクジラがどの時期にどのエリアで多く活動しているのかを正確に把握することが可能になりました。

まさに、データ分析を用いて環境の保護に成功した良い事例と言えるかと思います。

いかがでしたでしょうか。

次回以降もKaggleのコンペを中心に多種多様な業界の取組の紹介や業界でのデータ活用の様子をご紹介していきますので、どうぞお楽しみに。

それでは、ここまでお読みいただきありがとうございました。

次回の記事でまたお会いしましょう。