Dataiku活用:バッテリー残存耐用期間 (RUL)の予測
  • タグ画像

    Dataiku

2023-07-19

目次

はじめに

こんにちは、株式会社VillageAI取締役の松本祐輝です。
本記事では、Dataikuを使って、バッテリーの残存耐用期間(RUL)の予測をやってみたいと思います。
使用するデータは、Kaggleで公開されている「Battery Remaining Useful Life (RUL) 」です。

残存耐用期間(RUL)とは、機械や資産が修理や交換を必要とするまでに稼動する可能性のある期間のことです。
システムによっては、この期間を日数、マイル数、サイクル数、またはその他の量で表すことができます。
RUL予測は故障の早期警告を提供し、システムの予後診断と健全性管理において重要な要素となっています。
これにより、エンジニアはメンテナンスのスケジュールを立て、運転効率を最適化し、予定外のダウンタイムを回避することができます。

Kaggleとは

Kaggleとは、データサイエンティスト達が、自分たちのデータ分析力を磨く場として機能しているプラットフォームとなります。
kaggleとはカグルと読み、kaggleに参加し、スキルを磨く方々をカグラーと呼びます。

the home of Data Science & Machine Learning

と表記されるように、データサイエンスと機械学習の家と呼ばれ、世界中の、機械学習・データサイエンスに携わる約40万人が集まるコミュニティです。

Kaggleの中では、企業や政府などの組織と、データ分析のプロであるデータサイエンティストや機械学習エンジニアを繋げるプラットフォームとして機能しており単純にエンジニアと企業をマッチングするのではなく、コンペが行われ盛り上がりをみせています。

Dataikuとは

Dataikuは、データサイエンスと機械学習のためのエンドツーエンドプラットフォームです。
データの準備からモデルの展開までをサポートし、効率的なチームコラボレーションが実現できます。

ビジネスユーザーやデータサイエンティストは、異種のデータソースからのデータ統合やモデル構築を簡素化できます。
豊富なデータ可視化機能やセキュリティ対策も特長です。

バッテリー残存耐用期間 (RUL)の予測

データの読み込み

データの内容は以下の通り。
・サイクルインデックス: サイクル数
・放電時間 (秒)
・4.15Vでの時間 (秒)
・定電流での時間 (秒)
・3.6-3.4Vでの減少時間 (秒)
・最大放電電圧 (V)
・最小充電電圧 (V)
・充電時間 (秒)
・RUL:残存耐用期間

データの理解

statisticsタブとChartsタブでデータの要約や可視化、相関関係を見ていきます。

各変数の分布

目的変数(RUL)の分布と説明変数との散布図

相関係数行列

Discharge Time、Decrement 3.6-3.4V、Time constant current、Charging timeの4変数は、目的変数であるRULとの相関がほぼゼロなので、モデルを作成する際には外すことにします。

予測モデルの構築

予測モデルの構築と検証をするため、まず学習用データとテスト用データに分割します。

次に、学習用データを使って予測モデルを構築します。
相関係数行列で確認出来た不要な特徴量を外します。

Random forest、Ridge Regression、LightGBMの3つのアルゴリズムで実行したところ、今回のデータではLightGBMが良いという結果になりました。

RULと予測値の散布図

予測モデルをデプロイ!

最後にPredictレシピでテストデータのRULを予測します。

テストデータでのRULと予測値の散布図

おわりに

本記事では、Dataikuでバッテリーの残存耐用期間(RUL)の予測モデルを構築してみました。
実務では、この予測された期間をもとにメンテナンスの計画をたて運転効率の最適化を目指すことになるのかなと思います。
また、運用していく中で、予測したRULより短いケースが出てきた際には原因を調査し、特定出来るデータ収集してモデルの特徴量に追加するようなPDCAを回せると良いと思います。

最後に、今回作成したフローを載せておきます。