仮想空間の土地を売買!?DataikuとChatGPTで土地価格を予測して儲けれるのか?
  • タグ画像

    ChatGPT

  • タグ画像

    Dataiku

2023-07-26

目次

はじめに

皆さん、こんにちは!松本祐輝です!本記事では、メタバースのNFT不動産価格をChatGPT Code Interpreterで初期分析して、それをベースにDataikuデータパイプラインを作成してみたいと思います。

相場よりも安いものを買って、相場で売れば儲かりそうですね!

使うデータは、Kaggleで公開されている「Decentraland NFT Virtual Estate Dataset 2022」です。

メタバースNFT不動産価格予測

まずは、ChatGPT Code Interpreterで初期分析してみましょう。とっても楽ちんですね。

・・・

思ったより大変でしたが、不動産価格予測の結果は、以下のようになりました。ある程度予測は出来そうです。

実際の価格と予測価格の散布図

特徴量の重要度

Dataikuでデータパイプラインの構築

ChatGPTで、不動産価格が予測できそうという結果が得られたので、本番化に向けてDataikuでデータパイプラインを作成していきます。

ここからは、データベース(PostgreSQL)に格納されている想定で進めます。

データの読み込み

PostgreSQLにあるデータをDataikuで読み込みます。Dataikuでは、ソースがファイルでもデータベースでも全く同じように扱えるので便利ですね!

データの加工

次にPrepareレシピを使ってデータの加工を行います。

座標の展開や隣接してる道や地区、広場までの距離の展開、不要なカラムの削除などを行っています。

予測モデルの構築

学習用のデータとテスト用のデータに分割して、学習用データで予測モデルを構築します。

今回は、指標をRMSLE、アルゴリズムは「Random Forest」「Ridge Regression」「LightGBM」の3つを試した結果、Random Forestが最も良い結果になりました。

Random Forestのモデルをデプロイし、テストデータに対して予測を実行します。

結果、下図のようになりました。高額の物件に関して予測が上手く行ってないのが分かります。

この辺りは、外れているデータに関して生データを確認し、どんなデータを収集すると改善しそうなのか仮説を立てて試行錯誤する必要がありそうです。

おわりに

本記事では、メタバースのNFT不動産価格をChatGPT Code Interpreterで初期分析して、それをベースにDataikuでデータパイプラインを作成してみました。ChatGPTで当たりを付けて、Dataikuで本番化に向けて詰めていくという流れがイメージ出来たのではないでしょうか?

最後に、今回作成したフローを載せておきます。

テキスト