ChatGPT でデータ分析-中古マンション価格予測:データ加工編
  • タグ画像

    ChatGPT

2023-06-26

こんにちは!株式会社VillageAI取締役の松本祐輝です!

ChatGPTプラグインの「Noteable」を使って、データ加工をしていきたいと思います。
前回のデータアップロード編を見逃した方は、こちらをチェックしてみてください!

では、さっそくNishikaさんの「中古マンション価格予測」のデータを加工していきましょう!

参考サイト

まずはChatGPTに、価格予測のために何から始めればいいか聞いてみます。

それではデータの前処理からやっていきます。
まずは全て欠損しているカラムを削除しましょう!

次に、建築年が「戦前・昭和・平成」といった数値データでなく、分かりづらいため、築年数に変換できるか聞いてみます。

おおー!これはすごいですね!
エラーが出ても、自己判断して次の処理へと挑戦してくれるみたいですね!
ちゃんと築年数に変換されました!

次は最寄駅の距離(分)に「30?60」のようなデータが含まれているため、このカラムは数値データに変換できるか聞いてみます。

中央値で数値データに変換しましょう!

めちゃめちゃ楽ですね!
他に数値データにした方が良いカラムがあるかChatGPTに聞いてみます。

これは、、、間取りの解釈がおかしいですね!笑
築年数と最寄駅のカラムはすでに処理しているので、最後に健ぺい率などを数値データに変換しようとしたらここで問題が発生!!

?????????
最初からfloat型で’以上’などは含まれていない???
念の為ノートブック上でも確認してみます。

中身は数値データですね。。。
ということは、ChatGPTはデータの中身から判断して答えている訳ではなさそうですね!
まだまだ謎が多いChatGPTですが、コードを書かずにカラム削除や数値データ変換など、場面によっては便利ですね!

それでは今回はここまでです!またね〜!