2023-06-26
こんにちは!株式会社VillageAI取締役の松本祐輝です!
ChatGPTプラグインの「Noteable」を使って、データ加工をしていきたいと思います。
前回のデータアップロード編を見逃した方は、こちらをチェックしてみてください!
では、さっそくNishikaさんの「中古マンション価格予測」のデータを加工していきましょう!
まずはChatGPTに、価格予測のために何から始めればいいか聞いてみます。
それではデータの前処理からやっていきます。
まずは全て欠損しているカラムを削除しましょう!
次に、建築年が「戦前・昭和・平成」といった数値データでなく、分かりづらいため、築年数に変換できるか聞いてみます。
おおー!これはすごいですね!
エラーが出ても、自己判断して次の処理へと挑戦してくれるみたいですね!
ちゃんと築年数に変換されました!
次は最寄駅の距離(分)に「30?60」のようなデータが含まれているため、このカラムは数値データに変換できるか聞いてみます。
中央値で数値データに変換しましょう!
めちゃめちゃ楽ですね!
他に数値データにした方が良いカラムがあるかChatGPTに聞いてみます。
これは、、、間取りの解釈がおかしいですね!笑
築年数と最寄駅のカラムはすでに処理しているので、最後に健ぺい率などを数値データに変換しようとしたらここで問題が発生!!
?????????
最初からfloat型で’以上’などは含まれていない???
念の為ノートブック上でも確認してみます。
中身は数値データですね。。。
ということは、ChatGPTはデータの中身から判断して答えている訳ではなさそうですね!
まだまだ謎が多いChatGPTですが、コードを書かずにカラム削除や数値データ変換など、場面によっては便利ですね!
それでは今回はここまでです!またね〜!