ChatGPT でデータ分析-中古マンション価格予測:モデル評価編
  • タグ画像

    ChatGPT

  • タグ画像

    Data-science

2023-06-30

こんにちは!株式会社VillageAI取締役の松本祐輝です!

ChatGPTプラグインの「Noteable」を使って、特徴量の選択・欠損値処理・モデル評価をしていきたいと思います。
前回のデータ加工編を見逃した方は、こちらをチェックしてみてください!

では、さっそくNishikaさんの「中古マンション価格予測」のデータ分析をしていきましょう!

まずはChatGPTに、前回に続き特徴量の選択をしてもらいます。

とりあえずChatGPTが選択したカラムのみで、欠損値の処理をしていきます。

欠損値の処理もこれでいいのかな〜と疑問を持ちながらも、ChatGPTの指示に従ってやってみます。

残りの地区名は欠損値数がそこまで多くないので、欠損データは削除します。
最寄駅:名称はChatGPTの指示通りに’不明’に置き換えます。

とりあえず、特徴量の選択と欠損値の処理が終わりました。
続いては、各要素と取引価格ついて説明をしてもらいましょう。

こんな簡単に可視化から説明ができるのは本当に面白いですね!
それではモデル評価してもいましょう!
とりあえず最初は決定木を使用してみます。

なんだと…
せっかくコーディングまで上手く行っているのに、メモリの関係でできないと…
悔しいのでgoogle colaboratoryにコードをコピーして実行してみます。

評価は0.118、参考にnishikaのランキングをみてみると、103位/135位くらいの精度ですね。
ランダムフォレストでも試してみましょう。

77位/135位くらいまで上がりました。
ChatGPTにコードは書いてもらいましたが、noteable上でモデルを実行できていないので、ChatGPTに質問して精度を上げるのは難しそうです…

今度はもっと小さいデータセットで精度を探求していくのも面白そうですね。

データの読み込み・可視化・簡単な説明にChatGPTを活用してみるのはいいかもしれませんね!