ChatGPT でデータ分析-中古マンション価格予測:データアップロード編
  • タグ画像

    ChatGPT

2023-06-20

こんにちは!株式会社VillageAI取締役の松本 祐輝です!
今回はChatGPTプラグインの「Noteable」を使って、データ分析コンペに挑戦してみます。
Noteableの設定の仕方などはまた別のブログ記事で紹介しますね!
それではサクッと、今回挑戦するデータ分析コンペはNishikaさんの「中古マンション価格予測」に取り組んでみました。

トレーニングデータの中身はこんな感じで47ファイル

これはファイル結合する必要がありそうな予感。
とりあえずアップロードするために環境を作ってもらおう。

指示通りURLをクリックしてみるとプロジェクトが生成されている。

Uploadを選択して、ダウンロードしたデータをアップロードしてみる。

一度にアップロードできるファイル数が25個だったため、2回に分けてアップロードすることに。
早速ChatGPT でアップロードした報告と読み込みの指示を出してみたが、なんとエラー発生。

ファイルが見つからないだと…
とりあえずどのファイルが見つからないか聞いてみる。

なんだこのファイル名は…とりあえず聞いてみる。

なるほど、なるほど、IDが間違っていることを把握。他のファイルは読み込めたのだろうか。

なるほど最初でつまづいたのね。
とりあえず正しいファイルIDを教えてみた。

IDがあってるのでディレクトリが違うと仮定し、Noteable側で確認してみた。

やっぱり違った笑

おおー!ついに読み込みに成功!ノートブックで確認。

ちゃんと読み込めている!
残りのファイルも読み込んで結合させてみよう!
大雑把に読み込んで結合してみてくれと指示。

またエラー発生、ファイル1の場合01.csvの様に先頭に0がついていたので、教えてあげる。

完了したら教えてくれるらしいと待っていたが、音沙汰なし笑
終わったか聞いてみると終わってた笑

ノートブックも確認

カウントも5万件以上になっているので、ちゃんと結合されてそう!
大雑把に結合してくれと指示しただけなのにすごい!
読み込み結合が完了したので、ChatGPT にカラムの説明だけしておく。

はい、ということで今回はChatGPT でデータ分析をしてみるのデータアップロード編でした!
少しエラーが出ましたが、無事に読み込み・結合ができたので次回はデータのクレンジング・加工・探索をしていきたいと思います!