kaggle「料理の注文と配達」
  • タグ画像

    Kaggle

2023-06-28

目次

はじめに

こんにちは、株式会社Village AI 取締役 松本 祐輝です。本記事では、kaggleの「NYC Restaurants Data – Food Ordering and Delivery(料理の注文と配達)」を分析ツール「Dataiku」を利用してEDA(探索的データ分析)をしてみたいと思います。

背景と目的

背景

ニューヨークのレストランの数は日に日に増加しています。
多忙なライフスタイルのため、多くの学生や忙しい社会人がこれらのレストランに依存しています。
オンラインの食品配達サービスは彼らにとって素晴らしい選択肢です。
お気に入りのレストランのおいしい料理を提供します。
食品アグリゲーター企業 FoodHub は、単一のスマートフォン アプリを通じて複数のレストランへのアクセスを提供します。

このアプリを使用すると、レストランは顧客から直接オンライン注文を受け取ることができます。
レストランが注文を確認した後、アプリは会社の配達員を割り当てて注文を受け取ります。
配達員は地図を使ってレストランに到着し、食品の荷物が届くのを待ちます。
食品パッケージが配達員に渡されると、配達員はアプリで受け取りを確認し、顧客の場所まで食品を届けに行きます。
配達員は食品パッケージを顧客に届けた後、アプリでドロップオフを確認します。
顧客はアプリで注文を評価できます。
フードアグリゲーターは、レストランからの配達注文から一定のマージンを徴収することで収益を上げています。

目的

食品アグリゲーター会社は、登録顧客によるさまざまな注文のデータをオンライン ポータルに保存しています。
彼らはデータを分析して、さまざまなレストランの需要について公正なアイデアを取得し、顧客体験の向上に役立てたいと考えています。
データ分析を実行して、企業のビジネスの改善を目指します。

データの読み込み

EDA

注文回数

料理別の注文回数を可視化してみます。
アメリカ料理、日本料理、イタリア料理、中国料理が人気のようです。

次に、週末と平日の注文回数を見てみます。
週末のほうが圧倒的に多いみたいですね。まぁ、週末の方が家でゴロゴロして注文するような気もします。

続いて、評価別の注文回数です。
未評価が一番多く、次に、5、4、3の順ですね。

週末と平日のどちらが注文にお金をかける傾向があるのかを見てみます。

結果、差なしですね。t検定を実行しても、p値は0.487となっており、差なしというのが確認出来ます。

料理別評価別で注文回数を見てみます。
アメリカ料理、日本料理、イタリア料理、中国料理は、レビュー数が多く、かつ高評価のようです。
ほとんどの人が5点満点で評価し、次に4点、3点の順で評価してます。
注文した商品にとても満足しているってことですね!

配達時間

次に、週末と平日で配達時間に違いがあるかどうかを確認します。

平日の注文は週末より少なく、また配達に時間がかかるようです。
t検定の結果も、有意差ありとなります。

相関係数行列

相関係数行列を作成してみます。
下図の通り、あんまり変数間に相関は無さそうです。

注文あたりの金額

フランス料理が一番高く、ベトナム料理が一番安いようです。

レストラン

高評価の数が多いレストランを出してみます。トップ5がかなりの数を占めているのがわかります。

注文回数で見ても同様の傾向のようです。

リピーターがどうなってるのか気になったので、customer_idでユニーク数を出してみました。
10番目のBlue Ribbon Sushi Bar & Grill というレストランが、他と比べるとリピーターが少ないように見えます。
何かしら改善点がありそうです。

おわりに

kaggle「料理の注文と配達」のデータを使って、データの読み込みからEDAを実行してみました。
このデータセットは、特に目的変数が決まっているわけではないので、ここから自分たちで問題設定をして、目的変数を定義していく事になるかと思います。
Dataikuを使えば、データの加工は簡単に出来るので、いろいろ試してみると良いと思います!