【ウーバーイーツ】昼と夜の配達データで対応分析【沖縄市】
店舗ごとに昼と夜の注文数を比較し、昼に注文の多い店舗と夜に注文の多い店舗を探してみた。
単純に表にしてみたが、この表では知りたい情報が一目で分からない。
ということで、今回は昼注文の多い店舗と夜注文の多い店舗を分かりやすく図示してみる。
> data <- read.table("clipboard",header = TRUE) > data.ca <- corresp(data,nf=2) > data.eig <- data.ca$cor^2 > round(data.eig,3) [1] 0.052 0.016 > (kiyo <- round(100*data.eig/sum(data.eig),2)) [1] 76.45 23.55 > data.ca <- corresp(data,nf=3) > data.eig <- data.ca$cor^2 > (kiyo <- round(100*data.eig/sum(data.eig),2)) [1] 76.45 23.55 0.00 > biplot(data.ca,xlim = c(-0.4,0.9),ylim=c(-0.2,0.2))
参考書籍・資料
主な参考箇所 7 対応分析
概要
扱うデータの確認
↓
対応分析について調べる
↓
対応分析を行う
使用するデータ
使用するデータは、私の配達データ。
期間は、2021年5月10日~10月31日。
上記期間の総配達件数は、1528件。※ ダブルピックも1件とカウント。
扱うデータの確認
冒頭で紹介した表を使う。
対応分析について
今回のような場合に用いる分析方法について調べていたところ、以下の文章を見つけた。
対応分析
本章では、頻度データ質的データの個体と変数との関連性やパターン分析を行う方法の1つである対応分析について説明する。
注文数を頻度データ、各店舗を個体、変数を昼と夜、と捉えることができる。そのため、対応分析を行うことでなにかしらの情報が得られると期待できる。
対応分析を行う
さっそく、対応分析を行う。
> data <- read.table("clipboard",header = TRUE) > data.ca <- corresp(data,nf=2) #軸の数を2つに設定
軸の数を2つとしたが、この設定が正しいかどうかを確かめてみる。
参考書籍では、累積寄与率を見ることで確かめてみた。同様にやってみる。
> (kiyo <- round(100*data.eig/sum(data.eig),2)) [1] 76.45 23.55
結果、累積寄与率が100%と分かった。念のため、軸の数を3つに変更して、寄与率を求めてみる。
> data.ca <- corresp(data,nf=3) > data.eig <- data.ca$cor^2 > (kiyo <- round(100*data.eig/sum(data.eig),2)) [1] 76.45 23.55 0.00
3つ目の寄与率が0%となり、2つ目までで十分と分かった。
対応分析の結果をバイプロップで表してみる。
> biplot(data.ca,xlim = c(-0.4,0.9),ylim=c(-0.2,0.2))
以下の書籍の解釈文を参考にし、上記図を解釈してみる。
7.1(a)から、目の色がdarkの人は髪がblackの人が多く、髪色がfairの人は目の色がblueかlightの人が多いことが分かる。
上記図から、店舗HとCは昼に注文数が多く、夜の注文数は店舗EとJが多いと分かる。また、昼と夜以外の時間帯で注文数が多いのは、Otherに最も近い店舗Dと分かる。
実際に店舗H、C、E、J、Dのデータを見てみる。
A | B | C | D | E | F | G | H | I | J | |
Lunch | 59 | 33 | 35 | 25 | 22 | 22 | 23 | 24 | 18 | 14 |
Dinner | 63 | 38 | 23 | 23 | 35 | 28 | 22 | 14 | 24 | 23 |
Other | 4 | 2 | 6 | 13 | 3 | 6 | 2 | 4 | 0 | 3 |
上記表でそれぞれの店舗と図での解釈を照らし合わせると、おおむね合っていると分かる。
まとめ
今回は、店舗ごとの昼と夜の注文数で対応分析を行ってみた。
結果、分かったことは下記の2つ。
・夜に注文数が多いのは、カレーハウスCoCo壱番屋沖縄美里店と吉野家うるま志林川店
コメント