【ウーバーイーツ】沖縄市エリアの「低単価」を考える
↓の続き

概要
沖縄のウーバーイーツ新料金体制後(5月10日スタート)のデータを用いて、「低単価」を分析する。
これまでの「低単価」件数を軸に時間帯・曜日・クエストの有無の3つの視点からデータを見る。
使用するデータ
使用するデータは、私の配達データ。
期間は、2021年5月10日~10月31日。
上記期間の総配達件数は、1528件。※ ダブルピックも1件とカウント。
低単価の定義
低単価の定義を決める。
チップを含まない配達単価の概要を確認してみる。
> summary(delivery_reward) #チップ含まない Min. 1st Qu. Median Mean 3rd Qu. Max. 299.0 416.0 513.0 547.8 625.0 1474.0
最小値 | 25%点 | 中央値 | 平均 | 75%点 | 最大値 |
299.0 | 416.0 | 513.0 | 547.8 | 625.0 | 1474.0 |
416円以下の配達単価が全体の4分の1を占めていることが分かった。
これより、配達単価416円以下のデータを「低単価」とする。
低単価×クエスト
前回の記事より、クエスト中は単価が低いと推測できる。

となると、低単価件数とクエスト中件数に高い相関があると予想できる。
分割表とファイ係数を用いて、調べてみる。
参考書籍・資料
分割表を作成してみる。
単価 | ||||
低単価 | 低単価以外 | 合計 | ||
クエスト | 時間中 | 61 | 105 | 166 |
時間外 | 322 | 1040 | 1362 | |
合計 | 383 | 1145 | 1528 |
ファイ係数は、「0.094」となり、相関があるとは言えなかった。
また、クエスト時間中×低単価とクエスト時間外×低単価の割合は、それぞれ37%と24%となり、大きく異なるわけではなかった。

ふむふむ、クエスト時間中に低単価の配達が偏っているわけではないのね。
低単価×時間帯
時間帯に着目して、低単価の件数を見てみる。
時間帯 | 低単価件数 | 全件数 | 割合 |
9 | 9 | 21 | 42.86% |
10 | 12 | 30 | 40.00% |
11 | 81 | 261 | 31.03% |
12 | 76 | 284 | 26.76% |
13 | 35 | 102 | 34.31% |
14 | 13 | 25 | 52.00% |
15 | 6 | 9 | 66.67% |
16 | 6 | 17 | 35.29% |
17 | 38 | 204 | 18.63% |
18 | 49 | 313 | 15.65% |
19 | 38 | 212 | 17.92% |
20 | 14 | 44 | 31.82% |
21 | 4 | 4 | 100.00% |
22 | 2 | 2 | 100.00% |
配達件数100件以上の時間帯に絞ってみる。
時間帯 | 低単価件数 | 全件数 | 割合 |
11 | 81 | 261 | 31.03% |
12 | 76 | 284 | 26.76% |
13 | 35 | 102 | 34.31% |
17 | 38 | 204 | 18.63% |
18 | 49 | 313 | 15.65% |
19 | 38 | 212 | 17.92% |
昼と夜で低単価件数の割合に差があるように思える。
昼と夜をそれぞれまとめてみる。
時間帯 | 低単価件数 | 全件数 | 割合 |
昼ピーク(11~13) | 192 | 647 | 29.68% |
夜ピーク(17~19) | 125 | 729 | 17.15% |
この両方の割合に差があるかどうかを確かめてみる。
> prop.test(c(192,125),c(647,729)) 2-sample test for equality of proportions with continuity correction data: c(192, 125) out of c(647, 729) X-squared = 29.644, df = 1, p-value = 5.192e-08 alternative hypothesis: two.sided 95 percent confidence interval: 0.07924431 0.17132866 sample estimates: prop 1 prop 2 0.2967543 0.1714678
結果、P値は「5.192e-08」となり、有意水準5%で有意となった。つまり、差があると認められた。

夜ピークより昼ピークの方が低単価の割合が高いということだね。
低単価×曜日
曜日に着目して、低単価の件数を見てみる。
曜日 | 低単価件数 | 全件数 | 割合 |
月 | 61 | 264 | 23.11% |
火 | 69 | 207 | 33.33% |
水 | 65 | 204 | 31.86% |
木 | 56 | 163 | 34.36% |
金 | 47 | 211 | 22.27% |
土 | 42 | 220 | 19.09% |
日 | 43 | 259 | 16.60% |
各曜日で低単価件数に差がないと仮定し、適合度検定を行う。後、残差分析を行い、各曜日の標準化残差とP値を調べる。
> low_price <- scan("clipboard") #低単価データ > expected_value <- scan("clipboard") #期待値 > res <- chisq.test(low_price,p= expected_value/383) > res$stdres [1] -0.6991527 2.5553614 2.0832026 2.5066002 -0.8720958 -1.9130909 -2.9852037 > p.value.matrix <- pnorm(abs(res$stdres),lower.tail = FALSE)*2 > round(p.value.matrix,4)*100 [1] 48.45 1.06 3.72 1.22 38.32 5.57 0.28
表にまとめる。
曜日 | 低単価件数 | 全件数 | 割合 | 期待値 | 標準化残差※ | P値(%) |
月 | 61 | 264 | 23.11% | 66.17277487 | -0.6991527 | 48.45 |
火 | 69 | 207 | 33.33% | 51.8854712 | 2.5553614 | 1.06 |
水 | 65 | 204 | 31.86% | 51.13350785 | 2.0832026 | 3.72 |
木 | 56 | 163 | 34.36% | 40.85667539 | 2.5066002 | 1.22 |
金 | 47 | 211 | 22.27% | 52.88808901 | -0.8720958 | 38.32 |
土 | 42 | 220 | 19.09% | 55.14397906 | -1.9130909 | 5.57 |
日 | 43 | 259 | 16.60% | 64.91950262 | -2.9852037 | 0.28 |
※0から標準偏差いくつ分ずれているかを示している。
結果、火水木日が有意水準5%で有意となった。その内、火水木が期待値より高いという意味で有意、日が期待値より低いという意味で有意となった。
つまり、火水木に低単価の割合が高い。
まとめ
今回は、スリコに着目した前回記事を「低単価」に変えて、分析を行ってみた。
結果、分かったことは下記の3つ。
・夜ピーク時の低単価の割合は低い
・火水木の低単価の割合は高く、日曜日は低い
単価が低くなる要因として、曜日と時間帯が関係していることは今回の分析より大方推測できる。が、それ以外の要因は、いまのところまったく分からない。
今後、曜日と時間帯以外の低単価の要因を見つけるには、この2つの要因の影響が小さい条件で単価の変動を見る必要がある。そうなると、今回の分析結果より、「日曜日かつ夜ピーク時」が両者の影響が最も小さい。
次回は、「日曜日かつ夜ピーク時」のデータに絞って、低単価を考察してみる。
コメント