【ウーバーイーツ】店舗データで非階層的クラスター分析【沖縄市】
前回、階層的クラスター分析を用いて、店舗のグループ分けを行った。今回は、非階層的クラスター分析を用いて、店舗のグループ分けを行ってみる。
参考書籍・資料

Rによるデータサイエンス(第2版):データ解析の基礎から最新手法まで
Amazonで金 明哲のRによるデータサイエンス(第2版):データ解析の基礎から最新手法まで。アマゾンならポイント還元本が多数。金 明哲作品ほか、お急ぎ便対象商品は当日お届けも可能。またRによるデータサイエンス(第2版):データ解析の基礎から最新手法までもアマゾン配送商品なら通常配送無料。
主な参考箇所 9 クラスター分析
概要
店舗データの確認
↓
非階層的クラスター分析について調べる
↓
K平均 (k-means)法で分析を行う
使用するデータ
使用するデータは、私の配達データ。
期間は、2021年5月10日~10月31日。
上記期間の総配達件数は、1528件。※ ダブルピックも1件とカウント。
店舗データの確認
今回扱うデータは、前回と同じもの。
非階層的クラスター分析について
非階層的クラスター分析について、参考書籍で調べてみる。
階層的クラスター法は個体数が多いと計算量が膨大になり、大拙のデータ解析には向いていない。大規模のデータセットのクラスター分析には、非階層的クラスター法が多く使用されている。非階層的クラスター法の代表的な方法としてK平均 (k-means)法がある。
K平均法が代表的な非階層的クラスター分析ということが分かった。
さっそく、やってみる。
K平均(k-means)法で分析
書籍のとおり、関数kmeansを使って、分析してみる。
> data.km <- kmeans(data,6) #クラスター数を6個に設定 > data.km$cluster [1] 1 5 5 5 6 5 4 6 2 3 4 4 3 3 6 3 3 3 4 6
結果を表にまとめる。
店舗番号 | グループ番号 |
1 | 1 |
2 | 5 |
3 | 5 |
4 | 5 |
5 | 6 |
6 | 5 |
7 | 4 |
8 | 6 |
9 | 2 |
10 | 3 |
11 | 4 |
12 | 4 |
13 | 3 |
14 | 3 |
15 | 6 |
16 | 3 |
17 | 3 |
18 | 3 |
19 | 4 |
20 | 6 |
上記のグループと前回の階層的クラスター分析でのグループを比較してみる。
店舗番号 | グループ番号 | ウォード法 | 一致・不一致 |
1 | 1 | 1 | 〇 |
2 | 5 | 2 | 〇 |
3 | 5 | 2 | 〇 |
4 | 5 | 2 | 〇 |
5 | 6 | 3 | ✕ |
6 | 5 | 4 | ✕ |
7 | 4 | 5 | 〇 |
8 | 6 | 4 | 〇 |
9 | 2 | 5 | ✕ |
10 | 3 | 6 | 〇 |
11 | 4 | 5 | 〇 |
12 | 4 | 5 | 〇 |
13 | 3 | 6 | 〇 |
14 | 3 | 6 | 〇 |
15 | 6 | 4 | 〇 |
16 | 3 | 6 | 〇 |
17 | 3 | 6 | 〇 |
18 | 3 | 6 | 〇 |
19 | 4 | 5 | 〇 |
20 | 6 | 4 | 〇 |
特に大きなズレはなかった。
まとめ
今回は、非階層的クラスター分析の1つであるK平均(k-means)法を用いて、店舗データのクラスター分析を行ってみた。
結果、グループの分け方としては、階層的クラスター分析と非階層的クラスター分析で大きな差はなかった。
コメント