家計調査のデータでVizを作ってみた
今回は、県庁所在地別の1世帯あたりの品目別支出金額のデータを使って
肉類の年間支出金額の傾向がわかるようにVizを作成しました。
<データ引用元>
1.Tableauへ接続する前にデータを整える
e-statsにあるデータをそのまま接続するとtableauがうまく読み込めなさそうだったので不要な行や列を削除しました。
・今回は都道府県(県庁所在地)ごとにまとめるので都市階級、地域ごとのデータは削除
・支出金額の比較をしたいので数量の列は削除
・肉の種類ごとに分かれているが、一部合計した数字が入っているので削除
(編集前のデータで接続してもTableau側の操作で整えられそうですが、ビギナーなのでひとまず接続前に編集しました。)
<Before>
<After>
かなりすっきりしました。
2.データ接続
①データソースの追加
そのまま接続するとこんなかんじ。
NULLがあったり、肉の種類ごとに列が分かれていてTableauでは処理がしにくいので編集。
・データインタープリターの使用
・肉の種類の列を選択してピボット
・不要な列の非表示
横並びのデータ(アンスタックデータ)から縦並びのデータ(スタックデータ)に変わりました。
②都道府県情報、地域情報のシートと結合
元のデータだと県庁所在地情報しか入っていないので、都道府県情報や地域情報が入ったテーブルと結合しました。
3.Vizの作成
今回作成したダッシュボードです!
https://public.tableau.com/app/profile/kaoru.kishiue/viz/2020_16542441520020/sheet0
■工夫したところ
・肉の種類をドロップダウンのフィルターで選択できるようにした
・日本地図を使ってざっくりどの地域が支出金額が多いかわかるようにした
・ツリーマップで地域ごとの平均支出金額がわかるようにした
・都道府県別の棒グラフを作成して上位の都道府県がわかるようにした
・ツリーマップと棒グラフは地域ごとに色分けした
・ツールヒントで必要な情報が表示されるように編集した
・ダッシュボードアクションを設定した
■備忘録
①マップ
・詳細→都道府県、色→金額を入れる
②ツリーマップ
・地方別平均支出金額を計算
ROUND*1,0)
・サイズ→地方別平均、色→地域を入れる
③都道府県ランキング
・列→金額、行→都道府県、色→地域を入れる
・軸の編集>各行または列の独立した軸範囲 を選択
4.気づき
①牛肉の支出金額は近畿地方が多い
(近畿地方は2位の中国地方より約1万円も多く圧倒的!)
②鶏肉の支出金額は九州地方が多い
③豚肉の支出金額は東日本が多い
④他の生鮮肉は北海道(ジンギスカン?)と熊本県(馬肉?)がツートップ
⑤寒い地域(北海道、東北、信越)は合いびき肉の支出金額が少ない
牛肉の傾向がかなり顕著で興味深いです。
神戸牛、近江牛などたしかにブランド牛が多いイメージですね。
5.最後に
師匠と相談してなんとなく選んだテーマでしたが、肉の種類ごとに地域傾向があって予想以上に面白い結果が得られました。
こういう切り口のデータもあったらもっとわかりやすいかも…などと試行錯誤しながVizを作成するのも初めてで楽しかったです。
一人前のDATA Saberになれるよう色々なデータでVizを作成に挑戦したいと思います。