Tableauでデータ階層構造設定して管理

メジャーネームの各データには階層構造、もしくは親子構造を持つものがあります。データを読み込んだ当初は、どれもが並列のように扱われていますが、これをTableauにて階層構造を指定することで、データの親子区分、従属関係などもすっきりし、さらにデータのドリルダウン時にも便利です。今回は、この階層構造に設定する方法について整理します。

扱うデータは、Tableauインストール時の研修用データでも使われる、Spermaekrtの販売データを使ってやりたいと思います。

通常・初期状態

例えば、メジャーネームのツリーは読み込んだ当初は、以下のような状態です。

例えば、地理情報がついている以下の情報は、データとしては従属関係、もしくは親子関係にあると言えます。

各種情報がありますが、日本語でして親子関係を整理するとなれば、

「State」→「Region」→「State」→「Postal Code」→「City」といったところです。

日本語におきかえると、

「国名」→「地域(東北、関東、関西等)」→「都道府県」→「郵便番号」→「都市名」といった親子関係がつくと思います。郵便番号を入れるかどうか悩ましいですが、独立させておいても郵便番号は良いでしょうし、あるいは「City」の前に設定しても良いでしょう。この辺りは好みになるかもしれません。

Tableauにてクロス集計出力すると、以下のような表になります。

設定方法

それではまずは、この地理情報に関する各データの階層構造を作成してみます。

  1. Country
  2. Region
  3. State
  4. Postal Code
  5. City

の順番になるように設定していきます。

階層名定義

まずはこれらを束ねる階層名を設定する必要があります。

・「State]を右クリック →「階層」→「階層の作成」をクリック

・階層名を名前を設定するサブウインドウが表示されますので、「Location」とでも入力し、OKボタンを押下します

・すると階層構造のツリーが一つ作成されます。

・以降、関係するメジャーネームをこの階層に組み込んでいきます。関連するメジャーバリューを右クリックし、「階層」→「階層に追加」→先ほど作成した「Location」をクリックします。

・すると、「State」の下に、「Region」が追加されています。

・右クリックベースで追加する方法以外に、対象のメジャーバリューをドラッグして、ツリー内に入れ込んでも加えることができます。

ドラッグしたメジャーネームを動かすことができ、「ーーー」ラインが出て、指定の場所に入れ込むことができます。

親子関係・従属整理

ドリルダウンする際に、より広い枠組のデータから展開されるようにデータの順番を並び替えます。並び替えは、メジャーネームをドラッグして上下に動かすだけです。

並べている順番そのものがドリルダウンする順番になるので、より大きなカテゴリのメジャーネームが上にくるようにします。それでは、「Country」「Postal Code」「City」も同様にこのツリー下に加えていき、順番も調整したものが以下の状態です。

そして、階層が定義されると、すでに行シェルフに入れているメジャーバリューの頭に「ー」のようなマークがついていますね。

Countryの「ー」をクリックすると、ダリルダウンの逆で、ドリルアップ(こんな風にいくのかわかりませんが)されています。

ここからドリルダウンしていくと・・・

となり、さらにRegionの「+」を展開していくと、こうなります。

さらに展開と簡単に親子関係、従属関係ができます。

グラフへの応用

棒グラフを加えると、ドリルダウンの展開が楽しいです。

US内の4地域でだとこうなりまして、

州毎にするとこうなります。

州名がアルファベットの昇順にならんでいますので、これを棒グラフの横バーの長さ順にならべると、こうなります。

昇順・降順に並べる方法はいくつかありますが、最も手軽なものは、メニューバーの下にあるアイコンを押すだけです。

さらに展開して、郵便コードと都市名まで含めるとこうなります。

Houston内には複数の郵便コードがあるので、これを統一したい場合は、「行シェルフ」にある、「Postal Code」を外せばよいですね。

同じ考え方で今度は、「商品」に関連するメジャーネームを階層化してみると、こんな階層になります。

大きなカテゴリ、サブカテゴリ、その下に具体的な商品名です。

ここで商品名までドリルダウンすると、商品名が多すぎるので、こんなグラフになります。

最後に

データ展開時、関連するメジャーネームを階層化していく流れを整理してみました。階層化しておくと、クロス集計やグラフ作成時にも何かと便利であり、上長から指摘時に情報の粒度を設定する際も便利ですね。

年月日などの時系列データなどはデフォルトで、年、クオーター(Q)、月などをドリルダウンできますが、こうした商品種別や地域性などについても階層構造にしておくと何かと便利ですので、お勧めです。

最後までお読みいただき、ありがとうございました。

Tableauに関しては、Tableau Publicにも公開されているデータを使って各種ダッシュボードを作成や、その他Tipsをブログ内にも書いているので、お時間許せば参照ください。

https://kinokoblog.info/tag/tableau/

Tableau階層構造のデータ設定
最新情報をチェックしよう!