【2016/8/1改定】分析に(多分)使えるグラフの種類

Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone

(2016/8/1:統計学的要素がWeb解析にも浸透した感があるので、ちょっと文面見直しました。)

様々なデータを扱うことが当たり前になってきた昨今、それを視覚的に分かりやすくスキルというのも、かなり必要になってますよね。その場合、グラフの大きさや形状などでインフォグラフィック的に理解させるのもテクニックですが、解析結果としてキチンと「言いたいことが言えるグラフを作る」のも必要なんじゃないかと思います。

統計学が注目される昨今、RやPythonでの解析やグラフ化もいいのですが、まずはエクセルでできるところから学ぶと、グラフ化の意図もつかみやすいかも。という事で、分析に使えそうなグラフの種類を紹介します。

ちなみに、概念の理解自体が難しい多変量解析は、集計・分析時間もかかるし、イメージがつかないので他人の理解も得にくいという事で、今回は実務である程度使えそうなグラフに限ります。

分布図からの近似曲線

graph01

※最初に言っておきますが、値や軸の種類にあまり意味はありません。

2種類のデータの相関関係を出して、この値(要因)が伸びれば、これ(成果)も伸びますね、みたいな事を伝えやすいグラフ。散布図のグラフを作って、近似曲線を書くだけなので結構ラクです。

ただ気を付けなくてはいけないのが、相関係数です(エクセルでも表示できるRとかRの2乗とか)。エクセルはどんなデータでも近似曲線としてグラフを書いてくれますが、この係数が低い場合は「相関性が薄い」事になるので注意。できれば0.7くらいは欲しいところ。

たまーに調査データを示してる本で、この値が低いのに「こういう傾向にある」とか言ってしまってる事もあるけど、それは嘘になるので必ず確認して下さい。

分布図からのセグメンテーション

graph02

上と同じグラフでも、目的によってその後の分析内容も変わるという例。

この場合は、データの相関ではなくて、集合の傾向を見たもの。統計的に言うと、クラスター分析というものです。「この◯グループは広告流入が多い傾向なので、滞在時間とPVが上がるような改善施策を検討」とか、「このグループは滞在時間がどうであれPVが伸びないので、サイト内で悩んでる傾向にある」とか、そんなセグメントごとの対策に繋げるものとして、マーケティングでは必須の考え方でしょうか。

クラスタリングの機械学習は、今後のマーケティングでは必須の取り組みな香りがしますね。

ウォーターフォールチャート

graph03

これは統計的というより視覚的なグラフです。エクセルにおける「積み上げグラフ」でも構わないのですが、その内訳がビジネスプロセスだったりユーザーの行動遷移によるものであれば、ウォーターフォールチャートの方が視覚的に理解しやすいです。

図の例では、全体の流入に対してどこでユーザーが逃げているかを示しており、一番大きなところを目立たせておけば、一目瞭然ですね。

ちなみにこのグラフ図も「積み上げグラフ」で作っていてます。データ軸を2つ用意しておいて、その2つを積み上げます。その後、下の段のグラフだけを、「塗りつぶしなし」にすると出来上がり。最初はちょっと苦戦することもありますが、知ってしまえばすぐ作れます。


他にも統計的な図式はいくつかありますが、やっぱりグラフがベースだと分析ロジックが見えやすいので説得力があります。形式は何であれ、「何が言いたいか?」が「きちんとグラフで言えてるか?」を常に念頭におきながら、日々グラフを作ってます。

ちなみにこの手の内容は、覚えてすぐ次の日にでも使ってみないと、絶対忘れてもう使わなくなるので、その辺に落ちてるオープンデータとかでもいいので、ちょっと遊んでみるのが良いかと思います。

Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone