【やり直数学】いろんな平均についてやり直す




やり直数学
Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone

デジタルマーケティングに使える統計解析やウェブ解析についての質問に答えてくれるFacebook Messenger Bot、「知野いずみ」を運用するにあたって、ウェブ解析マスターとは言えやっぱりいろいろ言葉の定義を学び直す機会が増えてきました。まぁ機能説明がてら、その説明をブログとしてまとめておこうと思います。まずは「統計界のHello world!」とも言える、平均について。

平均の取扱に必要なのは、注意よりも種類?

ウェブ解析を学んでいくと、「平均値は異常値の影響を受け易いので注意」という話が出ます。データの傾向を見るには、「中央値」や「最頻値」の利用を推奨するケースも見られます。

傾向という意味では上記のとおりですが、そもそも「何の平均を出すか?」によって求め方も違います。そしてそれぞれ、エクセルで関数も用意されているので、正しい算出方法で求めるようにしないといけません。

平均の種類と求め方

1. 算術平均(相加平均)

よく言われる「平均」は、算術平均(相加平均)です。n個のデータの総和をnで割ったものです。

算術平均

利用シーンとしては、一般的な整数データによる母集団がある場合。エクセルではAVERAGE関数を使います。

AVERAGE(数値 1, [数値 2], …) Officeヘルプ

前述の通り、異常値に引っ張られるケースがあるので、データの上下端を省く関数なんかもあります。

TRIMMEAN(配列, 割合) Officeヘルプ

割合には、省くパーセンテージを指定します。

2. 幾何平均(相乗平均)

とある値の前年度比率が、前々年度は120%、前年度は80%、今年度は150%とした場合、普通に算術平均してしまうと

(1.2+0.8+1.5) / 3 = 1.17 平均117%

となってしまいますが、実際の成長実数値は

1 × 1.2 × 0.8 × 1.5 = 1.44

で、元の数値よりも144%改善されています。これから平均する時も、

0.44 ^ 1/ 3 = 0.13 = 平均113%

と、母数が総和でなく総積なので、n個で割らずに1/n乗する必要があります。これが、幾何平均(相乗平均)です。

微妙な差のようで、ここはしっかりと正しいデータを使いたいところ。これをエクセルで算出する際は、GEOMEAN関数を使います。

GEOMEAN(数値 1, [数値 2], …) Officeヘルプ

数値には、前年度比などのパーセンテージを指定します。

3. 調和平均

あまり使ったことがないのですが、「時速」などの数値を平均する際に使われるのが、「調和平均」です。

調和平均

 

仮に100kmの距離間を、行きは25km/h、帰りは50km/hで往復した場合、平均時速は

(1/25 +1/50) * 1/2 = 0.03 = 1/33.333…

という事で、平均時速は約33.3km/hとなります。実際にも

(100km ÷ 25km/h) + (100km ÷ 50km/h) = 6h
200km ÷ 6h = 33.333…km/h

という事で、正しい事がわかります。

これをエクセルで算出する関数が、HARMEAN関数になります。

HARMEAN(数値 1, [数値 2], …) Officeヘルプ

上記式のHが算出されます。


という事で、扱う数値によって平均の算出方法も異なるため注意が必要。「知野いずみ」では、「出したい平均名+エクセル」というワードで口語ででも聞いてくれれば、関数名をお答えしますので、ぜひ使ってみてください。

知野いずみ

 

Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someone