1. HOME
  2. ブログ
  3. データ分析
  4. データを鵜呑みにしてはならない!間違った解釈をしないための2つの方法「平均値の差」「相関性」

KUROCO NOTE

データ分析・活用ノウハウや調査報告などを発信しています

データ分析

データを鵜呑みにしてはならない!間違った解釈をしないための2つの方法「平均値の差」「相関性」

KUROCO株式会社 代表の齋藤健太です。

今回は「データを間違って解釈しないための2つの方法」についてお話したいと思います。

平均値の差

一つ目は「平均値の差」についてです。売上を上げるための一つの方法として、顧客別に訴求する商品を変えていくことがあるでしょう。

例えばECサイトビジネスにおいて、性別や年代ごとに購入している商品が違うのではないか、という仮説の元、打ち手を講じる上で、性別、年代別に購入されている商品の違いを分析することがあります。

このとき、一つの判断軸として、顧客セグメントごとに各商品の購入数や購入金額の平均の差を比較し、平均値に差があった場合、その商品はいずれかのセグメント顧客に対してよく買われている、という判断をして、例えば女性には〇〇、30代には▽▽といった商品を訴求する施策に繋げる、というものです。

しかし、単純に平均値の差を比較するだけでは間違っている可能性があります。その差がたまたま出たものなのか、今後も起こり得る「有意な差」があるのかを計算する必要があります。

有意な差があれば、それは偶然ではなく「明確な差があると言って良い」ことになりますので、その差をもとに打ち手を実行して良いですが、そうでない場合はデータに基づいた打ち手にはならないので注意してください。

相関性

二つ目は「相関性」です。売上とプラスの相関がある指標や顧客、商品などを分析したことはあるのではないでしょうか。

あるいは、コスト削減するために利益とマイナスの相関がある費目を分析することもあるかもしれません。所説ありますが、個人的には相関係数が±0.7以上あれば一定の相関はあると言って良いかと思います。

しかし、ビジネスとはそう簡単にはいきません。皆様もビジネスをしていたら感じる部分はあるかと思いますが、どの店舗も、あるいはどの顧客も、どの商品も同じようなルールのもと綺麗に数字が並ぶ、ということはないでしょう。必ず一定のルールから外れるイレギュラーとなる指標や顧客、商品などは出てきます。このイレギュラーとなる項目を除外することが必要です。

例えば、相関係数が0.6程度だとしても、もしかしたらその中の一部がイレギュラーとなり相関係数を押し下げているかもしれません。それを見つけるのに有用なのが「散布図」です。

数値だけで見るのではなくグラフ化することで視覚的に分かりやすくなることは多々あります。中でも散布図は数多あるデータがどんな関係性になっているのかを直感的に把握するのに優れたグラフだと私は思っています。相関性を判断する上でもとても活用できるので、ぜひ覚えておいてください。

このように、出てきた数字を鵜呑みにすると、もしかしたら間違った判断をしてしまうことはよくあります。特にビジネスにおいては、数字だけでは語れないことも多く出てきます。

「有意差」と「散布図」はぜひ覚えておいていただきたいのと、後はやはりビジネスは現場です。現場実務と照らし合わせて判断していくことがとても大切です。

今回はここまで。今月末に横浜に拠点を移しますが、変わらずビジネスのためのデータ活用支援をしていきますので、引き続き、よろしくお願いいたします。(不明点や自社であればどうすれば良いのかなど、お気軽にお問合せください)

関連記事