「数学嫌い」が見抜けない「平均値」の落とし穴

平均値は、身長や血圧といった「1つのサンプルの値がほかのサンプルの10倍、100倍、……1万倍などにはならない」という数字においては非常に有効です。一方で、今回のケースや、資産、年収といった、少数のサンプルが平均値を大きく上げてしまうケースには不向きなのです。

平均という言葉にはどうしても「人並み」「合格ライン」といった印象が付きまといます。そして実際にそれと比較して何かを判断する人は多いはずです。しかし平均は決して人並みの数字ではないことも多いのです。

問題⓶このワナに気づきますか?【難易度:高】

さて、先のケースでは、「サンプルの取り方」という点でも複数の落とし穴に陥っています。お気づきになったでしょうか? これは難易度が高く、ビジネススクールに来ている学生でも気がつかない人のほうが多いです。

まず、「映画館に来た人に尋ねている」という点が問題です。世の中には映画館にまったく行かない人もかなりの比率でいるはずですが、このケースでは映画館に来た人に聞いていますから、当然ゼロという数値が出てきません。そこで平均値がかさ上げされているのです。街中や携帯電話番号でランダムに選んだサンプルに「月に何回映画館に行きますか」と聞いた結果とは異なるわけです。

さらに、この調査方法では、ヘビーユーザーに当たりやすいというワナも見逃しています。話をよりわかりやすくするために、より極端な例を考えてみましょう。

仮に映画館のユーザーが31人だけと考えてみます。1人目から30人目までは毎月1日、2日、……30日に習慣的に映画館に来るものとします。そして31人目は毎日(ここでは1カ月は30日として考えます)映画館に来ます。そうすると毎月1日から30日までの任意の日には必ず2人の観客がいることになります。そのうちの1人は毎日映画館に来る31人目の人です。
そして任意の日に来た2人の平均値をとると、(1+30)÷2=15.5回となってしまいます。要するに、現地に来た人にアンケートをとると、現地によく来る人の比率が実態よりも高くなり、そこでもかさ上げが起こるのです。

つまり、先ほどのアンケートは二重、三重のミスを犯していたわけです。特に最後の落とし穴に気がつく人は、筆者の経験ではかなりの少数派です。数学が苦手な人はまず気づきません。まさに統計は往々にしてウソをつき、多くの人はそのワナのすべてを看破することは難しいのです。

加重平均は重みづけ次第

単純平均ではなく、重みづけをした加重平均もよく用いられます。難しいのは、その重みづけの設定です。生データは同じでも、重みづけの仕方次第で評価が変わるということも生じがちなのです。

例として、中途社員採用を考えてみます。1人だけ採用したいのですが、Aさん、Bさんの2人の有力候補者がいます。評価項目は、1)即戦力度合い、2)伸びしろ、3)組織文化とのフィット感としましょう。数人の面談を経て、Aさん、Bさんのそれぞれの点数は以下のようになりました。この数字自体は妥当性のあるものとしていったん議論を進めます。
Aさん:
即戦力度合い 9点
伸びしろ 8点
組織文化とのフィット感 6点
Bさん:
即戦力度合い 7点
伸びしろ 9点
組織文化とのフィット感 8点

さて、今回のケースではどちらを採用すべきでしょうか? 人事部長は、それまでの会社の慣例に従い、即戦力度合い、伸びしろ、組織文化とのフィット感の比重を30%、20%、50%として、Aさん、Bさんの総合評価を以下のように計算し、Bさんを推薦しました。さて、この判断は妥当でしょうか?

Aさん:9×0.3+8×0.2+6×0.5=7.3
Bさん:7×0.3+9×0.2+8×0.5=7.9