平均値は、身長や血圧といった「1つのサンプルの値がほかのサンプルの10倍、100倍、……1万倍などにはならない」という数字においては非常に有効です。一方で、今回のケースや、資産、年収といった、少数のサンプルが平均値を大きく上げてしまうケースには不向きなのです。
平均という言葉にはどうしても「人並み」「合格ライン」といった印象が付きまといます。そして実際にそれと比較して何かを判断する人は多いはずです。しかし平均は決して人並みの数字ではないことも多いのです。
さて、先のケースでは、「サンプルの取り方」という点でも複数の落とし穴に陥っています。お気づきになったでしょうか? これは難易度が高く、ビジネススクールに来ている学生でも気がつかない人のほうが多いです。
まず、「映画館に来た人に尋ねている」という点が問題です。世の中には映画館にまったく行かない人もかなりの比率でいるはずですが、このケースでは映画館に来た人に聞いていますから、当然ゼロという数値が出てきません。そこで平均値がかさ上げされているのです。街中や携帯電話番号でランダムに選んだサンプルに「月に何回映画館に行きますか」と聞いた結果とは異なるわけです。
さらに、この調査方法では、ヘビーユーザーに当たりやすいというワナも見逃しています。話をよりわかりやすくするために、より極端な例を考えてみましょう。
つまり、先ほどのアンケートは二重、三重のミスを犯していたわけです。特に最後の落とし穴に気がつく人は、筆者の経験ではかなりの少数派です。数学が苦手な人はまず気づきません。まさに統計は往々にしてウソをつき、多くの人はそのワナのすべてを看破することは難しいのです。
単純平均ではなく、重みづけをした加重平均もよく用いられます。難しいのは、その重みづけの設定です。生データは同じでも、重みづけの仕方次第で評価が変わるということも生じがちなのです。
さて、今回のケースではどちらを採用すべきでしょうか? 人事部長は、それまでの会社の慣例に従い、即戦力度合い、伸びしろ、組織文化とのフィット感の比重を30%、20%、50%として、Aさん、Bさんの総合評価を以下のように計算し、Bさんを推薦しました。さて、この判断は妥当でしょうか?