関係と因果

Quantitative Method(以降QM)の中にRegression Analysis(回帰分析)という章があります。

おそらく統計を少しかじったことがある人は聞いたことがあると思いますが、まったく初めての人にさわりだけ簡単に説明すると「ある変数と別の変数に関係があるかをある程度の正確さで確かめる方法」です。

これだけでは何のことかわからないので、例を考えてみます。
例えば、スーパーで買い物をしたときにお金を支払います。みんなが支払うお金をを一つ目の変数とします。次にその人の収入を2つ目の変数とすると以下のような関係があるのではないかと推測されます。
支払うお金 = a * 収入 + b
回帰分析では上記のaおよびbを求めることで支払うお金と収入に関係があるかを確かめます。

次に「ある程度の正確さ」です。上記の式を求める際には推測するための元になるデータがなければなりません。要するにキャッシャーのところで100人くらいの人に今払ったお金とその人の収入を聞くわけですね(実際にはそんな失礼なことできませんが)。
しかしこの方法では2つのエラーが考えられます
 ・サンプルですので全体の傾向とは多少異なります
 ・すべてのデータがひとつの式に収まることもありません
よって式が算出されたとしてもそこにはエラーが考えられますので、その度合いを相関係数と呼ばれる値で測り、どの程度正確かを知ることができます。

さて回帰分析とは何かという話はここまでにして、「関係」と「因果」について考えてみます。QMではこの2つは厳密に区別されており、使用される単語もまったく異なります。

関係は relationshipやassociationであらわされますが、因果はcausalであらわされます。QMでは因果について問題が出ることはほとんどありません。実は因果関係を証明するというのは非常にやっかいであり、綿密な実験および分析がもとめられますので、Case Studyなどで簡単に述べることができる内容ではありません。

回帰分析で求められるのは「関係」だけであり、どんなにそのように見えても「因果」を求めることができません。

スーパーでの支払い金額と収入を例に取りますと、支払い金額が高ければ収入が高いように見えうるもしくは支払い金額が低ければ収入が低いように見えるという関係はあぶりだすことができますが、収入が高いから支払い金額が高いということはできません。もしかしたら支払い金額が高いから収入が高いかもしれませんし、まったく別の要因で関係があるように見えるだけかもしれません。

このあたりは以下の本に詳しく書かれていますので参考にしてください。
MBAクリティカルシンキング ダイヤモンド社

さて「関係」と「因果」の差はなんでしょうか。
ひとつの考え方として「どの程度外界の変化に影響されるか」があります。つまり「関係」はあくまで外界とのやり取りの中でたまたま2つの変数に関係があるようにみえています。しかし「因果」は片方を原因としてもう片方が結果として起こるために外界の変化には影響されません。

スーパーの例ですと外界、品揃えの異なったスーパー、駅からの距離が異なったスーパー、定休日が異なるスーパーなど様々な種類のスーパーを調べてみてもやはり支払い金額と収入には一定の関係があるとなれば、因果関係があるといえるかもしれません。ただそれでもどちらが原因でどちらが結果であるかを証明するのは難しいといえます。