なんとなく

2つのデータには「正の相関がある」「負の相関がある」「相関がない」のいずれであるか答え、そのように判断した理由を述べよ.

という出題をしたら、

「相関がない」、理由は「なんとなく」

という解答があった。

高校でデータの分析を学ぶようになった世代から、

「正の相関がある」、理由は「散布図が右上がりだから」

という解答が増えたが、これは良くない。「散布図が右上がり」かどうかを見ためで判断せずに数値としての客観的指標で表現するために「共分散」を定義し、共分散のスケール依存性を除くためにスケール不変な「相関係数」を定義したのだから、こちらの数値を持ち出して議論していただきたい。もちろん、これらは客観的指標の1つに過ぎないのだが、「正の相関がある」の定義が「相関係数が正である」ということだから定義通り使ってくれナイト。もちろん、事前に

「正の相関がある」、理由は「散布図が右上がりだから」

という答案は、今回は評価しないということは予め伝えてある。つまり、聞いていないという訳だ。