プレジデントオンラインに統計の記事が掲載されていました。 朝食や出社時間と、営業成績に「相関関係」はあるか? http://president.jp/articles/-/12416 上記の記事では確かに数式は出てこないのでとっつきやすく解説は詳しいので統計の入門にはピッタリです。しかしながらエクセルで手計算することが前提になっておりこれは若干億劫です。 そこで今まで利用してきた Python でこれらの問題を計算してみたいと思います。 問題とその解法 問題の内容としては各社員の、朝食を食べてきた確率 (= 朝食率) 、出社時間、それに対して営業成績を 3 つの変数として相関関係があるか調べるというものです。このように変数の間の相関関係を調べるというのはさまざまな統計の基本とも言えるでしょう。 計算機で扱えるように、それぞれの変数を X Y Z としましょう。まずはこれをCSV ファイルの