コラム・エッセイ
中高生が学ぶ統計の話
ちょこっと豆知識 立入塾貯蓄額の平均を聞くとショックを通り超して諦めの気分になりますが、中央値を聞くと少しだけ安心します。中央値とはデータを大きさ順に並べた時、ちょうど真ん中になる数値のことです。平均値と中央値は似ていますが、平均値は極端な値(例えばポケットマネーで宇宙へ行った大金持ち)があると実際とかけ離れた値になってしまいます。
箱ひげ図は、データを中央値の前後で半分に分け、さらにそれぞれの中央値を求め、最小値、最大値と共に視覚的に表したもので、中学で学習します。高校では統計に関してもう少し詳しく学びます。平均値と個々のデータとの差の平均を出せばデータのばらつき具合を知ることが出来ます。
しかし平均値とデータの差だけで計算するとプラス(平均より大きい値)とマイナス(小さい値)で相殺してしまいます。そこで差を一旦2乗してすべてをプラスにしてから平均を求めます。これが分散です。分散は2乗した値なので元の値に戻すために分散値の平方根(いわゆるルート)を取ります。この値が標準偏差になります。さて、2つのデータ間の関係について考えてみましょう。
例えば数学の点数とかけっこのタイムに関係があるのかないのかを調べます。2つのデータの関係を相関関係と言い、分かりやすく数値化したのが相関係数です。相関係数は-1〜+1で表され、-1に近かければ負の相関関係(一方だけ得意)、+1に近ければ正の相関関係(両方得意か両方苦手)となります。相関係数を計算するには、2つのデータ(数学とかけっこ)の平均値と個々のデータの差を掛けた合わせた値の平均を出します。両方得意あるいは苦手だとプラス、どちらか一方だけ得意だとマイナスの値になります。この値を共分散と言いますが、このままではデータによって値がまちまちになってしまいますので、共分散を2つの標準偏差で割ってやると-1〜+1に収まります。
いざ自分で求めてみるとかなり面倒で、先日共通テストを受けた受験生は大変だったと思います。
(立入塾 周南市開作北819-7 TEL.0834-25-4553)
