極端に高かったり、低かったりする外れの値に左右されず、データのちょうど真ん中の値になる中央値は、実感に近い値を求められることがメリットです。
このページでは平均値と中央値の違いや、中央値を求めるMEDIAN関数の使い方を解説しています。
平均値と中央値の違い
平均値とは、全てのデータの値を足した合計を、データの数で割って算出した値のことです。平均値を求める関数はAVERAGE関数を使用します。
一方、中央値とは、データを大きい順、又は小さい順で並べた時にちょうど真ん中の値のことを言います。平均値の場合はデータの中に極端に他から外れている数値があると、その数値に影響された数値が出てしまいます。
下の例だと、実際には1~4の間に数値が集まっているのに、極端に数値が違う値(外れ値)の”100”に引っ張られ平均値は ”22” となっています。一方、中央値は真ん中の値をとるため ”3” となり、実際の数値に近い値になります。
(例) [1,2,3,4,100] 平均値⇒22 中央値⇒3
データの中に極端に数値が違う値(外れ値)がある場合は平均値と合わせて中央値も使用することで、より実態に近い数値を求められ、明瞭な比較や分析を行うことが可能です。
中央値の求め方 (MEDIAN関数の使い方)
■数式
MEDIAN(数値1,[数値2],...)
※ 数値1,数値2,... 数値1は必須で、それ以降の数値は省略可能です。
■例
=MEDIAN(D3:D17)
MEDIAN関数 基本の使い方
MEDIAN関数を使って以下の手順で中央値を求めることができます。
※例では製品の金額の中央値を求めます。
中央値のデータを表示したいセルを選択する
※ ここではF3 のセルを選択。
数式バーの横にある「fx」ボタンをクリックし、「関数の挿入」ダイアログボックスを表示し、「関数の検索」に「MEDIAN」と入力して「検索開始」をクリックする
検索結果の関数名の項目に「MEDIAN」が表示されるので「OK」をクリックする
関数の引数」ダイアログボックスが表示されるので、「数値1」の項目に中央値を求めたい数値の範囲を入力し、「OK」をクリックする
※ ここではC3からC17を選択。
</p
最初に選択したセル(=F3)に、中央値が表示される
MEDIAN関数 基本の使い方(データ数が偶数の場合)
対象データが奇数の場合、中央のデータが中央値となりますが、対象データが偶数の場合、中央のデータは2つになるため2つの数値の平均値が中央値となります。 以下の図では、真ん中の値の「199,800」と「219,800」を2で割った「209,800」が中央値となります。
MEDIAN関数を使用すると、データの数が偶数の場合でも、真ん中の2つの値の平均値を自動で算出してくれます。
MEDIAN関数 基本の使い方(0のデータを除く場合)
データの中に「0」が含まれ、「0」のデータを除いた中央値を求めたい場合はMEDIAN関数とIF関数を組み合わせた以下を入力します。
■数式
=MEDIAN(IF(数値1:数値2>0,数値1:数値2))
■例
=MEDIAN(IF(C3:C17>0,C3:C17))
まとめ
データの数が奇数の場合でも偶数の場合でも、MEDIAN関数を使用することで簡単に中央値を求めることができます。
中央値は対象データのうち、多くても2つのデータしか算出できないため全体としての動きが見えづらいデメリットもあります。 数値が違う値(外れ値)が多い場合や、真ん中の値を求めたい場合はMEDIAN関数を使用して中央値を求めるようにしましょう。