はじめに
こんにちは!ひらちんです!Rを使った統計について自分の勉強も兼ねて記事にしています。
今回は、最大値・最小値・中央値です!
次のサンプルを使ってそれぞれ算出してみたいと思います。
名前 | 身長 |
---|---|
Aさん | 171cm |
Bさん | 177cm |
Cさん | 169cm |
Dさん | 165cm |
Eさん | 172cm |
Fさん | 174cm |
Gさん | 188cm |
Hさん | 190cm |
Iさん | 175cm |
Jさん | 169cm |
変数 x にこのデータを入れておきます。
x <- c(171, 177, 169, 165, 172, 174, 188, 190, 175, 169)
最大値
最大値は、与えられたデータの中で一番大きい数値を返します。
Rでは max関数を使うことで抽出出来ます。
max(データのベクトル)
簡単ですね。
一番大きい「190」が返されました。
最小値
次に最小値です。
最小値は、データの中で一番小さい数値を返します。
Rでは min関数を使うことで抽出出来ます。
min(データのベクトル)
問題ないですね。やってみましょう。
一番小さい「165」が返されました。
中央値
最後に、中央値です。
中央値は、データを小さいもん順(大きいもん順)に並べたときに一番真ん中に来る数値を返します。
※データが偶数個の場合は、真ん中2つの平均値を返します。
Rでは median関数を使うことで抽出出来ます。
median(データのベクトル)
サンプルのデータは、10個なので偶数ですね。
結果がどうなるのかやってみます
データを小さいもん順に並べると
165, 169, 169, 171, 172, 174, 175, 177, 188, 190
となりますね。
偶数なので、真ん中2つ(5番目と6番目)の平均値が返されているはずです。
( 172 + 174 ) ÷ 2 =173
合ってますね(^o^)
では、データを奇数個にしてみましょう。
x <- c(171, 177, 169, 165, 172, 174, 188, 190, 175, 169, 183)
183を追加しました。
データを順番に並べると
165, 169, 169, 171, 172, 174, 175, 177, 183, 188, 190
になるので、6番目が真ん中になって「174」が返ってくるでしょうか。
やってみましょう。
174が返ってきました(^o^)
欠損値(NA)がある場合
max関数 min関数 median関数 それぞれ、データに欠損値(NA)がある場合は、引数 na.rm にTRUE を指定することで欠損値(NA)を除いて算出してくれます。
max(x, na.rm=TRUE)
min(x, na.rm=TRUE)
median(x, na.rm=TRUE)
データに欠損値を入れて試してみます。
こんな感じですね。
まとめ
今回は、Rで最大値・最小値・中央値を勉強しました!
簡単過ぎて死にそうですね(^o^)
コメント