はじめに
こんにちは!ひらちんです!Rを使った統計について自分の勉強も兼ねて記事にしています。
今回は、最大値・最小値・中央値です!
次のサンプルを使ってそれぞれ算出してみたいと思います。
名前 | 身長 |
---|---|
Aさん | 171cm |
Bさん | 177cm |
Cさん | 169cm |
Dさん | 165cm |
Eさん | 172cm |
Fさん | 174cm |
Gさん | 188cm |
Hさん | 190cm |
Iさん | 175cm |
Jさん | 169cm |
変数 x にこのデータを入れておきます。
x <- c(171, 177, 169, 165, 172, 174, 188, 190, 175, 169)
![](https://hirachin.com/wp/wp-content/uploads/2023/05/a9bc99524f93d4b49c86327ff266815a.png)
最大値
最大値は、与えられたデータの中で一番大きい数値を返します。
Rでは max関数を使うことで抽出出来ます。
max(データのベクトル)
簡単ですね。
![](https://hirachin.com/wp/wp-content/uploads/2023/05/76e2a56a4d667bc9e3f74cbc67445fbc.png)
一番大きい「190」が返されました。
最小値
次に最小値です。
最小値は、データの中で一番小さい数値を返します。
Rでは min関数を使うことで抽出出来ます。
min(データのベクトル)
問題ないですね。やってみましょう。
![](https://hirachin.com/wp/wp-content/uploads/2023/05/852e38bea140d942e8e1e83b071acf31.png)
一番小さい「165」が返されました。
中央値
最後に、中央値です。
中央値は、データを小さいもん順(大きいもん順)に並べたときに一番真ん中に来る数値を返します。
※データが偶数個の場合は、真ん中2つの平均値を返します。
Rでは median関数を使うことで抽出出来ます。
median(データのベクトル)
サンプルのデータは、10個なので偶数ですね。
結果がどうなるのかやってみます
![](https://hirachin.com/wp/wp-content/uploads/2023/05/45547985ce623f479162fb58ba448311.png)
データを小さいもん順に並べると
165, 169, 169, 171, 172, 174, 175, 177, 188, 190
となりますね。
偶数なので、真ん中2つ(5番目と6番目)の平均値が返されているはずです。
( 172 + 174 ) ÷ 2 =173
合ってますね(^o^)
では、データを奇数個にしてみましょう。
x <- c(171, 177, 169, 165, 172, 174, 188, 190, 175, 169, 183)
183を追加しました。
データを順番に並べると
165, 169, 169, 171, 172, 174, 175, 177, 183, 188, 190
になるので、6番目が真ん中になって「174」が返ってくるでしょうか。
やってみましょう。
![](https://hirachin.com/wp/wp-content/uploads/2023/05/af589890788a52ca5a3389d0cc90a60a.png)
174が返ってきました(^o^)
欠損値(NA)がある場合
max関数 min関数 median関数 それぞれ、データに欠損値(NA)がある場合は、引数 na.rm にTRUE を指定することで欠損値(NA)を除いて算出してくれます。
max(x, na.rm=TRUE)
min(x, na.rm=TRUE)
median(x, na.rm=TRUE)
データに欠損値を入れて試してみます。
![](https://hirachin.com/wp/wp-content/uploads/2023/05/af1c58a3b651aa5cb412355113a0cacb.png)
こんな感じですね。
まとめ
今回は、Rで最大値・最小値・中央値を勉強しました!
簡単過ぎて死にそうですね(^o^)
コメント