準備
[1] RStudioを起動
[2] irisデータをload
> data(iris) irisデータをloadする
前回の続き(15ページThere's moreからp.17 How t do it.. 5まで)
===[15p]==========================================
irisのデータ構造を確認するコマンド群を理解する
class(iris) Rデータ構造のどれか?→データフレーム
1次元(vector, list)
vdat <- c(1,2,5)
ldat <- list(1, "A", 2, "Z")
2次元(matrix, data frame)
mdat <- matrix(c(1,2,3,4,5,6,7,8,9),nrow=3)
fdat <- data.frame(
idx1 = c(1,2,3),
con1 = c("A","B","c"),
idx2 = c(4,5,6),
con2 = c("D","E","F")
)
連続データの作成
ldat2 <- list(1:5, 6:10, 11:15 )
dim(iris) 何行何列か確認→(150行と5列)
head(iris) 最初6行のデータ中身を表示
tail(iris) 最後6行のデータ中身を表示
===[16p]========================================
menuからpackageのインストール
[1]CPAN mirror→Tokyo選択
[2]パッケージのインストール
WriteXLS 選択
library(WriteXLS)
WriteXLS(iris, "tmp.xls")
===[17p]======================================
データの一部抽出
------(1)---------------------------------------------------------
> str(iris) オブジェクト概要表示
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
> summary(iris) オブジェクト統計情報表示
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50
Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
-------(2)---------------------------------------------------
> irisデータの一部抽出した変数作成
myiris=data.frame(Sepal.Length=iris$Sepal.Length,Sepal.Width=iris$Sepal.Width,Species=iris$Species)
> str(myiris) 3列抽出を確認
'data.frame': 150 obs. of 3 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
抽出サイズも確認しておく
> dim(iris)
[1] 150 5
> dim(myiris)
[1] 150 3
----------(3)------------------------------------
別の抽出方法(1)も覚える
> myiris2 <- iris[,c(1,2,5)]
> dim(myiris2)
[1] 150 3
---------(4)------------------------------
別の抽出方法(2)も覚える
> myiris3 <- iris[,-c(3,4)]
> dim(myiris3)
[1] 150 3