Skip to content

Latest commit

 

History

History
102 lines (74 loc) · 3.18 KB

150420.md

File metadata and controls

102 lines (74 loc) · 3.18 KB
準備
[1] RStudioを起動
[2] irisデータをload
> data(iris)             irisデータをloadする


前回の続き(15ページThere's moreからp.17 How t do it.. 5まで)
===[15p]==========================================

irisのデータ構造を確認するコマンド群を理解する

class(iris) Rデータ構造のどれか?→データフレーム

1次元(vector, list)
    vdat <- c(1,2,5)
    ldat <-  list(1, "A",  2, "Z")
2次元(matrix, data frame)
   mdat <- matrix(c(1,2,3,4,5,6,7,8,9),nrow=3)
   fdat <-  data.frame(
                     idx1 = c(1,2,3),
                     con1 = c("A","B","c"),
                     idx2 = c(4,5,6),
                     con2 = c("D","E","F")
                    )
連続データの作成
    ldat2 <-  list(1:5, 6:10, 11:15 )


dim(iris) 何行何列か確認→(150行と5列)

head(iris)  最初6行のデータ中身を表示

tail(iris)    最後6行のデータ中身を表示

===[16p]========================================

menuからpackageのインストール
[1]CPAN mirror→Tokyo選択
[2]パッケージのインストール
WriteXLS 選択

library(WriteXLS)
WriteXLS(iris, "tmp.xls")

===[17p]======================================

データの一部抽出

------(1)---------------------------------------------------------
> str(iris)   オブジェクト概要表示
'data.frame': 150 obs. of  5 variables:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
 $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
 $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

> summary(iris)  オブジェクト統計情報表示
Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species  
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100   setosa    :50  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300   versicolor:50  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300   virginica :50  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199                  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800                  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500               

-------(2)---------------------------------------------------
> irisデータの一部抽出した変数作成
myiris=data.frame(Sepal.Length=iris$Sepal.Length,Sepal.Width=iris$Sepal.Width,Species=iris$Species)

> str(myiris)  3列抽出を確認
'data.frame':   150 obs. of  3 variables:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

抽出サイズも確認しておく
> dim(iris)
[1] 150   5
> dim(myiris)
[1] 150   3

----------(3)------------------------------------

別の抽出方法(1)も覚える

> myiris2 <- iris[,c(1,2,5)]

> dim(myiris2)
[1] 150   3

---------(4)------------------------------

別の抽出方法(2)も覚える

> myiris3 <- iris[,-c(3,4)]

> dim(myiris3)
[1] 150   3