Monday, June 1, 2009

在R宣告變數

先前的文章中有提到,使用R進行統計分析必須撰寫程式語法,既然是程式那就要提到變數了,因為我們必須將原始資料(Raw Data)輸入到R中以便進行後續的分析工作。變數名稱只要不用到R的關鍵字即可,在R中有三類的單變量(univariate)的變數:
  • 向量(vector):基本上就類似於程式語言中的『陣列(Array)』的概念,可分為數字向量(numeric)、邏輯向量(logical)、以及字元向量(character)。這些向量的物件可以使用C(......)將同類型的向量結合在一起。

Example 1:宣告數字向量
num<-c(100,102,103)
Example 2:宣告邏輯向量
logi<-c(T,T,F,T,F)
Example 3:宣告字元向量
name<-c("李等會","陳阿扁","馬小九")
P.S. <-就是指定(assign)的意思
  • 矩陣(Matrix):也就是指資料框(Data Frame),亦可視為二維表格(2-D table),它主要的功能在於將外部資料檔(例如:Excel檔或是文字檔)讀入,再進行更進一步的處理。如果使用data.frame()函數亦可將向量變數整合成矩陣。

Example 1:將數字向量結合成矩陣
a<-c(1,2,3,4,5)
b<-c(12,35,76,19,103)
mtx<-data.frame(a,b)
summary(mtx)
P.S. summary()函數會將矩陣中的每一行(column)進行總結,結果會顯示出最大值、最小值、平均數、第一四分位數、第三四分位數。
  • 因子(Factor):利用factor()函數可以將向量轉換為因子,以利進行因素分析或是分類。

Example 1:輸入資料並且轉換成因子
grade<-c("A","A","B","D","C","E","E","C","D","B")
grade<-factor(grade)
grade
summary(grade)

No comments:

Post a Comment