R中的統(tǒng)計(jì)分析通過(guò)使用許多內(nèi)置函數(shù)來(lái)執(zhí)行的。這些函數(shù)大部分是R基礎(chǔ)包的一部分。這些函數(shù)將R向量與參數(shù)一起作為輸入,并在執(zhí)行計(jì)算后給出結(jié)果。
我們?cè)诒菊轮杏懻摰氖侨绾吻笃骄?,中位?shù)和眾數(shù)。下面將分別一個(gè)個(gè)演示和講解 -
平均值是通過(guò)取數(shù)值的總和并除以數(shù)據(jù)序列中的值的數(shù)量來(lái)計(jì)算。函數(shù)mean()用于在R中計(jì)算平均值。
語(yǔ)法
R中計(jì)算平均值的基本語(yǔ)法是 -
mean(x, trim = 0, na.rm = FALSE, ...)
以下是使用的參數(shù)的描述 -
示例
# Create a vector.
x <- c(17,8,6,4.12,11,8,54,-11,18,-7)
# Find Mean.
result.mean <- mean(x)
print(result.mean)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 10.812
當(dāng)提供trim參數(shù)時(shí),向量中的值進(jìn)行排序,然后從計(jì)算平均值中刪除所需數(shù)量的觀察值。
例如,當(dāng)trim = 0.3時(shí),每一端的3個(gè)值將從計(jì)算中刪除以找到均值。
在這種情況下,排序的向量為(-21,-5,2,3,42,7,8,12,18,54),從用于計(jì)算平均值的向量中從左邊刪除:(-21,-5,2)和從右邊刪除:(12,18,54)這幾個(gè)值。
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find Mean.
result.mean <- mean(x,trim = 0.3)
print(result.mean)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 5.55
如果缺少值,則平均函數(shù)返回NA。要從計(jì)算中刪除缺少的值,請(qǐng)使用na.rm = TRUE。 這意味著刪除NA值。參考以下示例代碼 -
# Create a vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5,NA)
# Find mean.
result.mean <- mean(x)
print(result.mean)
# Find mean dropping NA values.
result.mean <- mean(x,na.rm = TRUE)
print(result.mean)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] NA
[1] 8.22
數(shù)據(jù)系列中的中間值被稱為中位數(shù)。R中使用median()函數(shù)來(lái)計(jì)算中位數(shù)。
語(yǔ)法
R中計(jì)算位數(shù)的基本語(yǔ)法是 -
median(x, na.rm = FALSE)
以下是使用的參數(shù)的描述 -
示例
# Create the vector.
x <- c(12,7,3,4.2,18,2,54,-21,8,-5)
# Find the median.
median.result <- median(x)
print(median.result)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 5.6
眾數(shù)是指給定的一組數(shù)據(jù)集合中出現(xiàn)次數(shù)最多的值。不同于平均值和中位數(shù),眾數(shù)可以同時(shí)具有數(shù)字和字符數(shù)據(jù)。
R沒(méi)有標(biāo)準(zhǔn)的內(nèi)置函數(shù)來(lái)計(jì)算眾數(shù)。因此,我們將創(chuàng)建一個(gè)用戶自定義函數(shù)來(lái)計(jì)算R中的數(shù)據(jù)集的眾數(shù)。該函數(shù)將向量作為輸入,并將眾數(shù)值作為輸出。
示例
# Create the function.
getmode <- function(v) {
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}
# Create the vector with numbers.
v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)
# Calculate the mode using the user function.
result <- getmode(v)
print(result)
# Create the vector with characters.
charv <- c("baidu.com","tmall.com","yiibai.com","qq.com","yiibai.com")
# Calculate the mode using the user function.
result <- getmode(charv)
print(result)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
[1] 2
[1] "yiibai.com"