在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 教程/ 數(shù)據(jù)分析&挖掘/ R語言協(xié)方差分析
R語言列表
R語言隨機(jī)森林
R語言矩陣
R語言邏輯回歸
R語言數(shù)據(jù)幀
R語言數(shù)據(jù)重塑
R語言概述
R語言包
R語言字符串
R語言CSV文件
R語言運(yùn)算符
為什么使用R語言做統(tǒng)計(jì)?
R語言Web數(shù)據(jù)
R語言二進(jìn)制文件
R語言XML文件
R語言JSON文件
R語言因子
R語言容易學(xué)習(xí)嗎?
R語言基礎(chǔ)語法
R語言向量
R語言教程
R語言正態(tài)分布
R語言平均值,中位數(shù)和眾數(shù)
R語言變量
R語言條形圖
R語言決策樹
R語言開發(fā)環(huán)境安裝配置
R語言數(shù)組
R語言數(shù)據(jù)類型
R語言非線性最小二乘法
R語言直方圖
R語言卡方檢驗(yàn)
R語言泊松回歸
R語言決策結(jié)構(gòu)
R語言盒形圖(箱形圖)
R語言協(xié)方差分析
R語言二項(xiàng)分布
R語言餅狀圖
R語言循環(huán)
R語言散點(diǎn)圖
R語言線性回歸
R語言時(shí)間序列分析
R語言線形圖
R語言在現(xiàn)實(shí)中的應(yīng)用
R語言生存分析
R語言多元(多重)回歸
R語言函數(shù)
R語言Excel文件
R語言連接數(shù)據(jù)庫(MySQL)

R語言協(xié)方差分析

我們使用回歸分析來創(chuàng)建描述預(yù)測(cè)變量變量對(duì)響應(yīng)變量的影響的模型。有時(shí),如果我們有類似于是/否男/女等值的分類變量,簡單回歸分析為分類變量的每個(gè)值提供多個(gè)結(jié)果。在這種情況下,可以通過使用分類變量和預(yù)測(cè)變量來研究分類變量的影響,并比較分類變量的每個(gè)級(jí)別的回歸線。 這樣的分析被稱為協(xié)方差分析,也稱為ANCOVA

輸入數(shù)據(jù)

從R提供的數(shù)據(jù)集mtcars創(chuàng)建一個(gè)包含字段“mpg”,“hp”“am”的數(shù)據(jù)框。 這里我們將“mpg”作為響應(yīng)變量,將“hp”作為預(yù)測(cè)變量,將“am”作為分類變量。

input <- mtcars[,c("am","mpg","hp")]
print(head(input))

當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -

                   am   mpg   hp
Mazda RX4          1    21.0  110
Mazda RX4 Wag      1    21.0  110
Datsun 710         1    22.8   93
Hornet 4 Drive     0    21.4  110
Hornet Sportabout  0    18.7  175
Valiant            0    18.1  105

ANCOVA分析

我們創(chuàng)建一個(gè)回歸模型,將“hp”作為預(yù)測(cè)變量,將“mpg”作為響應(yīng)變量,考慮到“am”“hp”之間的相互作用,參考以下示例代碼 -

模型與分類變量和預(yù)測(cè)變量之間的交互

# Get the dataset.
input <- mtcars

# Create the regression model.
result <- aov(mpg~hp*am,data = input)
print(summary(result))

當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -

            Df Sum Sq Mean Sq F value   Pr(>F)    
hp           1  678.4   678.4  77.391 1.50e-09 ***
am           1  202.2   202.2  23.072 4.75e-05 ***
hp:am        1    0.0     0.0   0.001    0.981    
Residuals   28  245.4     8.8                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

該結(jié)果表明,馬力和變速箱型均具有對(duì)每加侖英里數(shù)的顯著影響,因?yàn)檫@兩種情況下的p值均小于0.05。但是,這兩個(gè)變量之間的相互作用并不重要,因?yàn)?code>p值大于0.05。

分類變量與預(yù)測(cè)變量之間沒有交互的模型 -

# Get the dataset.
input <- mtcars

# Create the regression model.
result <- aov(mpg~hp+am,data = input)
print(summary(result))

當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -

            Df  Sum Sq  Mean Sq   F value   Pr(>F)    
hp           1  678.4   678.4   80.15 7.63e-10 ***
am           1  202.2   202.2   23.89 3.46e-05 ***
Residuals   29  245.4     8.5                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

該結(jié)果表明,馬力和變速箱型均具有對(duì)每加侖英里數(shù)的顯著影響,因?yàn)檫@兩種情況下的p值均小于0.05。

比較兩個(gè)模型

現(xiàn)在可以比較這兩個(gè)模型來確定變量的相互作用是否真的有意義的。 為此,我們使用anova()函數(shù)。

# Get the dataset.
input <- mtcars

# Create the regression models.
result1 <- aov(mpg~hp*am,data = input)
result2 <- aov(mpg~hp+am,data = input)

# Compare the two models.
print(anova(result1,result2))

當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -

Model 1: mpg ~ hp * am
Model 2: mpg ~ hp + am
  Res.Df    RSS Df  Sum of Sq     F Pr(>F)
1     28 245.43                           
2     29 245.44 -1 -0.0052515 6e-04 0.9806

由于p值大于0.05,我們得出結(jié)論,馬力與傳播類型之間的相互作用不明顯。所以每加侖里程將取決于自動(dòng)和手動(dòng)變速模式的馬力。