在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 教程/ 數(shù)據(jù)分析&挖掘/ R語言隨機森林
R語言列表
R語言隨機森林
R語言矩陣
R語言邏輯回歸
R語言數(shù)據(jù)幀
R語言數(shù)據(jù)重塑
R語言概述
R語言包
R語言字符串
R語言CSV文件
R語言運算符
為什么使用R語言做統(tǒng)計?
R語言Web數(shù)據(jù)
R語言二進制文件
R語言XML文件
R語言JSON文件
R語言因子
R語言容易學習嗎?
R語言基礎語法
R語言向量
R語言教程
R語言正態(tài)分布
R語言平均值,中位數(shù)和眾數(shù)
R語言變量
R語言條形圖
R語言決策樹
R語言開發(fā)環(huán)境安裝配置
R語言數(shù)組
R語言數(shù)據(jù)類型
R語言非線性最小二乘法
R語言直方圖
R語言卡方檢驗
R語言泊松回歸
R語言決策結構
R語言盒形圖(箱形圖)
R語言協(xié)方差分析
R語言二項分布
R語言餅狀圖
R語言循環(huán)
R語言散點圖
R語言線性回歸
R語言時間序列分析
R語言線形圖
R語言在現(xiàn)實中的應用
R語言生存分析
R語言多元(多重)回歸
R語言函數(shù)
R語言Excel文件
R語言連接數(shù)據(jù)庫(MySQL)

R語言隨機森林

在隨機森林方法中,創(chuàng)建了大量的決策樹。每個觀察結果都被送入每個決策樹。 每個觀察結果最常用作最終輸出。對所有決策樹進行新的觀察,并對每個分類模型進行多數(shù)投票。

對于在構建樹時未使用的情況進行錯誤估計。 這被稱為OOB(Out-of-bag)錯誤估計,以百分比表示。

R中的軟件包“randomForest”用于創(chuàng)建隨機林。

安裝R包 - randomForest

在R控制臺中使用以下命令安裝軟件包,還必須安裝其它依賴軟件包(如果有的話)。

install.packages("randomForest")

軟件包“randomForest”具有用于創(chuàng)建和分析隨機林的randomForest()函數(shù)。

語法

在R中創(chuàng)建隨機林的基本語法是 -

randomForest(formula, data)

以下是使用的參數(shù)的描述 -

  • formula - 是描述預測變量和響應變量的公式。
  • data - 是使用的數(shù)據(jù)集的名稱。

輸入數(shù)據(jù)

我們將使用名為readingSkills的R內置數(shù)據(jù)集來創(chuàng)建一個決策樹。 如果我們知道變量:"age","shoesize","score"以及"nativeSpeaker"表示該人員是否為講母語的人,那么它描述某個人員的閱讀技能的得分。

以下是樣本數(shù)據(jù) -

# Load the party package. It will automatically load other required packages.
library(party)

# Print some records from data set readingSkills.
print(head(readingSkills))

當我們執(zhí)行上面的代碼,它產(chǎn)生以下結果 -

  nativeSpeaker age shoeSize    score
1           yes   5 24.83189 32.29385
2           yes   6 25.95238 36.63105
3            no  11 30.42170 49.60593
4           yes   7 28.66450 40.28456
5           yes  11 31.88207 55.46085
6           yes  10 30.07843 52.83124

示例

我們將使用randomForest()函數(shù)來創(chuàng)建決策樹并查看它生成的圖形。參考以下代碼 -

setwd("F:/worksp/R")
# Load the party package. It will automatically load other required packages.
library("party")
library("randomForest")

# Create the forest.
output.forest <- randomForest(nativeSpeaker ~ age + shoeSize + score, 
           data = readingSkills)

# View the forest results.
print(output.forest) 

# Importance of each predictor.
print(importance(output.forest,type = 2))

當我們執(zhí)行上面的代碼,它產(chǎn)生以下結果 -

Call:
 randomForest(formula = nativeSpeaker ~ age + shoeSize + score,      data = readingSkills) 
               Type of random forest: classification
                     Number of trees: 500
No. of variables tried at each split: 1

        OOB estimate of  error rate: 1.5%
Confusion matrix:
    no yes class.error
no  99   1        0.01
yes  2  98        0.02

         MeanDecreaseGini
age              14.09296
shoeSize         17.88001
score            57.55174

結論

從上面所示的隨機森林可以得出結論,鞋子大小和得分是決定某人是否是母語者的重要因素。 此外,該模型只有1%的誤差,這意味著我們可以以99%的準確度預測。