在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 教程/ 數(shù)據(jù)分析&挖掘/ R語言決策樹
R語言列表
R語言隨機(jī)森林
R語言矩陣
R語言邏輯回歸
R語言數(shù)據(jù)幀
R語言數(shù)據(jù)重塑
R語言概述
R語言包
R語言字符串
R語言CSV文件
R語言運(yùn)算符
為什么使用R語言做統(tǒng)計(jì)?
R語言Web數(shù)據(jù)
R語言二進(jìn)制文件
R語言XML文件
R語言JSON文件
R語言因子
R語言容易學(xué)習(xí)嗎?
R語言基礎(chǔ)語法
R語言向量
R語言教程
R語言正態(tài)分布
R語言平均值,中位數(shù)和眾數(shù)
R語言變量
R語言條形圖
R語言決策樹
R語言開發(fā)環(huán)境安裝配置
R語言數(shù)組
R語言數(shù)據(jù)類型
R語言非線性最小二乘法
R語言直方圖
R語言卡方檢驗(yàn)
R語言泊松回歸
R語言決策結(jié)構(gòu)
R語言盒形圖(箱形圖)
R語言協(xié)方差分析
R語言二項(xiàng)分布
R語言餅狀圖
R語言循環(huán)
R語言散點(diǎn)圖
R語言線性回歸
R語言時(shí)間序列分析
R語言線形圖
R語言在現(xiàn)實(shí)中的應(yīng)用
R語言生存分析
R語言多元(多重)回歸
R語言函數(shù)
R語言Excel文件
R語言連接數(shù)據(jù)庫(MySQL)

R語言決策樹

決策樹是以樹的形式表示選擇及其結(jié)果的圖形。圖中的節(jié)點(diǎn)表示事件或選擇,并且圖形的邊緣表示決策規(guī)則或條件。它主要用于使用R的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘應(yīng)用程序。

使用決策的例子是 - 將接收的郵件預(yù)測是否為垃圾郵件,根據(jù)這些信息中的因素,預(yù)測腫瘤是癌癥或預(yù)測貸款作為良好或不良的信用風(fēng)險(xiǎn)。 通常,使用觀察數(shù)據(jù)也稱為訓(xùn)練數(shù)據(jù)創(chuàng)建模型。 然后使用一組驗(yàn)證數(shù)據(jù)來驗(yàn)證和改進(jìn)模型。 R具有用于創(chuàng)建和可視化決策樹的包。 對于新的預(yù)測變量,我們使用該模型來確定數(shù)據(jù)的類別(是/否,垃圾郵件/非垃圾郵件)。

R包“party”用于創(chuàng)建決策樹。

安裝R包

在R控制臺中使用以下命令安裝軟件包,還必須安裝依賴軟件包(如果有的話)。

install.packages("party")

“party”中包含用于創(chuàng)建和分析決策樹的ctree()函數(shù)。

語法

在R中創(chuàng)建決策樹的基本語法是 -

ctree(formula, data)

以下是使用的參數(shù)的描述 -

  • formula - 是描述預(yù)測變量和響應(yīng)變量的公式。
  • data - 是使用的數(shù)據(jù)集的名稱。

輸入數(shù)據(jù)

我們將使用一個(gè)名為readingSkills的R內(nèi)置數(shù)據(jù)集創(chuàng)建一個(gè)決策樹。如果要知道變量:"age","shoesize","score"以及該人員是否是母語者,則描述某人員的閱讀技能的得分。

以下是樣本數(shù)據(jù) -

# Load the party package. It will automatically load other dependent packages.
library("party")

# Print some records from data set readingSkills.
print(head(readingSkills))

執(zhí)行上面示例代碼,得到以下結(jié)果 -

  nativeSpeaker age shoeSize    score
1           yes   5 24.83189 32.29385
2           yes   6 25.95238 36.63105
3            no  11 30.42170 49.60593
4           yes   7 28.66450 40.28456
5           yes  11 31.88207 55.46085
6           yes  10 30.07843 52.83124

例子

我們將使用ctree()函數(shù)創(chuàng)建決策樹并查看其生成的圖表。

# Load the party package. It will automatically load other dependent packages.
library(party)

# Create the input data frame.
input.dat <- readingSkills[c(1:105),]

# Give the chart file a name.
png(file = "decision_tree.png")

# Create the tree.
  output.tree <- ctree(
  nativeSpeaker ~ age + shoeSize + score, 
  data = input.dat)

# Plot the tree.
plot(output.tree)

# Save the file.
dev.off()

當(dāng)我們執(zhí)行上述代碼時(shí),會產(chǎn)生以下結(jié)果 -

null device 
          1 
Loading required package: methods
Loading required package: grid
Loading required package: mvtnorm
Loading required package: modeltools
Loading required package: stats4
Loading required package: strucchange
Loading required package: zoo

Attaching package: ‘zoo’

The following objects are masked from ‘package:base’:

    as.Date, as.Date.numeric

Loading required package: sandwich

生成如下圖形 -

結(jié)論

從上面所示的決策樹,我們可以得出結(jié)論,任何閱讀技巧(readingSkills)評分小于38.3,年齡超過6歲的人不是本地(使用母語)演講者。