在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 教程/ 數(shù)據(jù)分析&挖掘/ R語(yǔ)言卡方檢驗(yàn)
R語(yǔ)言列表
R語(yǔ)言隨機(jī)森林
R語(yǔ)言矩陣
R語(yǔ)言邏輯回歸
R語(yǔ)言數(shù)據(jù)幀
R語(yǔ)言數(shù)據(jù)重塑
R語(yǔ)言概述
R語(yǔ)言包
R語(yǔ)言字符串
R語(yǔ)言CSV文件
R語(yǔ)言運(yùn)算符
為什么使用R語(yǔ)言做統(tǒng)計(jì)?
R語(yǔ)言Web數(shù)據(jù)
R語(yǔ)言二進(jìn)制文件
R語(yǔ)言XML文件
R語(yǔ)言JSON文件
R語(yǔ)言因子
R語(yǔ)言容易學(xué)習(xí)嗎?
R語(yǔ)言基礎(chǔ)語(yǔ)法
R語(yǔ)言向量
R語(yǔ)言教程
R語(yǔ)言正態(tài)分布
R語(yǔ)言平均值,中位數(shù)和眾數(shù)
R語(yǔ)言變量
R語(yǔ)言條形圖
R語(yǔ)言決策樹(shù)
R語(yǔ)言開(kāi)發(fā)環(huán)境安裝配置
R語(yǔ)言數(shù)組
R語(yǔ)言數(shù)據(jù)類型
R語(yǔ)言非線性最小二乘法
R語(yǔ)言直方圖
R語(yǔ)言卡方檢驗(yàn)
R語(yǔ)言泊松回歸
R語(yǔ)言決策結(jié)構(gòu)
R語(yǔ)言盒形圖(箱形圖)
R語(yǔ)言協(xié)方差分析
R語(yǔ)言二項(xiàng)分布
R語(yǔ)言餅狀圖
R語(yǔ)言循環(huán)
R語(yǔ)言散點(diǎn)圖
R語(yǔ)言線性回歸
R語(yǔ)言時(shí)間序列分析
R語(yǔ)言線形圖
R語(yǔ)言在現(xiàn)實(shí)中的應(yīng)用
R語(yǔ)言生存分析
R語(yǔ)言多元(多重)回歸
R語(yǔ)言函數(shù)
R語(yǔ)言Excel文件
R語(yǔ)言連接數(shù)據(jù)庫(kù)(MySQL)

R語(yǔ)言卡方檢驗(yàn)

卡方檢驗(yàn)是一種統(tǒng)計(jì)方法,用于確定兩個(gè)分類變量之間是否具有顯著的相關(guān)性。 這些變量應(yīng)該來(lái)自相同的人口,它們應(yīng)該是分類的,如 - 是/否,男/女,紅/綠等。

例如,我們可以建立一個(gè)數(shù)據(jù)集,觀察人們的冰淇淋購(gòu)買模式,并嘗試將一個(gè)人的性別與他們喜歡的冰淇淋的味道相關(guān)聯(lián)。 如果發(fā)現(xiàn)相關(guān)性,我們可以通過(guò)了解訪問(wèn)者的性別數(shù)量來(lái)調(diào)整對(duì)應(yīng)口味的庫(kù)存。

語(yǔ)法

執(zhí)行卡方檢驗(yàn)的函數(shù)是:chisq.test()

在R中創(chuàng)建卡方檢驗(yàn)的基本語(yǔ)法是 -

chisq.test(data)

以下是使用的參數(shù)的描述 -

-data - 是表中包含觀察值中變量計(jì)數(shù)值的數(shù)據(jù)。

示例

我們將在1993年的“MASS”庫(kù)中采用Cars93數(shù)據(jù),代表不同車型的銷售。

library("MASS")
print(str(Cars93))

當(dāng)執(zhí)行上面示例代碼后,得到以下結(jié)果 -

'data.frame':   93 obs. of  27 variables:
 $ Manufacturer      : Factor w/ 32 levels "Acura","Audi",..: 1 1 2 2 3 4 4 4 4 5 ...
 $ Model             : Factor w/ 93 levels "100","190E","240",..: 49 56 9 1 6 24 54 74 73 35 ...
 $ Type              : Factor w/ 6 levels "Compact","Large",..: 4 3 1 3 3 3 2 2 3 2 ...
 $ Min.Price         : num  12.9 29.2 25.9 30.8 23.7 14.2 19.9 22.6 26.3 33 ...
 $ Price             : num  15.9 33.9 29.1 37.7 30 15.7 20.8 23.7 26.3 34.7 ...
 $ Max.Price         : num  18.8 38.7 32.3 44.6 36.2 17.3 21.7 24.9 26.3 36.3 ...
 $ MPG.city          : int  25 18 20 19 22 22 19 16 19 16 ...
 $ MPG.highway       : int  31 25 26 26 30 31 28 25 27 25 ...
 $ AirBags           : Factor w/ 3 levels "Driver & Passenger",..: 3 1 2 1 2 2 2 2 2 2 ...
 $ DriveTrain        : Factor w/ 3 levels "4WD","Front",..: 2 2 2 2 3 2 2 3 2 2 ...
 $ Cylinders         : Factor w/ 6 levels "3","4","5","6",..: 2 4 4 4 2 2 4 4 4 5 ...
 $ EngineSize        : num  1.8 3.2 2.8 2.8 3.5 2.2 3.8 5.7 3.8 4.9 ...
 $ Horsepower        : int  140 200 172 172 208 110 170 180 170 200 ...
 $ RPM               : int  6300 5500 5500 5500 5700 5200 4800 4000 4800 4100 ...
 $ Rev.per.mile      : int  2890 2335 2280 2535 2545 2565 1570 1320 1690 1510 ...
 $ Man.trans.avail   : Factor w/ 2 levels "No","Yes": 2 2 2 2 2 1 1 1 1 1 ...
 $ Fuel.tank.capacity: num  13.2 18 16.9 21.1 21.1 16.4 18 23 18.8 18 ...
 $ Passengers        : int  5 5 5 6 4 6 6 6 5 6 ...
 $ Length            : int  177 195 180 193 186 189 200 216 198 206 ...
 $ Wheelbase         : int  102 115 102 106 109 105 111 116 108 114 ...
 $ Width             : int  68 71 67 70 69 69 74 78 73 73 ...
 $ Turn.circle       : int  37 38 37 37 39 41 42 45 41 43 ...
 $ Rear.seat.room    : num  26.5 30 28 31 27 28 30.5 30.5 26.5 35 ...
 $ Luggage.room      : int  11 15 14 17 13 16 17 21 14 18 ...
 $ Weight            : int  2705 3560 3375 3405 3640 2880 3470 4105 3495 3620 ...
 $ Origin            : Factor w/ 2 levels "USA","non-USA": 2 2 2 2 2 1 1 1 1 1 ...
 $ Make              : Factor w/ 93 levels "Acura Integra",..: 1 2 4 3 5 6 7 9 8 10 ...
NULL

上述結(jié)果表明,數(shù)據(jù)集具有許多因子變量,可以被認(rèn)為是分類變量。對(duì)于我們的模型,只需要考慮變量AirBagsType。 在這里,我們的目標(biāo)是找出所銷售的汽車類型和Air Bag的類型之間的顯著相關(guān)性。如果觀察到相關(guān)性,我們可以估計(jì)哪種類型的汽車可以更好地銷售哪種類型的氣囊。參考以下代碼的實(shí)現(xiàn) -

# Load the library.
library("MASS")

# Create a data frame from the main data set.
car.data <- data.frame(Cars93$AirBags, Cars93$Type)

# Create a table with the needed variables.
car.data = table(Cars93$AirBags, Cars93$Type) 
print(car.data)

# Perform the Chi-Square test.
print(chisq.test(car.data))

當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -

        Pearson's Chi-squared test

data:  car.data
X-squared = 33.001, df = 10, p-value = 0.0002723

Warning message:
In chisq.test(car.data) : Chi-squared approximation may be incorrect

結(jié)論

結(jié)果表明,p值小于0.05,表明字符串相關(guān)。