在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 教程/ 數據分析&挖掘/ R語言生存分析
R語言列表
R語言隨機森林
R語言矩陣
R語言邏輯回歸
R語言數據幀
R語言數據重塑
R語言概述
R語言包
R語言字符串
R語言CSV文件
R語言運算符
為什么使用R語言做統(tǒng)計?
R語言Web數據
R語言二進制文件
R語言XML文件
R語言JSON文件
R語言因子
R語言容易學習嗎?
R語言基礎語法
R語言向量
R語言教程
R語言正態(tài)分布
R語言平均值,中位數和眾數
R語言變量
R語言條形圖
R語言決策樹
R語言開發(fā)環(huán)境安裝配置
R語言數組
R語言數據類型
R語言非線性最小二乘法
R語言直方圖
R語言卡方檢驗
R語言泊松回歸
R語言決策結構
R語言盒形圖(箱形圖)
R語言協方差分析
R語言二項分布
R語言餅狀圖
R語言循環(huán)
R語言散點圖
R語言線性回歸
R語言時間序列分析
R語言線形圖
R語言在現實中的應用
R語言生存分析
R語言多元(多重)回歸
R語言函數
R語言Excel文件
R語言連接數據庫(MySQL)

R語言生存分析

生存分析涉及預測特定事件發(fā)生的時間。 它也被稱為失敗時間分析或分析死亡時間。 例如預測癌癥患者的生存天數或預測機械系統(tǒng)出現故障的時間。

R中的軟件包:survival用于進行生存分析。該包中含有Surv()函數,它將輸入數據作為R公式,并在所選變量中創(chuàng)建一個生存對象進行分析。然后使用survfit()函數來創(chuàng)建分析圖。

安裝包

install.packages("survival")

語法

在R中創(chuàng)建生存分析的基本語法是 -

Surv(time,event)
survfit(formula)

以下是使用的參數的描述 -

  • time - 是直到事件發(fā)生的后續(xù)時間。
  • event - 表示預期事件發(fā)生的狀態(tài)。
  • formula - 是預測變量之間的關系。

示例

考慮上面安裝的survival包中存在的名為“pbc”的數據集。 它描述了肝臟原發(fā)性膽汁性肝硬化(PBC)患者的生存數據。在數據集中存在的許多列中,我們主要關注"time""status"字段。時間(time)表示在患者接受肝臟移植或患者死亡的患者之間登記患者和事件之前的天數。

setwd("F:/worksp/R")
# Load the library.
library("survival")

# Print first few rows.
print(head(pbc))

當我們執(zhí)行上面的代碼,它產生以下結果 -

  id time status trt      age sex ascites hepato spiders edema bili chol
1  1  400      2   1 58.76523   f       1      1       1   1.0 14.5  261
2  2 4500      0   1 56.44627   f       0      1       1   0.0  1.1  302
3  3 1012      2   1 70.07255   m       0      0       0   0.5  1.4  176
4  4 1925      2   1 54.74059   f       0      1       1   0.5  1.8  244
5  5 1504      1   2 38.10541   f       0      1       1   0.0  3.4  279
6  6 2503      2   2 66.25873   f       0      1       0   0.0  0.8  248
  albumin copper alk.phos    ast trig platelet protime stage
1    2.60    156   1718.0 137.95  172      190    12.2     4
2    4.14     54   7394.8 113.52   88      221    10.6     3
3    3.48    210    516.0  96.10   55      151    12.0     4
4    2.54     64   6121.8  60.63   92      183    10.3     4
5    3.53    143    671.0 113.15   72      136    10.9     3
6    3.98     50    944.0  93.00   63       NA    11.0     3

從上述數據,我們正在考慮時間和狀態(tài)進行分析。

應用Surv()和survfit()函數

現在繼續(xù)將Surv()函數應用于上述數據集,并創(chuàng)建一個將顯示趨勢圖。參考以下示例代碼 -

setwd("F:/worksp/R")
# Load the library.
library("survival")

# Create the survival object. 
survfit(Surv(pbc$time,pbc$status == 2)~1)

# Give the chart file a name.
png(file = "survival.png")

# Plot the graph. 
plot(survfit(Surv(pbc$time,pbc$status == 2)~1))

# Save the file.
dev.off()

當我們執(zhí)行上面的代碼,它產生以下結果和圖表 -

Call: survfit(formula = Surv(pbc$time, pbc$status == 2) ~ 1)

      n  events  median 0.95LCL 0.95UCL 
    418     161    3395    3090    3853

上圖中的趨勢有助于我們預測在一定天數結束時的生存概率。