Microsoft Excel是使用最廣泛的電子表格程序,它是以.xls或.xlsx格式存儲(chǔ)數(shù)據(jù)。 R可以使用某些excel特定的包直接讀取這些文件的內(nèi)容。一些常用的軟件包有 - XLConnect,xlsx,gdata等。在這個(gè)篇文章中,我們將使用xlsx軟件包。 R也可以使用這個(gè)包寫入excel文件。
可以在R控制臺(tái)中使用以下命令來安裝xlsx軟件包。它可能會(huì)要求安裝一些這個(gè)包所依賴的附加包。按照相同的命令與所需的包名來安裝附加的包。
install.packages("xlsx")
使用以下命令來驗(yàn)證和加載xlsx包。參考以下代碼 -
# Verify the package is installed.
any(grepl("xlsx",installed.packages()))
# Load the library into R workspace.
library("xlsx")
當(dāng)腳本運(yùn)行時(shí),得到以下輸出 -
[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars
注: 如果第一個(gè)輸出結(jié)果為:
FALSE,請(qǐng)install.packages("xlsx")語句重新加載安裝。
打開Microsoft excel。將以下數(shù)據(jù)復(fù)制并粘貼到名為sheet1的工作表中。
id name salary start_date dept
1 Rick 623.3 1/1/2012 IT
2 Dan 515.2 9/23/2013 Operations
3 Michelle 611 11/15/2014 IT
4 Ryan 729 5/11/2014 HR
5 Gary 843.25 3/27/2015 Finance
6 Nina 578 5/21/2013 IT
7 Simon 632.8 7/30/2013 Operations
8 Guru 722.5 6/17/2014 Finance
如下所示 -

還將以下數(shù)據(jù)復(fù)制并粘貼到另一個(gè)工作表,并將此工作表重命名為city。
name city
Rick Seattle
Dan Tampa
Michelle Chicago
Ryan Seattle
Gary Houston
Nina Boston
Simon Mumbai
Guru Dallas
如下所示 -

將Excel文件另存為“input.xlsx”,應(yīng)該將此文件保存在R工作區(qū)的當(dāng)前工作目錄中。
使用read.xlsx()函數(shù)讀取input.xlsx,如下所示,結(jié)果作為數(shù)據(jù)幀存儲(chǔ)在R環(huán)境中。
# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)
當(dāng)我們執(zhí)行上述代碼時(shí),會(huì)產(chǎn)生以下結(jié)果 -
id name salary start_date dept
1 1 Rick 623.30 2012-01-01 IT
2 2 Dan 515.20 2013-09-23 Operations
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 NA Gary 843.25 2015-03-27 Finance
6 6 Nina 578.00 2013-05-21 IT
7 7 Simon 632.80 2013-07-30 Operations
8 8 Guru 722.50 2014-06-17 Finance