Linux系統(tǒng)中grep命令是一種強(qiáng)大的文本搜索工具,它能使用正則表達(dá)式搜索文本,并把匹 配的行打印出來(lái)。grep全稱是Global Regular Expression Print,表示全局正則表達(dá)式版本,它的使用權(quán)限是所有用戶。
grep的工作方式是這樣的,它在一個(gè)或多個(gè)文件中搜索字符串模板。如果模板包括空格,則必須被引用,模板后的所有字符串被看作文件名。搜索的結(jié)果被送到標(biāo)準(zhǔn)輸出,不影響原文件內(nèi)容。grep可用于shell腳本,因?yàn)?code>grep通過(guò)返回一個(gè)狀態(tài)值來(lái)說(shuō)明搜索的狀態(tài),如果模板搜索成功,則返回0,如果搜索不成功,則返回1,如果搜索的文件不存在,則返回2。我們利用這些返回值就可進(jìn)行一些自動(dòng)化的文本處理工作。
grep [option] pattern file
用于過(guò)濾/搜索的特定字符??墒褂谜齽t表達(dá)式能多種命令配合使用,使用上十分靈活。
-a —text #不要忽略二進(jìn)制的數(shù)據(jù)。 -A<顯示行數(shù)> —after-context=<顯示行數(shù)> #除了顯示符合范本樣式的那一列之外,并顯示該行之后的內(nèi)容。 -b —byte-offset #在顯示符合樣式的那一行之前,標(biāo)示出該行第一個(gè)字符的編號(hào)。 -B<顯示行數(shù)> —before-context=<顯示行數(shù)> #除了顯示符合樣式的那一行之外,并顯示該行之前的內(nèi)容。 -c —count #計(jì)算符合樣式的列數(shù)。 -C<顯示行數(shù)> —context=<顯示行數(shù)>或-<顯示行數(shù)> #除了顯示符合樣式的那一行之外,并顯示該行之前后的內(nèi)容。 -d <動(dòng)作> —directories=<動(dòng)作> #當(dāng)指定要查找的是目錄而非文件時(shí),必須使用這項(xiàng)參數(shù),否則grep指令將回報(bào)信息并停止動(dòng)作。 -e<范本樣式> —regexp=<范本樣式> #指定字符串做為查找文件內(nèi)容的樣式。 -E —extended-regexp #將樣式為延伸的普通表示法來(lái)使用。 -f<規(guī)則文件> —file=<規(guī)則文件> #指定規(guī)則文件,其內(nèi)容含有一個(gè)或多個(gè)規(guī)則樣式,讓grep查找符合規(guī)則條件的文件內(nèi)容,格式為每行一個(gè)規(guī)則樣式。 -F —fixed-regexp #將樣式視為固定字符串的列表。 -G —basic-regexp #將樣式視為普通的表示法來(lái)使用。 -h —no-filename #在顯示符合樣式的那一行之前,不標(biāo)示該行所屬的文件名稱。 -H —with-filename #在顯示符合樣式的那一行之前,表示該行所屬的文件名稱。 -i —ignore-case #忽略字符大小寫(xiě)的差別。 -l —file-with-matches #列出文件內(nèi)容符合指定的樣式的文件名稱。 -L —files-without-match #列出文件內(nèi)容不符合指定的樣式的文件名稱。 -n —line-number #在顯示符合樣式的那一行之前,標(biāo)示出該行的列數(shù)編號(hào)。 -q —quiet或—silent #不顯示任何信息。 -r —recursive #此參數(shù)的效果和指定“-d recurse”參數(shù)相同。 -s —no-messages #不顯示錯(cuò)誤信息。 -v —revert-match #顯示不包含匹配文本的所有行。 -V —version #顯示版本信息。 -w —word-regexp #只顯示全字符合的列。 -x —line-regexp #只顯示全列符合的列。 -y #此參數(shù)的效果和指定“-i”參數(shù)相同。grep的規(guī)則表達(dá)式:
^ #錨定行的開(kāi)始 如:’^grep’匹配所有以grep開(kāi)頭的行。 $ #錨定行的結(jié)束 如:’grep$’匹配所有以grep結(jié)尾的行。 . #匹配一個(gè)非換行符的字符 如:’gr.p’匹配gr后接一個(gè)任意字符,然后是p。 * #匹配零個(gè)或多個(gè)先前字符 如:’*grep’匹配所有一個(gè)或多個(gè)空格后緊跟grep的行。 .* #一起用代表任意字符。 [] #匹配一個(gè)指定范圍內(nèi)的字符,如’[Gg]rep’匹配Grep和grep。 [^] #匹配一個(gè)不在指定范圍內(nèi)的字符,如:’[^A-FH-Z]rep’匹配不包含A-R和T-Z的一個(gè)字母開(kāi)頭,緊跟rep的行。 \(..\) #標(biāo)記匹配字符,如’(love)‘,love被標(biāo)記為1。 \< #錨定單詞的開(kāi)始,如:’\<grep’匹配包含以grep開(kāi)頭的單詞的行。 \> #錨定單詞的結(jié)束,如’grep>‘匹配包含以grep結(jié)尾的單詞的行。 x\{m\} #重復(fù)字符x,m次,如:’0{5}‘匹配包含5個(gè)o的行。 x\{m,\} #重復(fù)字符x,至少m次,如:’o{5,}‘匹配至少有5個(gè)o的行。 x\{m,n\} #重復(fù)字符x,至少m次,不多于n次,如:’o{5,10}‘匹配5—10個(gè)o的行。 \w #匹配文字和數(shù)字字符,也就是[A-Za-z0-9],如:’G\w*p’匹配以G后跟零個(gè)或多個(gè)文字或數(shù)字字符,然后是p。 \W #\w的反置形式,匹配一個(gè)或多個(gè)非單詞字符,如點(diǎn)號(hào)句號(hào)等。 \b #單詞鎖定符,如: ‘\bgrep\b’只匹配grep。POSIX字符:
為了在不同國(guó)家的字符編碼中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字符類,如[:alnum:]是[A-Za-z0-9]的另一個(gè)寫(xiě)法。要把它們放到[]號(hào)內(nèi)才能成為正則表達(dá)式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字符類。
[:alnum:] #文字?jǐn)?shù)字字符 [:alpha:] #文字字符 [:digit:] #數(shù)字字符 [:graph:] #非空字符(非空格、控制字符) [:lower:] #小寫(xiě)字符 [:cntrl:] #控制字符 [:print:] #非空字符(包括空格) [:punct:] #標(biāo)點(diǎn)符號(hào) [:space:] #所有空白字符(新行,空格,制表符) [:upper:] #大寫(xiě)字符 [:xdigit:] #十六進(jìn)制數(shù)字(0-9,a-f,A-F) 命令:
ps -ef|grep python
輸出:
[yiibai@localhost yiibai]$ ps -ef|grep python
root 920 1 0 Feb25 ? 00:00:14 /usr/bin/python -Es /usr/sbin/tuned -l -P
root 4705 4631 91 08:05 pts/0 00:00:36 python run.py
yiibai 4726 4712 0 08:05 pts/0 00:00:00 grep --color=auto python
[yiibai@localhost yiibai]$
說(shuō)明:第一條記錄是查找出的進(jìn)程;第二條結(jié)果是grep進(jìn)程本身,并非真正要找的進(jìn)程。
命令:
ps -ef|grep python -c
ps -ef|grep -c python
輸出:
[root@localhost yiibai]# ps -ef|grep python -c
3
[root@localhost yiibai]# ps -ef|grep -c python
3
[root@localhost yiibai]#
命令:
cat file2.txt |grep -f file1.txt
輸出:
[yiibai@localhost ~]$ cat file1.txt
java
python
linux
[yiibai@localhost ~]$ cat file2.txt
windows 10
windows 7
linux
C#
java
PHP
python
1003
Hello Word.
[yiibai@localhost ~]$ cat file2 |grep -f file1.txt
cat: file2: No such file or directory
[yiibai@localhost ~]$ cat file2.txt |grep -f file1.txt
linux
java
python
[yiibai@localhost ~]$
說(shuō)明:輸出file2.txt文件中含有從file1.txt文件中讀取出的關(guān)鍵詞的內(nèi)容行。
命令:
cat file2.txt | grep -nf file1.txt
輸出:
[yiibai@localhost ~]$ cat file2.txt | grep -nf file1.txt
3:linux
5:java
7:python
[yiibai@localhost ~]$
說(shuō)明:輸出 file2.txt 文件中含有從 file1.txt 文件中讀取出的關(guān)鍵詞的內(nèi)容行,并顯示每一行的行號(hào)。
命令:
grep 'linux' file1.txt
輸出:
[yiibai@localhost ~]$ grep 'linux' file1.txt
linux
[yiibai@localhost ~]$ grep 'java' file1.txt
java
[yiibai@localhost ~]$ grep 'ruby' file1.txt
[yiibai@localhost ~]$
命令:
grep 'linux' file1.txt file2.txt
輸出:
[yiibai@localhost ~]$ grep 'linux' file1.txt file2.txt
file1.txt:linux
file2.txt:linux
[yiibai@localhost ~]$
說(shuō)明:多文件時(shí),輸出查詢到的信息內(nèi)容行時(shí),會(huì)把文件的命名在行最前面輸出并且加上”:”作為標(biāo)示符。
命令:
ps aux|grep \[s]sh
ps aux | grep ssh | grep -v "grep"
輸出:
[yiibai@localhost ~]$ ps aux|grep \[s]sh
root 1219 0.0 0.1 82468 1332 ? Ss Feb25 0:00 /usr/sbin/sshd
root 4409 0.0 0.4 145700 4064 ? Ss 07:28 0:00 sshd: yiibai [priv]
yiibai 4411 0.0 0.2 145700 2068 ? S 07:29 0:05 sshd: yiibai@pts/0
[yiibai@localhost ~]$ ps aux | grep ssh | grep -v "grep"
root 1219 0.0 0.1 82468 1332 ? Ss Feb25 0:00 /usr/sbin/sshd
root 4409 0.0 0.4 145700 4064 ? Ss 07:28 0:00 sshd: yiibai [priv]
yiibai 4411 0.0 0.2 145700 2068 ? S 07:29 0:05 sshd: yiibai@pts/0
[yiibai@localhost ~]$
命令:
cat file1.txt |grep ^w
輸出:
[yiibai@localhost ~]$ cat file2.txt
windows 10
windows 7
linux
C#
java
PHP
python
1003
Hello Word.
[yiibai@localhost ~]$ cat file2.txt | grep ^w
windows 10
windows 7
[yiibai@localhost ~]$ cat file2.txt | grep ^p
python
[yiibai@localhost ~]$
命令:
cat file2.txt |grep ^[^w]
輸出:
[yiibai@localhost ~]$ cat file2.txt
windows 10
windows 7
linux
C#
java
PHP
python
1003
Hello Word.
[yiibai@localhost ~]$ cat file2.txt |grep ^[^w]
linux
C#
java
PHP
python
1003
Hello Word.
[yiibai@localhost ~]$
命令:
cat test.txt |grep hat$
輸出:
命令:
cat file2.txt |grep -E "on|va"
輸出:
[yiibai@localhost ~]$ cat file2.txt
windows 10
windows 7
linux
C#
java
PHP
python
1003
Hello Word.
[yiibai@localhost ~]$
[yiibai@localhost ~]$
[yiibai@localhost ~]$ cat file2.txt |grep -E "on|va"
java
python
[yiibai@localhost ~]$
命令:
grep '[a-z]\{7\}' *.txt
輸出:
[yiibai@localhost ~]$ grep '[a-z]\{7\}' *.txt
file2.txt:windows 10
file2.txt:windows 7
[yiibai@localhost ~]$