萬盛學電腦網

浏覽器 windows 10 wps office 殺毒軟件 數據庫 excel教程 文件管理 word教程 網頁制作 裝機必備軟件 linux教程

萬盛學電腦網 >> Linux教程 >> Linux Shell文本處理命令匯總

Linux Shell文本處理命令匯總

　　我們都知道Linux可用多種命令進行操作，光是用於文本處理的命令就有不少，下面小編將針對Linux中Shell文本處理工具做個匯總，以便你有個了解。

Linux Shell文本處理命令匯總

　　Linux下的操作習慣不像windows一樣可以有窗口進行操作，它是有很多不同的命令組成的，本文將介紹Linux下使用Shell處理文本時最常用的工具：find、grep、xargs、sort、uniq、tr、cut、paste、wc、sed、awk

　　提供的例子和參數都是最常用和最為實用的；

　　我對shell腳本使用的原則是命令單行書寫，盡量不要超過2行；

　　如果有更為復雜的任務需求，還是考慮python吧；

　　find 文件查找（詳見系統之家Linux find命令常見用法匯總）

　　•查找txt和pdf文件

　　代碼如下：

　　find 。 \（ -name “*.txt” -o -name “*.pdf” \） -print

　　•正則方式查找.txt和pdf

　　代碼如下：

　　find 。 -regex “.*\（\.txt|\.pdf\）$”

　　-iregex：忽略大小寫的正則

　　•否定參數

　　查找所有非txt文本

　　代碼如下：

　　find 。！ -name “*.txt” -print

　　•指定搜索深度

　　打印出當前目錄的文件（深度為1）

　　代碼如下：

　　find 。 -maxdepth 1 -type f

　　定制搜索

　　•按類型搜索：

　　代碼如下：

　　find 。 -type d -print //只列出所有目錄

　　-type f 文件 / l 符號鏈接

　　•按時間搜索：

　　-atime 訪問時間（單位是天，分鐘單位則是-amin，以下類似）

　　-mtime 修改時間（內容被修改）

　　-ctime 變化時間（元數據或權限變化）

　　最近7天被訪問過的所有文件：

　　代碼如下：

　　find 。 -atime 7 -type f -print

　　•按大小搜索：

　　w字 k M G

　　尋找大於2k的文件

　　代碼如下：

　　find 。 -type f -size +2k

　　按權限查找：

　　代碼如下：

　　find 。 -type f -perm 644 -print //找具有可執行權限的所有文件

　　按用戶查找：

　　代碼如下：

　　find 。 -type f -user weber -print// 找用戶weber所擁有的文件

　　找到後的後續動作

　　•刪除：

　　刪除當前目錄下所有的swp文件：

　　代碼如下：

　　find 。 -type f -name “*.swp” -delete

　　•執行動作（強大的exec）

　　代碼如下：

　　find 。 -type f -user root -exec chown weber {} \; //將當前目錄下的所有權變更為weber

　　注：{}是一個特殊的字符串，對於每一個匹配的文件，{}會被替換成相應的文件名；

　　eg：將找到的文件全都copy到另一個目錄：

　　代碼如下：

　　find 。 -type f -mtime +10 -name “*.txt” -exec cp {} OLD \;

　　•結合多個命令

　　tips：如果需要後續執行多個命令，可以將多個命令寫成一個腳本。然後 -exec 調用時執行腳本即可；

　　代碼如下：

　　-exec 。/commands.sh {} \;

　　-print的定界符

　　默認使用’\n’作為文件的定界符；

　　-print0 使用’\0′作為文件的定界符，這樣就可以搜索包含空格的文件；

　　grep 文本搜索

　　grep match_patten file // 默認訪問匹配行

　　•常用參數

　　-o 只輸出匹配的文本行 VS -v 只輸出沒有匹配的文本行

　　-c 統計文件中包含文本的次數

　　代碼如下：

　　grep -c “text” filename

　　-n 打印匹配的行號

　　-i 搜索時忽略大小寫

　　-l 只打印文件名

　　•在多級目錄中對文本遞歸搜索（程序員搜代碼的最愛）：

　　代碼如下：

　　grep “class” 。 -R -n

　　•匹配多個模式

　　代碼如下：

　　grep -e “class” -e “vitural” file

　　•grep輸出以\0作為結尾符的文件名：（-z）

　　代碼如下：

　　grep “test” file* -lZ| xargs -0 rm

　　xargs 命令行參數轉換

　　xargs 能夠將輸入數據轉化為特定命令的命令行參數；這樣，可以配合很多命令來組合使用。比如grep，比如find；

　　•將多行輸出轉化為單行輸出

　　cat file.txt| xargs

　　\n 是多行文本間的定界符

　　•將單行轉化為多行輸出

　　cat single.txt | xargs -n 3

　　-n：指定每行顯示的字段數

　　xargs參數說明

　　-d 定義定界符（默認為空格多行的定界符為 \n）

　　-n 指定輸出為多行

　　-I {} 指定替換字符串，這個字符串在xargs擴展時會被替換掉，用於待執行的命令需要多個參數時

　　eg：

　　代碼如下：

　　cat file.txt | xargs -I {} 。/command.sh -p {} -1

　　-0：指定\0為輸入定界符

　　eg：統計程序行數

　　代碼如下：

　　find source_dir/ -type f -name “*.cpp” -print0 |xargs -0 wc -l

　　sort 排序

　　字段說明：

　　-n 按數字進行排序 VS -d 按字典序進行排序

　　-r 逆序排序

　　-k N 指定按第N列排序

　　eg：

　　代碼如下：

　　sort -nrk 1 data.txt

　　sort -bd data // 忽略像空格之類的前導空白字符

　　uniq 消除重復行

　　•消除重復行

　　代碼如下：

　　sort unsort.txt | uniq

　　•統計各行在文件中出現的次數

　　代碼如下：

　　sort unsort.txt | uniq -c

　　•找出重復行

　　代碼如下：

　　sort unsort.txt | uniq -d

　　可指定每行中需要比較的重復內容：-s 開始位置 -w 比較字符數

　　用tr進行轉換

　　•通用用法

　　代碼如下：

　　echo 12345 | tr ‘0-9’ ‘9876543210’ //加解密轉換，替換對應字符

　　cat text| tr ‘\t’ ‘ ’ //制表符轉空格

　　•tr刪除字符

　　代碼如下：

　　cat file | tr -d ‘0-9’ // 刪除所有數字

　　-c 求補集

　　代碼如下：

　　cat file | tr -c ‘0-9’ //獲取文件中所有數字

　　cat file | tr -d -c ‘0-9 \n’ //刪除非數字數據

　　•tr壓縮字符

　　tr -s 壓縮文本中出現的重復字符；最常用於壓縮多余的空格

　　代碼如下：

　　cat file | tr -s ‘ ’

　　•字符類

　　tr中可用各種字符類：

　　alnum：字母和數字

　　alpha：字母

　　digit：數字

　　space：空白字符

　　lower：小寫

　　upper：大寫

　　cntrl：控制（非可打印）字符

　　print：可打印字符

　　使用方法：tr ［：class：］［：class：］

　　代碼如下：

　　eg： tr ‘［：lower：］’ ‘［：upper：］’

　　cut 按列切分文本

　　•截取文件的第2列和第4列：

　　代碼如下：

　　cut -f2，4 filename

　　•去文件除第3列的所有列：

　　代碼如下：

　　cut -f3 --complement filename

　　•-d 指定定界符：

　　代碼如下：

　　cat -f2 -d“;” filename

　　•cut 取的范圍

　　N- 第N個字段到結尾

　　-M 第1個字

Linux教程排行

操作系統推薦

圖片文章

萬盛學電腦網

萬盛學電腦網 >> Linux教程 >> Linux Shell文本處理命令匯總

Linux Shell文本處理命令匯總

Linux教程排行

操作系統推薦

熱門文章

相關文章

圖片文章

win10系統下如何修改IE11浏覽器默認地址欄搜索引擎

Win8系統硬盤安裝詳細圖文教程

Win10自動收集用戶隱私信息該怎麼解決？

win7系統升級內存所需注意事項

萬盛學電腦網 | 設為首頁 | 加入收藏