萬盛學電腦網

 萬盛學電腦網 >> 服務器教程 >> Linux系統中tr命令刪除和替換文本字符的基本用法

Linux系統中tr命令刪除和替換文本字符的基本用法

   通過使用 tr,您可以非常容易地實現 sed 的許多最基本功能。您可以將 tr 看作為 sed 的(極其)簡化的變體:它可以用一個字符來替換另一個字符,或者可以完全除去一些字符。您也可以用它來除去重復字符。這就是所有 tr 所能夠做的。

  tr用來從標准輸入中通過替換或刪除操作進行字符轉換。tr主要用於刪除文件中控制字符或進行字符轉換。使用tr時要轉換兩個字符串:字符串1用於查詢,字符串2用於處理各種轉換。tr剛執行時,字符串1中的字符被映射到字符串2中的字符,然後轉換操作開始。

  帶有最常用選項的tr命令格式為:

  代碼如下:

  tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file

  這裡:

  -c 用字符串1中字符集的補集替換此字符集,要求字符集為ASCII。

  -d 刪除字符串1中所有輸入字符。

  -s 刪除所有重復出現字符序列,只保留第一個;即將重復出現字符串壓縮為一個字符串。

  input-file是轉換文件名。雖然可以使用其他格式輸入,但這種格式最常用。

  字符范圍

  指定字符串1或字符串2的內容時,只能使用單字符或字符串范圍或列表。

  [a-z] a-z內的字符組成的字符串。

  [A-Z] A-Z內的字符組成的字符串。

  [0-9] 數字串。

  \octal 一個三位的八進制數,對應有效的ASCII字符。

  [O*n] 表示字符O重復出現指定次數n。因此[O*2]匹配OO的字符串。

  tr中特定控制字符的不同表達方式

  速記符含義八進制方式

  \a Ctrl-G 鈴聲\007

  \b Ctrl-H 退格符\010

  \f Ctrl-L 走行換頁\014

  \n Ctrl-J 新行\012

  \r Ctrl-M 回車\015

  \t Ctrl-I tab鍵\011

  \v Ctrl-X \030

  表達字符串的特殊序列

  String1 和 String2 變量中所包含的字符串可以使用以下的約定來表示:

20151127110839429.png (1158×739)

  如果某個字符在 String1 中被指定過多次,則該字符就被轉換成 String2 中為與 String1 中最後出現的字符相對應的字符。

  如果由 String1 和 String2 指定的字符串長度不相同,則 tr 命令就會忽略較長一個字符串中的多余字符。

  標志

20151127110905187.png (1081×413)

  退出狀態

  該命令返回以下出口值:

20151127110922842.png (1092×72)

  實例:

  1、將文件file中出現的"abc"替換為"xyz"

  復制代碼

  代碼如下:

  # cat file | tr "abc" "xyz" > new_file

  【注意】這裡,凡是在file中出現的"a"字母,都替換成"x"字母,"b"字母替換為"y"字母,"c"字母替換為"z"字母。而不是將字符串"abc"替換為字符串"xyz"。

  2、使用tr命令“統一”字母大小寫

  (小寫 --> 大寫)

  代碼如下:

  # cat file | tr [a-z] [A-Z] > new_file

  (大寫 --> 小寫)

  代碼如下:

  # cat file | tr [A-Z] [a-z] > new_file

  3、把文件中的數字0-9替換為a-j

  代碼如下:

  # cat file | tr [0-9] [a-j] > new_file

  4、刪除文件file中出現的"Snail"字符

  代碼如下:

  # cat file | tr -d "Snail" > new_file

  【注意】這裡,凡是在file文件中出現的'S','n','a','i','l'字符都會被刪除!而不是緊緊刪除出現的"Snail”字符串。

  5、刪除文件file中出現的換行'\n'、制表'\t'字符

  代碼如下:

  # cat file | tr -d "\n\t" > new_file

  不可見字符都得用轉義字符來表示的,這個都是統一的。

  6、刪除“連續著的”重復字母,只保留第一個

  代碼如下:

  # cat file | tr -s [a-zA-Z] > new_file

  7、刪除空行

  代碼如下:

  # cat file | tr -s "\n" > new_file

  8、刪除Windows文件“造成”的'^M'字符

  代碼如下:

  # cat file | tr -d "\r" > new_file

  或者

  代碼如下:

  # cat file | tr -s "\r" "\n" > new_file

  【注意】這裡-s後面是兩個參數"\r"和"\n",用後者替換前者

  9、用空格符\040替換制表符\011

  代碼如下:

  # cat file | tr -s "\011" "\040" > new_file

  10、把路徑變量中的冒號":",替換成換行符"\n"

  代碼如下:

  # echo $PATH | tr -s ":" "\n"

  11、若要將大括號轉換為小括號,請輸入:

  代碼如下:

  tr '{}' '()' < textfile > newfile

  這便將每個 {(左大括號)轉換成 ((左小括號),並將每個 }(右大括號)轉換成 )(右小括號)。所有其它的字符都保持不變。

  12、若要將大括號轉換成方括號,請輸入:

  代碼如下:

  tr '{}' '\[]' < textfile > newfile

  這便將每個 {(左大括號)轉換成 [(左方括號),並將每個 }(右大括號)轉換成 ](右方括號)。左方括號必須與一個 "\"(反斜扛)轉義字符一起輸入。

  13、若要將小寫字符轉換成大寫,請輸入:

  代碼如下:

  tr 'a-z' 'A-Z' < textfile > newfile

  14、若要創建一個文件中的單詞列表,請輸入:

  代碼如下:

  tr -cs '[:lower:][:upper:]' '[\n*]' < textfile > newfile

  這便將每一序列的字符(除大、小寫字母外)都轉換成單個換行符。*(星號)可以使 tr 命令重復換行符足夠多次以使第二個字符串與第一個字符串一樣長。

  15、若要從某個文件中刪除所有空字符,請輸入:

  代碼如下:

  tr -d '\0' < textfile > newfile

  16、若要用單獨的換行替換每一序列的一個或多個換行,請輸入:

  代碼如下:

  tr -s '\n' < textfile > newfile

  或

  代碼如下:

  tr -s '\012' < textfile > newfile

  17、若要以“?”(問號)替換每個非打印字符(有效控制字符除外),請輸入:

  代碼如下:

  tr -c '[:print:][:cntrl:]' '[?*]' < textfile > newfile

  這便對不同語言環境中創建的文件進行掃描,以查找當前語言環境下不能打印的字符。

  18、要以單個“#”字符替換 字符類中的每個字符序列,請輸入:

  代碼如下:

  tr -s '[:space:]' '[#*]'

copyright © 萬盛學電腦網 all rights reserved