萬盛學電腦網

 萬盛學電腦網 >> 服務器教程 >> Linux下用於對比文件的diff命令使用教程

Linux下用於對比文件的diff命令使用教程

   總覽

  diff [選項] 源文件 目標文件

  描述

  在最簡單的情況是, diff 比較兩個文件的內容 (源文件 和 目標文件). 文件名可以是 - 由標准輸入設備讀入的文本. 作為特別的情況是, diff - - 比較一份標准輸入的它自己的拷貝如果 源文件 是一個目錄和 目標文件 不是(目錄), diff 會比較在 源文件(目錄) 裡的文件的中和 目標文件同名的(文件), 反過來也一樣. 非目錄文件不能是 -. 如果 源文件 和 目標文件 都是目錄, diff 比較兩個目錄中相應的文件,依照字母次序排序;這個比較是不會遞歸的,除非給出 -r 或者 --recursive. diff 不把一個目錄的內容看為它是一個文件來比較。被指定的文件不能是標准的輸入, 因為標准的輸入是無名的並且"有一樣的名字的文件"的觀點不適用。 diff 的選項由 -, 開始所以正常地 源文件(名) 和 目標文件(名) 不可以用 - 開頭. 然而, -- 可以被它視為保留的即使作為文件名的開頭( they begin with -.)

  選項

  下面是 GNU所接受的 diff 的所有選項的概要. 大多數的選項有兩個相同的名字,一個是單個的跟在 - 後面字母, 另一個是由 -- 引出的長名字. 多個單字母選項(除非它們產生歧義)能夠組合為單行的命令行語法 -ac 是等同於 -a -c. 長命名的選項能被縮短到他們的名字的任何唯一的前綴. 用 ([ 和 ]) 括起來顯示選項產生歧義的選項

  -行數(一個整數)

  顯示上下文 行數 (一個整數). 這個選項自身沒有指定輸出格式,這是沒有效果的,除非和 -c 或者 -u 組合使用. 這是已廢置的選項,對於正確的操作, 上下文至少要有兩行。

  -a

  所有的文件都視為文本文件來逐行比較,甚至他們似乎不是文本文件.

  -b

  忽略空格引起的變化.

  -B

  忽略插入刪除空行引起的變化.

  --brief

  僅報告文件是否相異,在乎差別的細節.

  -c

  使用上下文輸出格式.

  -C 行數(一個整數)

  --context[=lines]

  使用上下文輸出格式,顯示以指定 行數 (一個整數), 或者是三行(當 行數 沒有給出時. 對於正確的操作, 上下文至少要有兩行.

  --changed-group-format=format

  使用 format 輸出一組包含兩個文件的不同處的行,其格式是 if-then-else .

  -d

  改變算法也許發現變化的一個更小的集合.這會使 diff 變慢 (有時更慢).

  -D name

  合並 if-then-else 格式輸出, 預處理宏(由name參數提供)條件.

  -e

  --ed

  輸出為一個有效的 ed 腳本.

  --exclude=pattern

  比較目錄的時候,忽略和目錄中與 pattern(樣式) 相配的.

  --exclude-from=file

  比較目錄的時候,忽略和目錄中與任何包含在 file(文件) 的樣式相配的文件和目錄.

  --expand-tabs

  在輸出時擴展tab為空格,保護輸入文件的tab對齊方式

  -f

  產生一個很象 ed 腳本的輸出,但是但是在他們在文件出現的順序有改變

  -F regexp

  在上下文和統一格式中,對於每一大塊的不同,顯示出匹配 regexp. 的一些前面的行.

  --forward-ed

  產生象 ed 腳本的輸出,但是它們在文件出現的順序有改變。

  -h

  這選項現在已沒作用,它呈現Unix的兼容性.

  -H

  使用啟發規則加速操作那些有許多離散的小差異的大文件.

  --horizon-lines=lines

  比較給定行數的有共同前綴的最後行,和有共同或綴的最前行.

  -i

  忽略大小寫.

  -I regexp

  忽略由插入,刪除行(由regexp 參數提供參考)帶來的改變.

  --ifdef=name

  合並 if-then-else 格式輸出, 預處理宏(由name參數提供)條件.

  --ignore-all-space

  在比較行的時候忽略空白.

  --ignore-blank-lines

  忽略插入和刪除空行

  --ignore-case

  忽略大小寫.

  --ignore-matching-lines=regexp

  忽略插入刪除行(由regexp 參數提供參考).

  --ignore-space-change

  忽略空白的數量.

  --initial-tab

  在文本行(無論是常規的或者格式化的前後文關系)前輸出tab代替空格. 引起的原因是tab對齊方式看上去象是常規的一樣.

  -l

  產生通過 pr 編碼的輸出.

  -L label

  --label=label

  使用 label 給出的字符在文件頭代替文件名輸出.

  --left-column

  以並列方式印出兩公共行的左邊

  --line-format=format

  使用 format 輸出所有的行,在 if-then-else 格式中.

  --minimal

  改變算法也許發現變化的一個更小的集合.這會使 diff 變慢 (有時更慢).

  -n

  輸出 RC-格式 diffs; 除了每條指令指定的行數受影響外 象 -f 一樣。

  -N

  --new-file

  在目錄比較中,如果那個文件只在其中的一個目錄中找到,那麼它被視為在另一個目錄中是一個空文件.

  --new-group-format=format

  使用 format 以if-then-else 格式輸出只在第二個文件中取出的一個行組

  --new-line-format=format

  使用 format 以if-then-else 格式輸出只在第二個文件中取出的一行

  --old-group-format=format

  使用 format 以if-then-else 格式輸出只在第一個文件中取出的一個行組

  --old-line-format=format

  使用 format 使用 format 以if-then-else 格式輸出只在第一個文件中取出的一行

  -p

  顯示帶有c函數的改變.

  -P

  在目錄比較中,如果那個文件只在其中的一個目錄中找到,那麼它被視為在另一個目錄中是一個空文件.

  --paginate

  產生通過 pr 編碼的輸出.

  -q

  僅報告文件是否相異,不報告詳細的差異.

  -r

  當比較目錄時,遞歸比較任何找到的子目錄.

  --rcs

  輸出 RC-格式 diffs; 除了每條指令指定的行數受影響外 象 -f 一樣。

  --recursive

  當比較目錄時,遞歸比較任何找到的子目錄.

  --report-identical-files

  -s

  報告兩個文件相同.

  -S file

  當比較目錄時,由 file 開始. 這用於繼續中斷了的比較.

  --sdiff-merge-assist

  打印附加的信息去幫助 sdiff. sdiff 在運行 diff 時使用這些選項. 這些選項不是特意為使用者直接使用而准備的。

  --show-c-function

  顯示帶有c函數的改變.

  --show-function-line=regexp

  在上下文和統一的格式,對於每一大塊的差別,顯示出匹配 regexp. 的一些前面的行

  --side-by-side

  使用並列的輸出格式.

  --speed-large-files

  使用啟發規則加速操作那些有許多離散的小差異的大文件.

  --starting-file=file

  當比較目錄時,由 file 開始. 這用於繼續中斷了的比較.

  --suppress-common-lines

  在並列格式中不印出公共行。

  -t

  在輸出時擴展tab為空格,保護輸入文件的tab對齊方式

  -T

  在文本行(無論是常規的或者格式化的前後文關系)前輸出tab代替空格.引起的原因是tab對齊方式看上去象是常規的一樣.

  --text

  所有的文件都視為文本文件來逐行比較,甚至他們似乎不是文本文件.

  -u

  使用統一的輸出格式.

  --unchanged-group-format=format

  使用 format 輸出兩個文件的公共行組,其格式是if-then-else.

  --unchanged-line-format=format

  使用 format 輸出兩個文件的公共行,其格式是if-then-else.

  --unidirectional-new-file

  在目錄比較中,如果那個文件只在其中的一個目錄中找到,那麼它被視為在另一個目錄中是一個空文件.

  -U lines

  --unified[=lines]

  使用前後關系格式輸出,顯示以指定 行數 (一個整數), 或者是三行(當 行數 沒有給出時. 對於正確的操作, 上下文至少要有兩行.

  -v

  --version

  輸出 diff 版本號.

  -w

  在比較行時忽略空格

  -W columns

  --width=columns

  在並列格式輸出時,使用指定的列寬.

  -x pattern

  比較目錄的時候,忽略和目錄中與 pattern(樣式) 相配的.

  -X file

  比較目錄的時候,忽略和目錄中與任何包含在 file(文件) 的樣式相配的文件和目錄.

  -y

  使用並列格式輸出

  實例:

  假設我們有兩個文件(file1 和 file2):

  代碼如下:

  $ cat file1

  Hi,

  Hello,

  How are you?

  I am fine,

  Thank you.

  代碼如下:

  $ cat file2

  Hello,

  Hi,

  How are you?

  I am fine.

  你可以看見兩個文件有些小的不同。現在,讓我們看看diff命令如何找出兩者的不同的。

  像這樣運行diff命令:

  代碼如下:

  $ diff file1 file2

  1d0

  < Hi,

  2a2

  > Hi,

  4,5c4

  < I am fine,

  < Thank you.

  ---

  > I am fine.

  你可以看見diff後面跟了兩個文件的名字作為命令行的參數,並且它在輸出中生成了差異比較。輸出並不容易理解。理由是,這是被計算機使用的而不是為了人類。盡管如此,讓我們一步步解碼輸出:

  注意 – 在下面的文本中,file1和file2將被當作舊文件和新文件。

  代碼如下:

  1d0

  < Hi,

  這裡,1d0這一行意味著舊文件的第一行應該被刪除(d)以使兩個文件的第一行同步。舊文件中需要被刪除的行以'<'標記。

  代碼如下:

  2a2

  > Hi,

  這裡,2a2行意味著新文件中的第二行應該加到舊文件的第二行後。要添加的行顯示在輸出的下一行用'>'標記。

  代碼如下:

  4,5c4

  < I am fine,

  < Thank you.

  ---

  > I am fine.

  這裡,4,5c4這一行意味著在舊文件中的4到5行現在已被改變並且需要用新文件中的第4行代替。添加和刪除的行分別用'>'和'<'表示。

  那麼,來總結一下,

  首先diff命令的第一個參數被視為舊文件而第二個參數被視為新文件。

  像1d0、2a2、4,5c4這種表達式可以用語法解碼為 [舊文件的行號或者行的范圍][行為][新文件的行號或者行的范圍]。這裡的'行為'可以是追加,刪除或者改變替換。

  '<'代表刪除的行,而'>'代表添加的行。

  除了文件外,diff命令還可以比較兩個目錄。讓我們通過一個例子學習。

  這裡是'new_dir'目錄包含的內容:

  代碼如下:

  $ ls new_dir/

  file file2 frnd frnd1.cpp log1.txt log3.txt log5.txt

  file1 file name with spaces frnd1 frnd.cpp log2.txt log4.txt

  這是'orig_dir'目錄含有的內容:(譯注:原文為and here are the contents of a directory named ‘olddir’ ,其中'olddir'應為筆誤。)

  代碼如下:

  $ ls orig_dir/

  file1 file name with spaces frnd1 frnd.cpp log2.txt log4.txt test

  file2 frnd frnd1.cpp log1.txt log3.txt log5.txt

  下面是diff命令執行後的輸出:

  代碼如下:

  $ diff new_dir/ orig_dir/

  Only in new_dir/: file

  Only in orig_dir/: test

  你可以看到當diff命令被用來比較這兩個目錄時,很容易就會顯示兩個文件中缺失的文件。

  下面是一些在命令行下常用的選項:

  1. 用 -i 忽略大小寫

  如果兩個文件含有相同的文本但是大小寫不同,diff命令仍會默認報告它不同。

  比如:

  代碼如下:

  $ cat file1

  HI

  $ cat file2

  hi

  $ diff file1 file2

  1c1

  < HI

  ---

  > hi

  你可以看見diff命令在輸出中報告了大小寫不同。

  要去除這個默認行為,使用-i選項。

  以下是個例子:

  代碼如下:

  $ diff -i file1 file2

  這樣你可以看到沒有生成輸出,這是當兩個文件相同時的默認行為。

  2. 用 -s 選項報告兩個文件相同

  在例子1的後面,我們看到如果文件相同diff不會生成報告。雖然這個默認行為不錯但是它仍可能會造成很大疑惑,特別對於新手而言。因此,如果你像樣diff命令明確地報告兩個文件不同,那麼就使用-s命令選項。

  來舉個例子:

  代碼如下:

  $ diff -is file1 file2

  Files file1 and file2 are identical

  你可以看到我加了-s選項在後面的例子中,這次diff命令會明確地報告兩個文件是相同的。

  3. 使用 -b 忽略空格

  另外一個常用的是diff報告文件存在不同數量的空格。

  舉例說明:

  代碼如下:

  $ cat file1

  Hi, how are you?

  $ cat file2

  Hi, how are you?

  觀察這兩個文件唯一的不同是file2中'are'和'you'之間額外的空格。現在,當使用diff命令比較兩個文件時,輸出如下:

  代碼如下:

  $ diff file1 file2

  1c1

  < Hi, how are you?

  ---

  > Hi, how are you?

  因此你可以看到diff命令報告了不同。但是如果你想要忽略這些空格,使用 -b 選項。

  代碼如下:

  $ diff -b file1 file2

  這樣你可以看到由於-b選項,diff命令報告這兩個文件是相同的。

copyright © 萬盛學電腦網 all rights reserved