萬盛學電腦網

 萬盛學電腦網 >> Linux教程 >> 深入理解Linux文本流

深入理解Linux文本流

  相信很多人都知道什麼是系統文件,但很少人知道文本流是什麼,其實文本流不難理解,下面小編就給大家詳細介紹下Linux文本流,一起來學習下吧。

  文本流

  文件用於數據的存儲,相當於一個個存儲數據的房子。我們之前說,所謂的數據是0或者1的序列,但嚴格來說,Linux以字節(byte)來作為數據的單位,也就是說這個序列每八位(bit)為一個單位(八位二進制對應的十進制范圍為0到255)。使用ASCII編碼,可以將這樣一個字節轉換成為字符。所以,在Linux中,我們所說的數據,完全可以用字符表達出來,也就是說文本(text)的形式。

  實際上,如果以bit為單位處理字符的話,機器會更容易讀懂和傳輸,效率會更高。但為什麼Linux依然以字節為單位進行處理呢?原因在於,相對於以bit為單位處理數據,以byte為單位可以更容易將數據轉化為字符。相對於枯燥的0和1,字符更容易被人讀懂 (human readable)。然而,並不是所有的數據都是設計來讓人讀懂的,比如可執行文件包含的各種字符對於人來說並沒有什麼意義 (因為可執行文件是為了讓機器讀懂的)。但Linux依然以字節為單位處理所有文件,這是為了讓所有文件能夠共用一套接口 (virtual file system),從而減少Linux設計的復雜度。

  (“everything is a file”是通常所流傳的UNIX設計的哲學之一,但Linus對此作出糾正,改為“everything is a stream of bytes”。)

  然而,數據不是在找到了自己的房子(file)之後就永遠的定居下來。它往往要被讀入到內存 (就像是到辦公室上班),或者被傳送到外部設備(好像去酒店休假),或者搬到別的房子中。在這樣的搬遷過程中,數據像是一個個排著隊走路的人流,我們叫它文本流(text stream,或者byte stream)。然而,計算機不同設備之間的連接方法差異很大,從內存到文件的連接像是爬山,從內存到外設像是游過一條河。為此,Linux還定義了流 (stream),以此作為修建連接各處的公路的標准。Stream的好處在於,無論你是從內存到外設,還是從內存到文件,所有的公路都是相同的 (至於公路下面是石頭還是土地,都可以不用操心)。

  我們再回味一下“everything is a stream of bytes”這句話。信息包含在文本流中,不斷在計算機的各個組件之間流動,不斷地接受計算機的加工,最終成為用戶所需要的某種服務。

  (說句題外話,如果看過駭客帝國的話,一定會對文本流印象深刻。)

 深入理解Linux文本流

  標准輸入,標准輸出,標准錯誤與重新定向

  當Linux執行一個程序的時候,會自動打開三個流,標准輸入(standard input),標准輸出(standard output),標准錯誤(standard error)。比如說你打開命令行的時候,默認情況下,命令行的標准輸入連接到鍵盤,標准輸出和標准錯誤都連接到屏幕。對於一個程序來說,盡管它總會打開這三個流,但它會根據需要使用,並不是一定要使用。

  想象一下敲擊一個

  代碼如下:

  $ls

  鍵盤敲擊的文本流(“ls\n”,\n是回車時輸入的字符,表示換行)命令行 (命令行實際上也是一個程序)。命令行隨後調用/bin/ls得到結果(“a.txt”),最後這個輸出的文本流(“a.txt”)流到屏幕,顯示出來,比如說:

  代碼如下:

  a.txt

  假設說我們不想讓文本流流到屏幕,而是流到另一個文件,我們可以采用重新定向(redirect)的機制。

  代碼如下:

  $ls 》 a.txt

  重新定向標准輸出。這裡的》就是提醒命令行,讓它知道我現在想變換文本流的方向了,我們不讓標准輸出輸出到屏幕,而是要到a.txt這個文件 (好像火車軌道換軌)。此時,計算機會新建一個a.txt的文件,並將命令行的標准輸出指向這個文件。

  有另一個符號:

  代碼如下:

  $ls 》》 a.txt

  這裡》》的作用也是重新定向標准輸出。如果a.txt已經存在的話,ls產生的文本流會附加在a.txt的結尾,而不會像》那樣每次都新建a.txt。

  我們下面介紹命令echo:

  代碼如下:

  $echo IamVamei

  echo的作用是將文本流導向標准輸出。在這裡,echo的作用就是將IamVamei輸出到屏幕上。如果是

  代碼如下:

  $echo IamVamei 》 a.txt

  a.txt中就會有IamVamei這個文本。

  我們也可以用《符號來改變標准輸入。比如cat命令,它可以從標准輸入讀入文本流,並輸出到標准輸出:

  代碼如下:

  $cat 《 a.txt

  我們將cat標准輸入指向a.txt,文本會從文件流到cat,然後再輸出到屏幕上。當然,我們還可以同時重新定向標准輸出:

  代碼如下:

  $cat 《 a.txt 》 b.txt

  這樣,a.txt的內容就復制到了b.txt中。

  我們還可以使用》&來同時重新定向標准輸出和標准錯誤。假設我們並沒有一個目錄void。那麼

  代碼如下:

  $cd void 》 a.txt

  會在屏幕上返回錯誤信息。因為此時標准錯誤依然指向屏幕。當我們使用:

  代碼如下:

  $cd void 》& a.txt

  錯誤信息被導向a.txt。

  如果只想重新定向標准錯誤,可以使用2》:

  代碼如下:

  $cd void 2》 a.txt 》 b.txt

  標准錯誤對應的總是2號,所以有以上寫法。標准錯誤輸出到a.txt,標准輸出輸出到b.txt。

  管道 (pipe)

  理解了以上的內容之後,管道的概念就易如反掌。管道可以將一個命令的輸出導向另一個命令的輸入,從而讓兩個(或者更多命令)像流水線一樣連續工作,不斷地處理文本流。在命令行中,我們用|表示管道:

  代碼如下:

  $cat 《 a.txt | wc

  wc命令代表word count,用於統計文本中的行、詞以及字符的總數。a.txt中的文本先流到cat,然後從cat的標准輸出流到wc的標准輸入,從而讓wc知道自己要處理的是a.txt這個字符串。

  Linux的各個命令實際上高度專業化,並盡量相互獨立。每一個都只專注於一個小的功能。但通過pipe,我們可以將這些功能合在一起,實現一些復雜的目的。

  總結

  文本流,標准輸入,標准輸出,標准錯誤

  cat, echo, wc

  》, 》》, 《, |

  上面就是Linux文本流的詳細介紹了,本文主要介紹了標准輸入、標准輸出、標准錯誤和重定向,那麼你對Linux文本流有一定的了解了嗎?

copyright © 萬盛學電腦網 all rights reserved