萬盛學電腦網

浏覽器 windows 10 wps office 殺毒軟件 數據庫 excel教程 文件管理 word教程 網頁制作 裝機必備軟件 linux教程

萬盛學電腦網 >> 服務器教程 >> 在Linux系統中修改文本的字符編碼的方法

在Linux系統中修改文本的字符編碼的方法

　　正如我們所知道的那樣，電腦只能夠處理低級的二進制值，並不能直接處理字符。當一個文本文件被存儲時，文件中的每一個字符都被映射成二進制值，實際存儲在硬盤中的正是這些“二進制值”。之後當程序打開文本文件時，所有二進制值都被讀入並映射回原始的可讀字符。只有當所有需要訪問這個文件的程序都能夠“理解”它的編碼，即二進制值到字符的映射時，這個“保存和打開”的過程才能很好地完成，這也確保了可理解數據的往返過程。

　　如果不同的程序使用不同的編碼來處理同一個文件，源文件中的特殊字符就無法正常顯示。這裡的特殊字符指的是非英文字母的字符，例如帶重音的字符(比如 ?，á，ü)。

　　然後問題就來了： 1)我們如何確定一個確定的文本文件使用的是什麼字符編碼? 2)我們如何把文件轉換成已選擇的字符編碼?

　　步驟一

　　為了確定文件的字符編碼，我們使用一個名為 “file” 的命令行工具。因為 file 命令是一個標准的 UNIX 程序，所以我們可以在所有現代的 Linux 發行版中找到它。

　　運行下面的命令：

　　代碼如下:

　　$ file --mime-encoding filename

　　步驟二

　　下一步是查看你的 Linux 系統所支持的文件編碼種類。為此，我們使用名為 iconv 的工具及 “-l” 選項(L 的小寫)來列出所有當前支持的編碼。

　　代碼如下:

　　$ iconv -l

　　iconv 工具是 GNU libc 庫組成部分，因此它在所有 Linux 發行版中都是開箱即用的。

　　步驟三

　　在我們在我們的 Linux 系統所支持的編碼裡面選定了目標編碼之後，運行下面的命令來完成編碼轉換：

　　代碼如下:

　　$ iconv -f old_encoding -t new_encoding filename

　　例如，把 iso-8859-1 編碼轉換為 utf-8 編碼：

　　代碼如下:

　　$ iconv -f iso-8859-1 -t utf-8 input.txt

　　了解了我們演示的如何使用這些工具之後，你可以像下面這樣修復一個受損的字幕文件：

上一頁:在CentOS的防火牆上開啟通行端口的方法
下一頁:Linux如何利用ssh傳送文件至FTP空間進行備份

萬盛學電腦網

萬盛學電腦網 >> 服務器教程 >> 在Linux系統中修改文本的字符編碼的方法

在Linux系統中修改文本的字符編碼的方法

服務器教程排行

程序編程推薦

熱門文章

相關文章

圖片文章

2015最流行的編程語言

產品研發流程與合作之交互設計

網頁設計師應該知道的心理學

android中圓角圖像生成方法

萬盛學電腦網 | 設為首頁 | 加入收藏