Ubuntu/文件亂碼

純文本文檔亂碼 編輯

現象:Ubuntu中默認使用gedit打開純文本文檔,在打開Windows保存的純文本文檔時,會出現亂碼。

原因:Windows中文版使用GBK或Big5字符集,而gedit默認字符集是UTF-8。

解決方法

方法一:命令行方式

gconftool-2 --set --type=list --list-type=string /apps/gedit-2/preferences/encodings/auto_detected "[UTF-8,CURRENT,GB18030,BIG5-HKSCS,UTF-16]"

方法二:圖形化方式

  1. 安裝gconf-editor配置編輯器
  2. 運行gconf-editor,配置編輯器
  3. 展開左邊的樹節點,找到 /apps/gedit-2/preferences/encodings 節點並單擊它
  4. 雙擊右邊的 auto_detected 鍵,打開「編輯鍵」對話框
  5. 單擊列表右邊的「添加」按鈕,輸入「GB18030」,單擊確定按鈕。
  6. 列表的最底部新增加了一個「GB18030」。單擊選中它,並單擊右邊的 「向上」 按鈕直到 「GB18030」 位於列表的頂部為止
  7. 單擊確定按鈕,關閉配置編輯器

MP3文件信息亂碼 編輯

PDF文件亂碼 編輯

現象:PDF文檔中的中文顯示為方塊,尤其是從中國知網等下載的論文。

原因:默認字體設置問題,默認字體不是中文字體。

解決方法

方法一:

命令行輸入

sudo gedit  /etc/fonts/conf.d/49-sansserif.conf

將倒數第四行的sans-serif修改為WenQuanYi Zen Hei,或者其他您喜歡的字體。

方法二:

安裝使用Adobe Reader的Linux版,並安裝東亞語言包。

方法三:

安裝使用Foxit Reader的Linux 中文版。


CHM文件亂碼 編輯

解決方法:使用chmsee軟體(華人開發)打開,對中文支持良好。

壓縮文件亂碼 編輯

現象:在Windows中創建的壓縮文件,在Ubuntu中察看或解壓亂碼;在Ubuntu中創建的壓縮文件,在Windows中察看或解壓亂碼。

原因:Ubuntu和Windows使用不同的系統默認編碼,且壓縮解壓程序不能正確識別編碼。

解決方法

方法一:更換壓縮格式

儘量使用7z,jar壓縮格式,可準確識別編碼,不會出現亂碼。

方法二:使用命令行參數

如果您知道壓縮文檔的編碼,如果它是在Windows簡體中文版上被創建的,那麼它很可能是GBK編碼的。

對於zip壓縮文檔:

unzip -O GBK xxx.zip