Ubuntu/文件乱码

纯文本文档乱码

编辑

现象:Ubuntu中默认使用gedit打开纯文本文档,在打开Windows保存的纯文本文档时,会出现乱码。

原因:Windows中文版使用GBK或Big5字符集,而gedit默认字符集是UTF-8。

解决方法

方法一:命令行方式

gconftool-2 --set --type=list --list-type=string /apps/gedit-2/preferences/encodings/auto_detected "[UTF-8,CURRENT,GB18030,BIG5-HKSCS,UTF-16]"

方法二:图形化方式

  1. 安装gconf-editor配置编辑器
  2. 运行gconf-editor,配置编辑器
  3. 展开左边的树节点,找到 /apps/gedit-2/preferences/encodings 节点并单击它
  4. 双击右边的 auto_detected 键,打开“编辑键”对话框
  5. 单击列表右边的“添加”按钮,输入“GB18030”,单击确定按钮。
  6. 列表的最底部新增加了一个“GB18030”。单击选中它,并单击右边的 “向上” 按钮直到 “GB18030” 位于列表的顶部为止
  7. 单击确定按钮,关闭配置编辑器

MP3文件信息乱码

编辑

PDF文件乱码

编辑

现象:PDF文档中的中文显示为方块,尤其是从中国知网等下载的论文。

原因:默认字体设置问题,默认字体不是中文字体。

解决方法

方法一:

命令行输入

sudo gedit  /etc/fonts/conf.d/49-sansserif.conf

将倒数第四行的sans-serif修改为WenQuanYi Zen Hei,或者其他您喜欢的字体。

方法二:

安装使用Adobe Reader的Linux版,并安装东亚语言包。

方法三:

安装使用Foxit Reader的Linux 中文版。


CHM文件乱码

编辑

解决方法:使用chmsee软件(华人开发)打开,对中文支持良好。

压缩文件乱码

编辑

现象:在Windows中创建的压缩文件,在Ubuntu中察看或解压乱码;在Ubuntu中创建的压缩文件,在Windows中察看或解压乱码。

原因:Ubuntu和Windows使用不同的系统默认编码,且压缩解压程序不能正确识别编码。

解决方法

方法一:更换压缩格式

尽量使用7z,jar压缩格式,可准确识别编码,不会出现乱码。

方法二:使用命令行参数

如果您知道压缩文档的编码,如果它是在Windows简体中文版上被创建的,那么它很可能是GBK编码的。

对于zip压缩文档:

unzip -O GBK xxx.zip