欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

后记:给出收藏建议,彻底理解字符编码问题,从而摆脱中文乱码的困扰

最编程 2024-01-03 07:28:02
...

计算机操作系统中的编码:

  • Windows下中文的默认编码是 GBK(GB2312)。
  • Linux 下中文的默认编码是 UTF-8。

如果使用的是 Linux 系统,可以通过如下命令,查看系统中文编码:

1echo $LANG
2en_US.UTF-8

如果想要查看文件的原始编码,并且转换编码,可以使用 enca 命令,可以通过 apt-get install enca 进行安装。

1enca -L zh_CN <file>  # 查看文件的编码
2enca -L zh_CN -x UTF-8 <file>  # 将文件编码转换为UTF-8编码
3enca -L zh_CN -x UTF-8 <file_1> <file_2> # 保留原始文件

字符编码选择建议:

  1. 只有英文,选择 ASCII。
  2. 主要存中文,对存储大小比较敏感,选择 GB2312。
  3. 通用性第一,处理简单,选择 UTF-8。