首页电脑/网络程序设计其他编程语言

8这三种编码模式有什么区别？

Windows记事本的ANSI、Unicode、UTF-8这三种编码模式有什么区别？

全部回答

常***

2013-08-25

41 0

编码和笔记本没有关系吧是网页的把不同的编码在浏览器里选择不同，选择不对浏览器出现乱码

提交

I***

2013-08-25

54 0

    一句话建议：涉及兼容性考量时，不要用记事本，用专业的文本编辑器保存为不带 BOM 的 UTF-8。 * * * 如果是为了跨平台兼容性，只需要知道，在 Windows 记事本的语境中： •所谓的「ANSI」指的是对应当前系统 locale 的遗留（legacy）编码。
    [1] •所谓的「Unicode」指的是带有 BOM 的小端序 UTF-16。[2] •所谓的「UTF-8」指的是带 BOM 的 UTF-8。[3] GBK 等遗留编码最麻烦，所以除非你知道自己在干什么否则不要再用了。
   UTF-16 理论上其实很好，字节序也标明了，但 UTF-16 毕竟不常用。   UTF-8 本来是兼容性最好的编码但 Windows 偏要加 BOM 于是经常出问题。所以，跨平台兼容性最好的其实就是不用记事本。
   建议用 Notepad++ 等正常的专业文本编辑器保存为不带 BOM 的 UTF-8。另外，如果文本中所有字符都在 ASCII 范围内，那么其实，记事本保存的所谓的「ANSI」文件，和 ASCII 或无 BOM 的 UTF-8 是一样的。
     * * * 阮一峰那篇〈字符编码笔记：ASCII，Unicode和UTF-8〉的确很有名，但从那篇文章能看出来他其实还是没完全搞清楚 Unicode 和 UTF-8 的关系。
  他依旧被 Windows 的混乱措词误导。事实上，几年前我读完他那篇文章之后依旧一头雾水，最终还是自己看维基百科看明白的。   所以，那篇文章不值得推荐。 * * * 关于字符集（character set）和编码（encoding），某几篇答案中似乎有些混淆。
   对于 ASCII、GB 2312、Big5、GBK、GB 18030 之类的遗留方案来说，基本上一个字符集方案只使用一种编码方案。   比如 ASCII 这部标准本身就直接规定了字符和字符编码的方式，所以既是字符集又是编码方案；而 GB 2312 只是一个区位码形式的字符集标准，不过实际上基本都用 EUC-CN 来编码，所以提及「GB 2312」时也说的是一个字符集和编码连锁的方案；GBK 和 GB 18030 等向后兼容于 GB 2312 的方案也类似。
     于是，很多人受这些遗留方案的影响而无法理解字符集和编码的关系。对于 Unicode，字符集和编码是明确区分的。Unicode/UCS 标准首先是个统一的字符集标准。
  而 Unicode/UCS 标准同时也定义了几种可选的编码方案，在标准文档中称作「encoding form」，主要包括 UTF-8、UTF-16 和 UTF-32。   所以，对 Unicode 方案来说，同样的基于 Unicode 字符集的文本可以用多种编码来存储、传输。
   所以，用「Unicode」来称呼一个编码方案不合适，并且误导。。

提交

一***

2013-08-24

57 0

    带盖的回答，可能一些细节暂无精力查证，如果说错了还请指出。一句话建议：涉及兼容性考量时，不要用记事本，用专业的文本编辑器保存为不带 BOM 的 UTF-8。 * * * 如果是为了跨平台兼容性，只需要知道，在 Windows 记事本的语境中：所谓的「ANSI」指的是对应当前系统 locale 的遗留（legacy）编码。
    [1] 所谓的「Unicode」指的是带有 BOM 的小端序 UTF-16。[2] 所谓的「UTF-8」指的是带 BOM 的 UTF-8。[3] GBK 等遗留编码最麻烦，所以除非你知道自己在干什么否则不要再用了。
   UTF-16 理论上其实很好，字节序也标明了，但 UTF-16 毕竟不常用。   UTF-8 本来是兼容性最好的编码但 Windows 偏要加 BOM 于是经常出问题。所以，跨平台兼容性最好的其实就是不用记事本。
   建议用 Notepad++ 等正常的专业文本编辑器保存为不带 BOM 的 UTF-8。另外，如果文本中所有字符都在 ASCII 范围内，那么其实，记事本保存的所谓的「ANSI」文件，和 ASCII 或无 BOM 的 UTF-8 是一样的。
     * * * 阮一峰那篇〈字符编码笔记：ASCII，Unicode和UTF-8〉的确很有名，但从那篇文章能看出来他其实还是没完全搞清楚 Unicode 和 UTF-8 的关系。
  他依旧被 Windows 的混乱措词误导。事实上，几年前我读完他那篇文章之后依旧一头雾水，最终还是自己看维基百科看明白的。   所以，那篇文章不值得推荐。 * * * 关于字符集（character set）和编码（encoding），某几篇答案中似乎有些混淆。
   对于 ASCII、GB 2312、Big5、GBK、GB 18030 之类的遗留方案来说，基本上一个字符集方案只使用一种编码方案。   比如 ASCII 这部标准本身就直接规定了字符和字符编码的方式，所以既是字符集又是编码方案；而 GB 2312 只是一个区位码形式的字符集标准，不过实际上基本都用 EUC-CN 来编码，所以提及「GB 2312」时也说的是一个字符集和编码连锁的方案；GBK 和 GB 18030 等向后兼容于 GB 2312 的方案也类似。
     于是，很多人受这些遗留方案的影响而无法理解字符集和编码的关系。对于 Unicode，字符集和编码是明确区分的。Unicode/UCS 标准首先是个统一的字符集标准。
  而 Unicode/UCS 标准同时也定义了几种可选的编码方案，在标准文档中称作「encoding form」，主要包括 UTF-8、UTF-16 和 UTF-32。   所以，对 Unicode 方案来说，同样的基于 Unicode 字符集的文本可以用多种编码来存储、传输。
   所以，用「Unicode」来称呼一个编码方案不合适，并且误导。 * * * [1] Windows 里说的「ANSI」其实是 Windows code pages，这个模式根据当前 locale 选定具体的编码，比如简中 locale 下是 GBK。
    把自己这些 code page 称作「ANSI」是 Windows 的臭毛病。在 ASCII 范围内它们应该是和 ASCII 一致的。 [2] 把带有 BOM 的小端序 UTF-16 称作「Unicode」也是 Windows 的臭毛病。
  Windows 从 Windows 2000 开始就已经支持 surrogate pair 了，所以已经是 UTF-16 了，「UCS-2」这个说法已经不合适了。  UCS-2 只能编码 BMP 范围内的字符，从 1996 年起就在 Unicode/ISO 标准中被 UTF-16 取代了（UTF-16 通过蛋疼的 surrogate pair 来编码超出 BMP 的字符）。
  都十多年了，求求大家别再误称了…… [3] 把带 BOM 的 UTF-8 称作「UTF-8」又是 Windows 的臭毛病。  如果忽略 BOM，那么在 ASCII 范围内与 ASCII 一致。

提交

相关回答

齐***

2006-08-30

在ASP中使用utf-8编码在A

  推荐用Editplus来写代码！！打开新建一个ASP页面,相信玩ASP的朋友都会留意到,许多下载的源码里,页面最上方一般都有一句: 前面的language应该不用多说了,vbscript就是ASP默认的脚本语言,其实完全可以不用写,写了好像还会影响页面执行效率,在这里我们先不讨论这个问题。
   后面的codepage就是关键了,目的就是告诉浏览器,此页面是何种编码,936代表是简体中文,而950代表繁体中文,65001就是我们今天说的UTF-8编码了。我们将936改成65001,整句如下: 再加上输出几个中文字看看能不能正确显示吧。
   OK,直接点击"保存",执行这个页面看看,如果不出意外,大家可能看到显示出的是 "一尾UTF-8页" 这几个字,中文有乱码的现象,什么原因呢? OK,请大家再点击最上面的 "文件" 菜单,选择"另存为",最下面一行有个编码,默认应该是ANSI的,请大家点下拉框,选择UTF-8,再点保存,再执行试试看,如果不出意外,乱得更厉害了,呵呵,晕了吧。
  别急,想想原因,因为我们做的页面是HTML返回的,以前我们写HTML时,看到body前面,也就是head里都有一句meta,应该是这样的: 也就是指定页面以gb2312编码返回结果,一定要写在有返回结果输出的前面。
  大家都知道gb2312是简体中文吧,我们今天说的是UTF-8编码,我们就将gb2312改成UTF-8吧,全部代码如下: 再执行看看,嗯,这次正常显示了吧。。。。。。。结论:采用UTF-8编码,除了要将文件另存为UTF-8格式之外,还需要同时指定codepage及charset。
   。收起

8这三种编码模式有什么区别？

全部回答

相关回答

在ASP中使用utf-8编码在A

类似问题换一批

热点推荐

热度TOP

热点搜索换一换

8这三种编码模式有什么区别？

全部回答

相关回答

在ASP中使用utf-8编码在A

类似问题换一批

热点推荐

热度TOP

热点搜索 换一换

热点搜索换一换