首页 > 教育学习 > 为什么 > 为什么那么多网站钟情 UTF-8?

为什么那么多网站钟情 UTF-8?
2012-01-19 17:34:56   来源:   点击:

    为什么那么多网站钟情 UTF-8?

    16 个答案

    • 答案 1:

      采用UTF8是因为你可以在网页上显示任何语言。另外一个好处不是对用户的,而是对开发人员,采用UTF8就帮你省了调乱码的时间。如果你认为utf8带歧视的话,可以用unicode,这样英文和中文都使用相同字节数,就没有歧视一说了,但是网页流量会增加50-80%。
    • 答案 2:

      UTF-8被大家选择的主要原因有两个:

        兼容ASCII

        前缀码

      前一个优点比较明显也引人注意,但其实后一个优点更重要。前缀码能让程序员很方便地用遍历的方法定位一段网络传输过来的字符串中出问题的范围,保持能显示部分最大化。这对那些工作在较差网络环境下时比兼容性重要得多。顺便说一句:所有非前缀多字节编码在这种场合下最后的结果都是必须丢弃从出错点开始到结尾的所有编码,无论是GB码还是Unicode/UTF-16。我确实不知道那些指称UTF-8是歧视说法究竟从何而来。但是UTF-8不是少数人的选择,是几乎全世界网络开发人员和几乎整个Linux/BSD社区的选择。要说歧视,ISO8859-*编码区在UTF-8里统统变成两个字节,算不算他们自己歧视自己?我们的GB2312对ASCII是一个字节,而所有的中文字符都是两个字节,算不算我们自己歧视自己?这世界上不是只有“中国”和“西方”两个国家。而且他们每天柴米油盐的也很忙,没时间专门找我们歧视。[更新] 原作者似乎删除了标题里的“歧视”说法,善莫大焉。[更新] 原作者提出删除了“歧视”说法的不是他。就他而言他坚持所谓“歧视”的立场,只好继续讨论。
    • 答案 3:

      今天心情不太好,吐槽一下lz (也就是熊伟)的回答1, unicode是字符集,utf-8是一种编码形式,请google一下相关资料再来发言。2,英文26个字母,汉字有好几万个3,除非你重写ascii码表,然后在寄存器级别把汉字们存下来。4,参见1,请再次好好研究一下到底他们是什么关系。5,选用gbk还是utf-8和编程水平确实无关,只和智商直接相关,给自己找麻烦不是傻嘛。6,你问这些门户网站的人如果能0成本转utf-8, 会有人不转吗?7,我特别讨厌这些好高骛远的说法,还不会走就想跑,还做不出什么像样的产品就号称要制定标准,这才是中国难以发展的原因。8,标准不代表先进,更不代表正确。9,我想这不是歧视,只是无知而已。
    • 答案 4:

      UTF-8是最方便的unicode编码方式,因为它兼容ASCII。虽然我们进入Python时代了,相信我,你还是会时不时遇上远古的处理ASCII的代码的,而这些代码99%的情况下不用重写就能在现代系统上处理国际化文字。前提是你的系统用UTF-8。UTF-32是另一种方便的编码,因为它定长。UTF-16是个两头不靠的方式。要兼容没兼容,又是变长码。当初设计它的时候以为16位就够了,纯属前瞻不足的产物。可惜Windows拿它来做API的接口。
    • 答案 5:

      还有人反对UTF-8,看来是没怎么做过Web开发。UTF-8是变长,不是只有3字节。还有人支持GB,2字节的字符集,最多65535啊,汉字都不只六万个啊朋友。等你做输入字符检测,会哭死的。世界上不是只有英文和汉字,写一串日文或韩文,你的网站就显示乱码了。多看看人家的教程,别误导别人。还有,乱码问题就是字符集问题,跟编程水平无关,2字节真存不下65537个字符。
    • 答案 6:

      UTF8是一种编码,统一的编码方便交流。用UTF8的网站不管你的系统默认用哪个regioncode,都不会出问题。这个根本不存在谁歧视谁。
    • 答案 7:

      他们美国人说英语,就是歧视我们!!!歧视我们!!!歧视我们!!!
    • 答案 8:

      这也是没办法,如果不大量采用西方流行的utf-8,在很多方面会造成编码转换的头疼问题。如果有一天网络上的中文文献无论从数量上还是质量上都远远超过西方的文献水平,并且西方人需要通过中文文献来找到他们需要的内容的时候,我们想用什么编码就用什么编码,不论是什么类型的网站都一样。
    • 答案 9:

      中文网站很多都是gb2312啊 百度 新浪 腾讯都是啊
    • 答案 10:

      在这种问题上纲上线就没劲了,用utf-8写网页,可以避免很多乱码的麻烦,谁喜欢给自己找麻烦呢?
    • 答案 11:

      字节不一样就是歧视吗...没逻辑啊 变长编码是一种纯粹的技术手段,还可以减少流量有什么不好的.
    • 答案 12:

      这么说吧,其实UTF-8不是对谁的歧视,而是方便开发人员的编码调试,乱码是非常痛苦的事情,另外,这个对西方主流语言没什么影响的吧
    • 答案 13:

      编程语言、系统命令都是英文的,楼主怎么看?
    • 答案 14:

      UTF-8为什么是对非西方语言的歧视呢?不懂。。。
    • 答案 15:

      整个行业本身就是歧视非西方主流语言的,楼主就不要再纠结了。不服气的话,赶紧自己发明个互联网,就可以歧视非中文了。
    • 答案 16:

      1. Windows, Linux操作系统内部都使用的纯正的unicode,而不是utf-8,仅仅在传输和存储上使用utf-8。有些人在这里纠结我里说的unicode是字符集,不是编码格式,不能和utf-8相比较,注意这里说的是内部使用的unicode,任何运行使用中的unicode肯定是一种编码格式,unicode诞生的时候就是一种16bit的原生编码形式,后来才发展为可以被多格式编码,但我们提及使用中unicode,没有特殊说明就指16bit的这种原生格式,这里只要说明操作系统内部使用的unicode编码格式不是utf-8就达到我要表达的意思了(其实不通的操作系统不同的硬件使用的unicode的编码方式也可能不同,但总之不是utf-8)2. utf-8存英文只需一个字节,而存中文要3个字节3. utf-8英文字符串装载入计算机后参与运算不需要转换;而中文要转换,在中文字符串中搜索效率差4. 没有一个地方非得用utf-8, 虽然它可以在一个页面上显示多种语言, 但网页上也可用转义的unicode代码来表示多种语言5. 乱码问题和编程水平和公司的编程规范有关,和字符编码无关6. 英文网站使用utf-8无可厚非,中国人自己用utf-8值得商榷,好在中国的门户网站几乎不用utf-8。像阿里巴巴中文网用的是gbk,而英文网用utf-8就比较合理;日本最大的社区网站Mixi,我国大多数新闻,电商网站都不用UTF-8,不要告诉我UTF-8太新了,这些网站因历史原因没有从一开始用它,或者谁告诉我这些网站谁打算换成UTF-8(换其实很容易)7. 中国缺乏制定标准的人和敢于制定标准的人,我们完全可以搞一个utf-china出来,让其它平台来实现转换8. gb18030是中国的汉字编码标准9. 本人一直反对utf-8,倡议打到utf-8, 以前试水CSDN也写了点这方面的东西(blog.csdn.net/williamhong)可供参考是不是歧视每个人心中判断不同,所以我的问题的标题就被人改了,就连Tim Bray也承认UTF-8带有某种程度的歧视(只是是造成了事实上的歧视):UTF-8 is kind of racist. It al?lows us round-eye pale?face an?glo?phone types to tuck our char?ac?ters neatly into one byte, lets most peo?ple whose lan?guages are head?quar?tered west of the Indus river get away with two bytes per, and pe?nal?izes India and points east by re?quir?ing them to use three bytes per char?ac?ter.以上只是列些事实而已。知乎虽然用utf-8,但本人没有攻击的意思。

相关热词搜索:

上一篇:酒店提供的拖鞋、牙具、梳子等消耗品,客人离店时是否应该带走?
下一篇:在 eBay 上买或卖产品有哪些经验?