问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Unicode字符是什么

发布网友 发布时间:2022-04-25 14:27

我来回答

4个回答

热心网友 时间:2022-04-26 03:18

UNICODE使任何语言的字符都可以为机器更容易的接受,UNICODE由UC(UNICODE协会)管理并接受其技术上的修改。包括JAVA、LDAP、XML这样的技术标准中均要求得到UNICODE的支持。UNICODE的字符被成为代码点(CODE POINTS),用U后面加上XXXX来表示,其中,X为16进制的字符。

对于英文来说,ascii码 0-127就足以代码所有字符,对于中文而言,则必须使用两个字节(byte)来代表一个字符,具第一个字节必须大于127(所以我们有许程序判断中文都是以ascii码大于127作为条件)。以上用两个字节来表示一个中文的方式,在习惯上称为双字节(即DBCS: Double-Byte Character Set),而相对之下,英文的字符码就称为单字节SBCS(Single-Byte Character Set)。

虽然双字节(DBCS)足以解决中英文字符混合使用情况,但对于不同字符系统而言,必须经过字符码转换,非常麻烦。例如:中英文混合情况,日文,韩文等等。为解决这个问题,国际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组。针对各国文字、符号进行统一性编码。1991年美国*公司成立Unicode Consortium。并于1991年10月与WG2达成协议。采用同一编码字集。目前Unicode是采用16位编码体系。其字符集内容与ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通过DIS(Draf International Standard)。目前版本V2.0于1996公布。内容包含符号6811个。汉字20902个。韩文拼音11172个。造字区6400个。保留20249个。共计65534个。

随着国际互联网的迅速发展。要求进行数据交换的需求越来越大。不同的编码体系越来越成为信息交换的障碍。而且多种语言共存的文档不断增多。单靠代码页已很难解决这些问题。于是UNICODE应运而生。

UNICODE有双重含义。首先UNICODE是对国际标准ISO/IEC10646编码的一种称谓(ISO/IEC10646是一个国际标准。亦称大字符集。它是ISO于1993年颁布的一项重要国际标准。其宗旨是全球所有文种统一编码)。另外它又是由美国的HP、Microsoft、IBM、Apple等大企业组成的联盟集团的名称。成立该集团的宗旨就是要推进多文种的统一编码。

UNICODE同现在流行的代码页最显著不同点在于:UNICODE是两字节的全编码。对于ASCII字符它也使用两字节表示。代码页是通过高字节的取值范围来确定是ASCII字符。还是汉字的高字节。如果发生数据损坏。某处内容破坏。则会引起其后汉字的混乱。UNICODE则一律使用两个字节表示一个字符。最明显的好处是它简化了汉字的处理过程。

UNICODE使用平面来描述编码空间。每个平面分为256行。256列。相对于两字节编码的高低两个字节。

UNICODE的第一个平面。称为Basic Multilingual Plane(基本多文种平面)。简称BMP。由于BMP仅用两个字节表示。所以倍受青睐。

Unicode的最初目标。是用1个16位的编码来为超过65000字符提供映射。但这还不够。它不能覆盖全部历史上的文字。也不能解决传输的问题(implantation head-ache's)。尤其在那些基于网络的应用中。因此。Unicode用一些基本的保留字符制定了三套编码方式。它们分别是UTF-8,UTF-16和UTF-32。正如名字所示。在UTF-8中。字符是以8位序列来编码的。用一个或几个字节来表示一个字符。这种方式的最大好处。是UTF-8保留了ASCII字符的编码做为它的一部分。例如。在UTF-8和ASCII中。“A”的编码都是0x41.UTF-16和UTF-32分别是Unicode的16位和32位编码方式。考虑到最初的目的。通常说的Unicode就是指UTF-16。

多年来。计算机普遍采用美国信息交换标准代码(American Standard Code for Information Interchange,简称ASCII码)来表示字符。这些字符可以是字母。数字。标点符号和控制符。用这种编码来表示英文在内的字符不成问题的。但要表示其它语言文字如。阿拉伯文。中文。日文。维文。哈文…必须进行扩充。在1987年。Xerox Palo Alto研究中心的Joe Becker和Lee Collins。以及Apple公司的Mark Davis试图研究一种适用于多文种处理的字符编码。这种编码很快就得到了许多大公司的支持。这些公司都派代表参加Unicode研究组。Unicode的研究得到了较快的进展。由于Unicode集团的成员都是世界上的主要系统及软件制造商。所以Unicode很快就成为事实上的工业标准。

基于Unicode的系统允许使用65000个不同的字符。足以善盖世界所有语言的所有字母。外加数千种符号。

其中。General Scripts区单独收录了19种语言文字。包括ASCII,Latin1,Greek,Cyrillic,Armenian,Hedrew,Arabic,Devanagari,Bengali ,Gurmukhi,Gujarati,Oriya,Tamil,Telugu,Kannada,Malayalam,Thai,Lao,Tibetan,Georgian等语言文字之外。还包括汉语。日语和朝鲜语中的所有大量字符。

Unicode是一种定长的2B多文种字符集编码。它试图善盖现有的有关国家和地区的标准。包括GB2312,CNS11643,JIS 0208和KSC 5601等。Unicode可以表示混合文字资料。也可以保证以前的ISO 10646。

Unicode的特点是:

不管哪一国的字符码均以两个Byte表示,例如"A"在Unicode则是16进制 41和00的组合,即4100,高位41(转换为Ascii码即是65=A),Windows NT/2000以Unicode来表示字符集,例如你可以看到MS SQL Server中产生的SQL文件可以选择是以Unicode来保存还是以普通格式来保存,如果你以Unicode保存,则在95/98平台许多软件均无法正确读出其格式。

同时你还可以注意到95/98中API定义,许多名称结尾是有一个A的,例如

WriteProfileStringA

而在NT/2000操作系统中,提供了两套API,另外一个命令是WriteProfileStringW,以W 结尾的API只适用于NT / 2000。(在NT中使用以W结尾的API函数效率比A结尾的要快,因为省去了Unicode和DBCS/SBCS的转换过程)

这样我们经常要用到的判断字符串长度的函数,在NT和95/98下执行结果不同,如下:(下面代码适合于VB, ASP)

95/98中:

len("abc中国") 返回 7 (因为每个中文作为两个Ascii码来看)

NT/2000中:

len("abc中国") 返回 5 (因为每个字符都作为一个Unicode来看)

热心网友 时间:2022-04-26 04:36

unicode是统一码的意思,一种语言代码,我国还有gb2312和gb18030,统一码是国际标准编码,是统一对世界上的字母、数字、符号,还有双字节的汉字、日文等进行编码,如果使用unicode的话,就不再会出现"乱码"一说。如果没有相应的字体用来显示,那只会显示一个方块。

热心网友 时间:2022-04-26 06:28

Unicode的功能不仅仅在于可以混合输入和显示世界各国语言,更主要的功能在于它能输入和显示通常的文本编辑软件所无法输入和显示的更多的汉字和世界各国文字。 它是经常使用多国文字的学者和各界人士所必备的重磅级工具。

热心网友 时间:2022-04-26 08:36

Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。
作用:能够使计算机实现跨语言、跨平台的文本转换及处理。
层次:Unicode 编码系统,可分为编码方式和实现方式两个层次。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
平安银行卡不用了怎么办,又没有注销,会不会扣你身份证的信誉啊 ...装备强化进阶攻略[图]-手游攻略-游戏鸟手游网 酱猪肉总散发刺激味道,该如何去除呢? 城市广州别称羊城城市特点简介 20120310快乐大本营主持人推荐的手机软件分别叫什么? 考全科医疗副主任医师什么考试书好 大家帮我参考一下这个”广博DT1138C”数码相机能不能买啊? ...怎么调光圈和像素照出来颜色漂亮,我照的怎么颜色乌突突的啊?_百度... 大家帮我参考一下这个”广博DT1138C”数码相机能不能买啊? 沪昆高铁经过娄底哪些地方 什么叫 “Unicode格式 字符” ?? Unicode是用多少位来表示一个字的? unicode是什么意思?是干什么的? unicode是什么意思 unicode编码是什么? 梦见猫和蛇在一起,很大一条蛇,他不咬我但是把我吓哭了,然后一只*的大猫想咬我,我很紧张吓得跑就一 梦到蛇咬猫 求解梦。梦见蛇,猫,鬼 梦见猫被彩色的大蛇吓跑了 华硕笔记本电脑睡眠后按任意键唤醒后,直接重新启动 为什么把电话卡换到另一个手机,卡里的号码全没了? 水瓶座求上升星座! 2000.2.13(2点45) 水瓶座 上升星座 月亮星座是什么 公历1989年2月2日,阴历腊月二十六 早6点左右 水瓶座的上升星座是什么? 水瓶座上升星座是什么 水瓶座的上升星座是什么 85年2月6日凌晨2点半水瓶座的上升星座 水瓶座的上升星座是什么? 1996年1月28日四点出生的水瓶座的上升星座是什么星座 水瓶座的上升星座 什么是unicode格式? 什么是unicode编码 unicode是什么? 通俗的讲,什么是unicode? unicode字符有哪些? 武冈市教育系统教师职业年金查询 职业年金在山晋通哪里查 无锡市公务员职业年金怎么查询 我工龄38年职业年金38块钱什么这是怎么计算的我是机关单位退休的? 单位向个人借款垫付职业年金借条如何写? 个人所得税扣除,被赡养老人去世处理方法 在校大学本科生当兵二年,复学毕业后可以保送读研究生吗? 什么情况可以免个人所得税 社科院预测一季度经济的开局如何? 开宠物店的创业计划书? 铁桶上面写字用什么笔 宠物殡葬创业计划书 (1) 能在钢铁样品上写字的液体怎么配制?(写出来的字呈黑褐色,用酒精擦拭不掉) 销酸镍溶液能在铁上写字吗 我的世界怎么在纸上写字,看图求解!。