[Web Architecture]Unicode

  
 
http://jock.nease.net/java/Unicode.htm
 
Unicode 1. 编码知识
1.1 文本和字符
在计算机程序中或者数据文件里,文本(text)是作为数字序列存储的。序列中的数字是具有不同大小、取值和解释的整数。如何解释这些整数是由字符集(character set)、编码(encoding)决定的。
文本主要是由字符(character)组成。在格式文本(fancy text, or rich text)中包括显示属性,如颜色、斜体字、上标等,但仍然是以字符组成的纯文本(plain text)为基础的。有时,格式文本与纯文本之间的区别很复杂,依赖于具体的应用。
什么是字符?典型地,是字母。也可以是数字、句点、连字号、标点符号和数学符号,对于中文,也可以是汉字。还包括定义行尾和段落等的控制字符(一般不可见)。 <



[站务信息]2004年10月29日。开始提供blog服务。

特此纪念。



« 11 12 13 14 15 16 17 18 19

日历 | CALENDAR

«Mar.2020»
1234567
891011121314
15161718192021
22232425262728
293031
blog名称:World Wide Web Watch
日志总数:193
评论数量:664
留言数量:75
访问次数:5741125
建立时间:2004年10月30日
站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.031 second(s), page refreshed 144382153 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号