首页前端开发正文

字符集和字符编码区别

朱绪2020-06-261317

今天来聊一聊字符集和字符编码。

首先来解释一下啥是字符,实际上字符就是一些文字和符号,这个比较容易理解。例如:666,绪哥,nice,@&!都可以称作字符!

字符集,从字面上拆解是不是“字符的集合”呢?

嘿嘿,的确是滴,字符集(charset)就是字符的集合。

字符集是和某一种特定的语言文字相对应的,比如英文字符集、汉字字符集等。

我们都晓得,所有的字符都是要显示出来呈现给人看的。

但是计算机在存储的时候,计算机只识别0和1这样的二进制数字,所以需要把这些字符跟二进制数字对应起来。

怎么对应呢?这就需要各种不同的编码来实现了,比如说将小写字母a通过ASCII码的形式整成01000001。

当然了,除了ASCII码还有其他的编码方式。

ASCII是对数字、英文字母、符号进行编码。

GB2312针对的是中文,UTF-8是针对所有语言的。(UTF-8非常流行)

中文字符编码

咱们访问一个网页的时候,有时候会出现这么一个情况,这个网页内容乱码了。

原因就是这个网页的html文件的源文件声明中的编码和该文件保存时的编码不一致,不一致就会出现乱码。