计算机中信息的表示


1.2.1 信息与数据的关系
.信息
人们活动所需和所获的知识
.数据
为识别信息而记录下来的符号
.数据和信息的关系
数据是信息的表现形式,是信息的载体
信息是数据所表达的含义,是人们通过对数据的分析和理解得到的
电子计算机是以二进制数据形式来表示信息的,信息必须化转成计算机能处理的数据形式才能存储和传输
数值数据与非数值数据
数值数据(数字)
可以参加数值计算的数据,计算机中以二进制的形式表示
非数值数据(字符)
不表示数值的大小,只代表符号
数值符号 0~9
大小写英文字母
算术运算符
标点符号
不显示的控制符号,
汉字
在计算机中也是以二进制的形式表示
1.2.2 计数制的概念
如果采用的数制有R个基本符号,则称为基R数制,简称R进制
十进制(Decimal) R=10 可用 0,1,2,3,4,5,6,7,8,9
二进制(Binary) R=2 可用 0,1
八进制(Octal) R=8 可用 0,1,2,3,4,5,6,7
十六进制(Hexadecilna) R=10 可用 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
R进制数 逢R进一,借一当R
基数:R
权:基数的若干次幂
一个数可以按权展开成为多项式
123.456 = 1x102 + 2x101+3x100+4x10-1+5x10-2+6x10-3
十进制数展开公式
∑KiNi
N称为基数 Ki 为系数, Ni为权

1.2.3 计算机的常用计数制及转换
1.二进制(Binary,信息存储,处理,传送)
2.十六进制(Hexadecilna,书写方便)
3.八进制(Octal,书写方便)
4.进制间的转换

二进制 binary
逢2进1,基数为2,权为2的若干次幂,两个基本字符号 0和1
指令和数据,数值,字符,声音,图形等信息都必须转为二进制的形式才能
存入计算机,一个二进制数在计算机中是以电子器件的两个状态来表示的
在数字逻辑电路中,低电平表示0,高电平表示1
二进制优点
1.容易物理实现,使电子线路制造计算机成为可能
2.运算规则简单(R(R+1)/2)
3.与逻辑运算吻合
4.机器可靠性高(两种状态稳定,容易区分)
数字电子电路中,逻辑门的实现用二进制,因此计算机和依赖计算机的设备里用二进制,每个数字称为一个比特 Bit(Binary digit的缩写)
二进制转十进制(按权展开)
二进制:1 0 0 1 0
权值:4 3 2 1 0
幂的底数:2
从右往左方向计算
(10010)2=1*(2^4)+0*(2^3)+0*(2^2)+1*(2^1)+0*(2^0)=(18)10
十进制转二进制(除2取余法)
十进制整数转换为二进制整数
用2整除十进制整数 ,得到一个商和余数
再用2去除商 又得到一个商和余数 继续这个过程到商为0为止
余数(0或1)对应二进制数各位数字
第一次得到的余数为二进制数的最低位
最后一次得到的余数为二进制的最高位
十进制转二进制为什么要用除二取余法,假如4位二进制数(b3b2b1b0)转为10进制为((b3*2+b2)*2+b1)*2+b0=d,反过来b0=d-((b3*2+b2)*2+b1)*2说明b0为d除2的余数其余类推
十六进制(Hexadecilna)
逢 16进一,基数为16,权为16的若干次幂,
16个基本数字符号 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
十六进制转为十进制(按权展开)
(1CB)16=1*(16^2)+C*(16^1) +11*(16^0)=(459)10
十进制转为十六进制(除16取余法)
459/16=28 余11 a0=11
28/16=1余12 a1=12
1/16=0余1   a2=1
(459)10=(a2a1a0)=(1CB)16

八进制(Octal)
逢8进一,基数为8,权为8的若干次幂,
8个基本数字符号 0,1,2,3,4,5,6,7
八进制转为十进制(按权展开)
(154)8=1*(8^2)+5*(8^1) +4*(8^0)=(108)10
十进制转为八进制(除8取余法)
108/8=13 余4 a0=4
13/8=1余4 a1=5
1/8=0余1   a2=1
(108)10=(a2a1a0)=(154)8

进制间的转换
十进制转为r进制
整数部分 除以r取余数,直到商为0,余数从右到左排列
100.345(D)=1100100.01011(B)
100/2=50 余 0
50/2=25 余 0
25/2=12 余 1
12/2=6 余 0
6/2=3 余 0
3/2=1 余 1
1/2=0 余 1
整数部分是 1100100
小数部分 乘以r取整数 整数从左到右排列
0.345*2=0.690
0.690*2=1.380
1.380*2=0.769
0.769*2=1.520
1.520*2=1.04
小数部分 01011

二进制、八进制、十六进制之间的转换
二进制转换八进制
整数部分从右向左三位并一位
小数部分从左向右三位并一位
八进制转换二进制
整数部分从右向左一位拆三位
小数部分从左向右位一拆三位
二进制转换十六进制
整数部分从右向左四位并一位
小数部分从左向右四位并一位
十六进制转换二进制
整数部分从右向左一位拆四位
小数部分从左向右一位拆四位
100110110111.0101
100 110 110 111.010100
(4    6   6   7 . 2 4)8
1001 1011 0111.0101
(9    B    7  . 5 )16
总结
.一位八进制数对应三位二进数   144(O)=011 100 100(B)
.一位十六进制数对应四位二进数  64(H)=0110 0100(H)
.二进制转换八(十六)进制
整数部分从右向左三(四)位分组
小数部分从左向右三(四)位分组
不足补零

几种常用进制之间的对照关系
十  进  制
二  进  制
八  进  制
十 六 进 制
0
0000
0
0
1
0001
1
1
2
0010
2
2
3
0011
3
3
4
0100
4
4
5
0101
5
5
6
0110
6
6
7
0111
7
7
8
1000
10
8
9
1001
11
9
10
1010
12
A
11
1011
13
B
12
1100
14
C
13
1101
15
D
14
1110
16
E
15
1111
17
F


1.2.4 字符编码
也称字集码Character encoding是把字符集中的字符编码为指定集合中某一对象
如比特模式 自然数序列 8位组或者电脉冲 ,以便文本在计算机中存储和通过通信网络的传递

.西文字符编码(ASCII码)
.汉字编码
.各种汉字编码间的关系
微机中普遍使用的字符编码是ASCII码,American Standard Code for Information Interchange 美国信息交换标准代码,是基于拉丁字母的电脑编码系统,主要用于显示现代英语和其他西欧语言 ASCII 表
西文字符编码(ASCII码)
8位二进制码 最高位0 7位表示128个不同的字符
字符0 (0110000)2 = (48)10
字符1 (0110001)2 = (49)10
字符A (100001)2 = (65)10
字符B (100010)2 = (66)10
字符a (1100001)2 = (97)10
汉字编码
Chinese character encoding 为汉字设计的输入计算机的代码
1.输入码(外码)
从键盘输入的代表汉字的编码
常用的输入码有拼音码,五笔字型码,自然码,表形码,认知码,区位码和电报码等
好的编码有 编码规则简单,易学好记,操作方便,重码率低,输入速度快等优点,每个人可根据自己的需要进行选择

2.国标码(交换码)
二字节码,用二个七位表示一个汉字,把区位码的区码和位码分别加上 00100000 (20H)
计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外,二进制代码使用起来不方便,需要采用信息交换码,中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码
3.内码
汉字在设备和信息处理系统内部最基本的表达形式
汉字内码点二个字节,把国标码二个字节的最高位分别置为1(与ASCII码区别)
补 这个字的代码
国标码:3239H (00110010 00111001B)
内码: b2b9H (10110010 10111001B)
4.字形码
存放在字库中的汉字字形点阵码
字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。
通常用16×16点阵来显示汉字 占用字节数 (8*2)*16=32个字节

汉字点阵类型  点阵   占用字节数
简易型         16×16  32
普及型         24×24  72
提高型         32×32  128
精密型         48×48  228
5.地址码
汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码
它与汉字内码有着简单的对应关系,以简化内码到地址码的转换

各种汉字编码之间的关系
数字编码/字音编码/字形编码 >> 国标码 >> 内码 >> 字形码 >> 显示/打印汉字