计算机中信息的表示
1.2.1 信息与数据的关系
.信息
人们活动所需和所获的知识
.数据
为识别信息而记录下来的符号
.数据和信息的关系
数据是信息的表现形式,是信息的载体
信息是数据所表达的含义,是人们通过对数据的分析和理解得到的
电子计算机是以二进制数据形式来表示信息的,信息必须化转成计算机能处理的数据形式才能存储和传输
数值数据与非数值数据
数值数据(数字)
可以参加数值计算的数据,计算机中以二进制的形式表示
非数值数据(字符)
不表示数值的大小,只代表符号
数值符号 0~9
大小写英文字母
算术运算符
标点符号
不显示的控制符号,
汉字
在计算机中也是以二进制的形式表示
1.2.2 计数制的概念
如果采用的数制有R个基本符号,则称为基R数制,简称R进制
十进制(Decimal) R=10 可用 0,1,2,3,4,5,6,7,8,9
二进制(Binary) R=2 可用 0,1
八进制(Octal) R=8 可用 0,1,2,3,4,5,6,7
十六进制(Hexadecilna) R=10 可用 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
R进制数 逢R进一,借一当R
基数:R
权:基数的若干次幂
一个数可以按权展开成为多项式
123.456 = 1x102 + 2x101+3x100+4x10-1+5x10-2+6x10-3
十进制数展开公式
∑KiNi
N称为基数 Ki 为系数, Ni为权
1.2.3 计算机的常用计数制及转换
1.二进制(Binary,信息存储,处理,传送)
2.十六进制(Hexadecilna,书写方便)
3.八进制(Octal,书写方便)
4.进制间的转换
二进制 binary
逢2进1,基数为2,权为2的若干次幂,两个基本字符号 0和1
指令和数据,数值,字符,声音,图形等信息都必须转为二进制的形式才能
存入计算机,一个二进制数在计算机中是以电子器件的两个状态来表示的
在数字逻辑电路中,低电平表示0,高电平表示1
二进制优点
1.容易物理实现,使电子线路制造计算机成为可能
2.运算规则简单(R(R+1)/2)
3.与逻辑运算吻合
4.机器可靠性高(两种状态稳定,容易区分)
数字电子电路中,逻辑门的实现用二进制,因此计算机和依赖计算机的设备里用二进制,每个数字称为一个比特 Bit(Binary digit的缩写)
二进制转十进制(按权展开)
二进制:1 0 0 1 0
权值:4 3 2 1 0
幂的底数:2
从右往左方向计算
(10010)2=1*(2^4)+0*(2^3)+0*(2^2)+1*(2^1)+0*(2^0)=(18)10
十进制转二进制(除2取余法)
十进制整数转换为二进制整数
用2整除十进制整数 ,得到一个商和余数
再用2去除商 又得到一个商和余数 继续这个过程到商为0为止
余数(0或1)对应二进制数各位数字
第一次得到的余数为二进制数的最低位
最后一次得到的余数为二进制的最高位
十进制转二进制为什么要用除二取余法,假如4位二进制数(b3b2b1b0)转为10进制为((b3*2+b2)*2+b1)*2+b0=d,反过来b0=d-((b3*2+b2)*2+b1)*2说明b0为d除2的余数其余类推
十六进制(Hexadecilna)
逢 16进一,基数为16,权为16的若干次幂,
16个基本数字符号 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F
十六进制转为十进制(按权展开)
(1CB)16=1*(16^2)+C*(16^1) +11*(16^0)=(459)10
十进制转为十六进制(除16取余法)
459/16=28 余11 a0=11
28/16=1余12 a1=12
1/16=0余1 a2=1
(459)10=(a2a1a0)=(1CB)16
八进制(Octal)
逢8进一,基数为8,权为8的若干次幂,
8个基本数字符号 0,1,2,3,4,5,6,7
八进制转为十进制(按权展开)
(154)8=1*(8^2)+5*(8^1) +4*(8^0)=(108)10
十进制转为八进制(除8取余法)
108/8=13 余4 a0=4
13/8=1余4 a1=5
1/8=0余1 a2=1
(108)10=(a2a1a0)=(154)8
进制间的转换
十进制转为r进制
整数部分 除以r取余数,直到商为0,余数从右到左排列
100.345(D)=1100100.01011(B)
100/2=50 余 0
50/2=25 余 0
25/2=12 余 1
12/2=6 余 0
6/2=3 余 0
3/2=1 余 1
1/2=0 余 1
整数部分是 1100100
小数部分 乘以r取整数 整数从左到右排列
0.345*2=0.690
0.690*2=1.380
1.380*2=0.769
0.769*2=1.520
1.520*2=1.04
小数部分 01011
二进制、八进制、十六进制之间的转换
二进制转换八进制
整数部分从右向左三位并一位
小数部分从左向右三位并一位
八进制转换二进制
整数部分从右向左一位拆三位
小数部分从左向右位一拆三位
二进制转换十六进制
整数部分从右向左四位并一位
小数部分从左向右四位并一位
十六进制转换二进制
整数部分从右向左一位拆四位
小数部分从左向右一位拆四位
100110110111.0101
100 110 110 111.010100
(4 6 6 7 . 2 4)8
1001 1011 0111.0101
(9 B 7 . 5 )16
总结
.一位八进制数对应三位二进数 144(O)=011 100 100(B)
.一位十六进制数对应四位二进数 64(H)=0110 0100(H)
.二进制转换八(十六)进制
整数部分从右向左三(四)位分组
小数部分从左向右三(四)位分组
不足补零
几种常用进制之间的对照关系
十 进 制 | 二 进 制 | 八 进 制 | 十 六 进 制 |
0 | 0000 | 0 | 0 |
1 | 0001 | 1 | 1 |
2 | 0010 | 2 | 2 |
3 | 0011 | 3 | 3 |
4 | 0100 | 4 | 4 |
5 | 0101 | 5 | 5 |
6 | 0110 | 6 | 6 |
7 | 0111 | 7 | 7 |
8 | 1000 | 10 | 8 |
9 | 1001 | 11 | 9 |
10 | 1010 | 12 | A |
11 | 1011 | 13 | B |
12 | 1100 | 14 | C |
13 | 1101 | 15 | D |
14 | 1110 | 16 | E |
15 | 1111 | 17 | F |
1.2.4 字符编码
也称字集码Character encoding是把字符集中的字符编码为指定集合中某一对象
如比特模式 自然数序列 8位组或者电脉冲 ,以便文本在计算机中存储和通过通信网络的传递
.西文字符编码(ASCII码)
.汉字编码
.各种汉字编码间的关系
微机中普遍使用的字符编码是ASCII码,American Standard Code for Information Interchange 美国信息交换标准代码,是基于拉丁字母的电脑编码系统,主要用于显示现代英语和其他西欧语言 ASCII 表
西文字符编码(ASCII码)
8位二进制码 最高位0 7位表示128个不同的字符
字符0 (0110000)2 = (48)10
字符1 (0110001)2 = (49)10
字符A (100001)2 = (65)10
字符B (100010)2 = (66)10
字符a (1100001)2 = (97)10
汉字编码
Chinese character encoding 为汉字设计的输入计算机的代码
1.输入码(外码)
从键盘输入的代表汉字的编码
常用的输入码有拼音码,五笔字型码,自然码,表形码,认知码,区位码和电报码等
好的编码有 编码规则简单,易学好记,操作方便,重码率低,输入速度快等优点,每个人可根据自己的需要进行选择
2.国标码(交换码)
二字节码,用二个七位表示一个汉字,把区位码的区码和位码分别加上 00100000 (20H)
计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外,二进制代码使用起来不方便,需要采用信息交换码,中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码
3.内码
汉字在设备和信息处理系统内部最基本的表达形式
汉字内码点二个字节,把国标码二个字节的最高位分别置为1(与ASCII码区别)
补 这个字的代码
国标码:3239H (00110010 00111001B)
内码: b2b9H (10110010 10111001B)
4.字形码
存放在字库中的汉字字形点阵码
字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。
通常用16×16点阵来显示汉字 占用字节数 (8*2)*16=32个字节
汉字点阵类型 点阵 占用字节数
简易型 16×16 32
普及型 24×24 72
提高型 32×32 128
精密型 48×48 228
5.地址码
汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码
它与汉字内码有着简单的对应关系,以简化内码到地址码的转换
各种汉字编码之间的关系
数字编码/字音编码/字形编码 >> 国标码 >> 内码 >> 字形码 >> 显示/打印汉字
尊贵的董事大人
英文标题不为空时 视为本栏投稿
需要关键字 描述 英文标题