信息的表示和处理
通过使用标准的字符码能够对文档中的字母和符号进行编码。
三种重要的数字表现形式:
1、 无符号数:编码基于传统的二进制表示法表示大于或等于零的数字。
2、 补码:编码是表示有符号整数的最常见方法,可以是正或者是负的数字。
3、 浮点数:编码是表示实数的科学计数法的以二位基数的版本
溢出:计算机的表示法是用有限数量的位来为一个数字编码,因此当结果太大就会导致某些运算溢出。
整数和浮点数会有不同的数学属性是因为:处理数字表示有限性的方法不同:
整数:编码相对较小的数值范围,但精确度高
浮点数:编码较大范围的数,但这种表示是近似的
2.1信息存储
编写机器级程序的常见任务就是在位模式的十进制、二进制、十六进制之间人工的进行进制转换。
1. 十六进制表示
2. 字: 字长:指明整数和指针数据的标称大小。字长决定最重要的系统参数就是虚拟地址空间的最大大小。
3. 数据大小:计算器和编译器支持不同方式编码的数字格式,也具有处理单个字节的指令或2字节,4字节,8字节整数的指令。
4. 寻址和字节顺序:最高有效位前八位和最低有效位后八位。是网络编程基础
小端法:某些机器选择在存储器中按最低有效字节到最高有效字节
大端法:某些机器选择在存储器中按最高有效字节到最低有效字节
小端法“高对高,低对低”大端与之相反。
5. 表示字符串:文本数据比二进制数据具有更强的独立性
6. 布尔代数:二进制是计算机编码存储和操作信息的核心。数电里学过布尔运算。我会。
7. C语言中的位级运算:C语言支持按位的布尔运算。与或非,异或同或
常见用法就是实现掩码运算。
8. C语言中的逻辑运算:&&与。||或。!非。
9. C语言中的移位运算:x<<k:左移k位。X>>k:右移
2.2整数表示
1.整型数据类型:根据字节分配,不同的大小所能表示的值的范围不同。C
C 和C++默认支持有符号数和无符号数,Java只支持有符号数。
2.无符号数的编码:B2U4([0001])=0*2^3+0*2^2+0*2^1+1*2^0=1
3.补码编码:B2T4([1011])=-1*2^3+0*2^2+1*2^1+1*2^0=-5
最高位有效位也称符号位,权重为-2^w-1。符号位为1是负为0是正。
补码的范围不对称,是因为:一半的数的整数一半是负数,而0是非负数。最大的无符号数值刚好比补码的最大值的两倍大一点。
4.有符号数和无符号数之间的转换:
5.C语言中的有符号数和无符号数:默认有符号,若想创建无符号常量必须加后缀U/u。
C语言转换的原则是底层的位保持不变。无到有:U2TW。有到无:T2UW
6.扩展一个数字的位表示:在不同字长的整数之间转换又保持数值不变。
0扩展:简单的在表示的开头加0。
符号扩展:将补码数字转换成更大类型的数据。规则在表中添加最高有效位的值的副本。
7.截断数字:减少表示一个数字的位数。
2.3整数运算
1.无符号加法:可以被视为模运算形式,等价于计算和模2^w。在我的理解看来应该就是跟溢出差不多的性质。运算的溢出是指完整的整数结果不能存放到数据类型的字长限制中。
2.补码加法:负溢出得到的结果比整数和大16,正溢出得到的结果比整数小16.
3.补码的非&4.无符号乘法计算公式看书。
5.补码乘法:给定长度的两个为位向量,无符号乘积的位级与补码乘积的位级表示是相同的,表明及其可以用一种乘法指令来进行有符号数和无符号数的乘法。无符号和补码乘积的低位是相同的
6.乘以常数:为了缩短计算时间,试着用移位和加法运算的组合来代替乘以常数的乘法。推理过程看书。
7除以2的幂:除法比乘法的计算时间更长。除以2 的幂用右移而不是左移。同样推理过程仔细阅读书上的内容。
8.关于整数运算:整数运算实际是一种模运算。表示数字的有限字长限制了可能的取值范围,结果可能溢出。补码提供了技能表示正数也能表示负数的灵活方法,同时使用了与执行无符号算数相同的位级实现。
2.4浮点数
1.二进制小数:
与十进制小数类似,会转换就行。二进制小数点向左移动一位相当于这个小数被2除,向右移动一位相当于该数乘以2。
2.IEEE浮点表示:标准 V=(-1)^s*M*2^E
其中:
符号:s 决定这个数是正数还是负数。
尾数:M 二进制小数。
阶码:E 对浮点数加权,权重是2 的E次幂。
将浮点数的位划分成三段分别进行编码:
一个单独的符号位直接编码符号。
K位的阶码字段exp=ek-1……e1e0编码阶段
N位小数字段
情况1:规格化的值。当exp的为模不全为1或0。阶码字段被解释为以偏置形式表示有符号整数。
情况2:非规格化的值:阶码域全为0。用途:提供了一种表示数值0的方法。表示非常接近于0.0的数。
情况3:特殊值:阶码域全为1。小数域全为0,得到的值表示无穷。在表示未初始化的数据时也很有用。
3.数字示例:k位阶码和n位小数的浮点表示的一般属性:
值+0.0总有一个全为0的位表示。
最小的正非规格化值的位表示,是由最低位为1而其他位为0构成的
最大的非规格化值的位表示,是由全为0的阶段字码和全为1的小数字段组成
最小的正规格化值的位表示,是由最低位为1而其他位为0构成的。
值1.0的位表示的阶码字段除了最高有效位等于0以外其他位为1.
最大的规格化值的位表示,符号位为0阶码的最低有效位为0,其他位为1.
4.舍入:浮点运算只能近似的表示示数运算想要找到最接近x的值就是舍入,问题的关键在于在两个可能的值中间确定舍入方向。
a.向偶数舍入:也叫向最接近的值舍入。是默认方法。将数字向上或向下舍入使的结果的最低有效数字是偶数。其他三种方式产生实际值的确界。
5.浮点运算:IEEE的优势可以独立于任何具体的硬件或软件实现。
浮点加法不具有结合性但满足了单调性属性。
问题
什么是强制类型转换结果保持位值不变,只改变解释这些位的方法?
解决:比如,将float f强制转换成int f float f=5.75;printf("(int)f=%d,f=%f\n",(int)f,f);f虽强制转为int型,但只在运算中起作用,是临时的,而f本身的类型并不改变。因此,(int)f的值为 5(删去了小数)而f的值仍为5.75。(http://baike.haosou.com/doc/6223849-6437161.html)