彻底明白原码、反码和补码的工作机制与内在逻辑
本文从原码讲起。通过简述原码,反码和补码存在的作用,加深对补码的认识。力争让你对补码的概念不再局限于:负数的补码等于反码加一
。
接触过计算机或电子信息相关课程的同学,应该都或多或少看过补码这哥仨。每次都是在课本的最前几页,来上这么一段:什么反码是原码除符号位,按位取反。补码等于反码加一。
然后给整得莫名其妙,稀里糊涂地,接着就是翻页,反正后面的内容也跟三码没多大关系。
我原来也是看了好几遍都没看懂。古人云:事不过三。学C语言的时候,看过一次。不懂?看《计算机基本组成原理》的时候看过,还是不懂!到了大三,上《单片微机原理与接口技术》的时候仍旧是不懂。到了期末,复习的时候,和宿舍的人瞎聊。说讲讲这些码呀,我说我也不是很清楚呀。然后就一边说怎么求码,一边算。玩着玩着,突然就明白了。我说好,打住。不说了,放假我在好好整理下思路,于是就有了这篇额。。算讨论帖吧。
好了,废话不多说。开始我们的原码,反码,补码之旅。
(一)预备知识
认识二进制,十六进制。会二进制与十进制的相互转化运算
由计算机的硬件决定,任何存储于计算机中的数据,其本质都是以二进制码存储。
根据冯~诺依曼提出的经典计算机体系结构框架。一台计算机由运算器,控制器,存储器,输入和输出设备组成。其中运算器,只有加法运算器,没有减法运算器(据说一开始是有的,后来由于减法器硬件开销太大,被废了 )
所以,计算机中的没法直接做减法的,它的减法是通过加法来实现的。
你也许会说,现实世界中所有的减法也可以当成加法的,减去一个数,可以看作加上这个数的相反数。当然没错,但是前提是要先有负数的概念。这就为什么不得不引入一个该死的符号位。
-
而且从硬件的角度上看,只有正数加负数才算减法。
-
正数与正数相加,负数与负数相加,其实都可以通过加法器直接相加。
原码,反码,补码的产生过程,就是为了解决,计算机做减法和引入符号位(正号和负号)的问题。
本文可能比较长,没必要一下子读完。原码,反码,补码,按章读。
重点在于讲补码,到了补码可能有些绕,建议带着笔,写出二进制数一起算。
表达可能不够清楚严谨,望见谅。
(二)原码
原码:是最简单的机器数表示法。用最高位表示符号位,‘1’表示负号,‘0’表示正号。其他位存放该数的二进制的绝对值。
若以带符号位的四位二进值数为例
-
1010 : 最高位为‘1’,表示这是一个负数,其他三位为‘010’,
-
即(0*2^2)+(1*2^1)+(0*2^0)=2(‘^’表示幂运算符)
-
所以1010表示十进制数(-2)。
下图给出部份正负数数的二进制原码表示法
OK,原码表示法很简单有没有,虽然出现了+0和-0,但是直观易懂。
于是,我们高兴的开始运算。
-
0001+0010=0011 (1+2=3)OK
-
0000+1000=1000 (+0+(-0)=-0) 额,问题不大
-
0001+1001=1010 (1+(-1)=-2)
噢,1+(-1)=-2
,这仿佛是在逗我呢。
于是我们可以看到其实正数之间的加法通常是不会出错的,因为它就是一个很简单的二进制加法。
而正数与负数相加,或负数与负数相加,就要引起莫名其妙的结果,这都是该死的符号位引起的。0分为+0
和-0
也是因他而起。
所以原码,虽然直观易懂,易于正值转换。但用来实现加减法的话,运算规则总归是太复杂。于是反码来了。
(三)反码
我们知道,原码最大的问题就在于一个数加上他的相反数不等于零。
例如:0001+1001=1010 (1+(-1)=-2)
0010+1010=1100 (2+(-2)=-4)
于是反码的设计思想就是冲着解决这一点,既然一个负数是一个正数的相反数,那我们干脆用一个正数按位取反来表示负数试试。
反码:正数的反码还是等于原码
负数的反码就是他的原码除符号位外,按位取反。
若以带符号位的四位二进制数为例:
-
3是正数,反码与原码相同,则可以表示为0011
-
-3的原码是1011,符号位保持不变,低三位(011)按位取反得(100)
-
所以-3的反码为1100
下图给出部分正负数的二进制数反码表示法
对着上图,我们再试着用反码的方式解决一下原码的问题
0001+1110=1111 (1+(-1)= - 0)
互为相反数相加等于0,解决。虽然是得到的结果是1111也就是-0
好,我们再试着做一下两个负数相加
1110(-1)+1101(-2)=1011(-4)
噢,好像又出现了新问题
(-1)+(-2)=(-4)?
不过好像问题不大,因为1011(是-4的反码,但是从原码来看,他其实是-3。巧合吗?)
我们再看个例子吧
1110(-1)+1100(-3)=1010(-5)
确实是巧合,看来相反数问题是解决了,但是却让两个负数相加的出错了。
但是实际上,两个负数相加出错其实问题不大。我们回头想想我们的目的是什么?是解决做减法的问题,把减法当成加法来算。
两个正数相加和两个负数相加,其实都是一个加法问题,只是有无符号位罢了。而正数+负数才是真正的减法问题。
也就是说只要正数+负数不会出错,那么就没问题了。负数加负数出错没关系的,负数的本质就是正数加上一个符号位而已。
在原码表示法中两个负数相加,其实在不溢出的情况下结果就只有符号位出错而已(1001+1010=0011)
反码的负数相加出错,其实问题不大。我们只需要加实现两个负数加法时,将两个负数反码包括符号位全部按位取反相加,然后再给他的符号位强行置‘1’就可以了。
所以反码表示法其实已经解决了减法的问题,他不仅不会像原码那样出现两个相反数相加不为零的情况,而且对于任意的一个正数加负数,如:0001(1)+1101(-2)=1110(-1)
计算结果是正确的。所以反码与原码比较,最大的优点,就在于解决了减法的问题。
但是我们还是不满足为什么 0001+1110=1111 (1+(-1)=-0)
为什么是-0
呢
而且虽然说两个负数相加问题不大,但是问题不大,也是问题呀。好吧,处女座。接下来就介绍我们的大boss补码
。
(四)补码
补码:正数的补码等于他的原码
负数的补码等于反码+1。
(这只是一种算补码的方式,多数书对于补码就是这句话)
在《计算机组成原理中》,补码的另外一种算法 是
负数的补码等于他的原码自低位向高位,尾数的第一个‘1’及其右边的‘0’保持不变,左边的各位按位取反,符号位不变。
OK,补码就讲完了。再见!!
还是莫名其妙有没有,为什么补码等于反码加1,为什么自低位向高位取反...................?
其实上面那两段话,都只是补码的求法,而不是补码的定义。很多人以为求补码就要先求反码,其实并不是。
那些鸡贼的计算机学家,并不会心血来潮的把反码+1就定义为补码。只不过是补码正好就等于反码加1罢了。
所以,忘记那些书上那句负数的补码等于它的反码
+1
。就这句话把我们带入了理解的误区。
这就是后来我明白为什么我看的那本《计算机组成原理》,要特意先讲补码,再讲反码。
然后说负数的补码等于他的原码自低位向高位,尾数的第一个‘1’及其右边的‘0’保持不变,左边的各位按位取反,符号位不变。
但是上面这句话,同样不是补码的定义,它只是补码的另外一种求法。它的存在,告诉我们忘记那句该死的‘反码+1’它并不是必须的。
如果你有兴趣了解,补码的严格说法,我建议你可以看一下《计算机组成原理》。它会用‘模’和‘同余’的概念,严谨地解释补码。
接下来我只想聊聊补码的思想。
(五)补码的思想
补码的思想,第一次见可能会觉得很绕,但是如果你肯停下来仔细想想,绝对会觉得非常美妙。
补码的思想其实就来自于生活,只是我们没注意到而已。时钟,经纬度,《易经》里的八卦。
补码的思想其实就类似于生活中的时钟
好吧,我其实不想用类似,好像这种词,因为类比的,终究不是事物本身。而且不严谨会让我怀疑我不是工科僧,说得好像我严谨过似的,哈哈
如果说现在时针现在停在10点钟,那么什么时候时针会停在八点钟呢?
简单,过去隔两个小时的时候,是八点钟。未来过十个小时的时候也是八点钟
也就是说时间正拨10小时,或是倒拨2小时都是八点钟。
也就是10-2=8,而且 10+10=8(10+10=10+2+8=12+8=8)
这个时候满12说明时针在走第二圈了,又走了8小时,所以时针正好又停在八点钟。
所以12在时钟运算中,称之为模,超过了12就会重新从1开始算了。
也就是说, 10-2和10+10从另一个角度来看是等效的,它都使时针指向了八点钟。
既然是等效的,那在时钟运算中,减去一个数,其实就相当于加上另外一个数(这个数与减数相加正好等于12,也称为同余数)
这就是补码所谓模运算思想的生活例子
在这里,我们再次强调原码,反码,补码的引入是为了解决做减法的问题。
在原码,反码表示法中,我们把减法化为加法的思维是减去一个数,等于加上一个数的相反数,结果发现引入了符号位,却因为符号位造成了各种意向不到的问题。
但是从上面的例子中,我们可以看到其实减去一个数,对于数值有限制,有溢出的运算(模运算)来说,其实也相当于加上这个数的同余数。
也就是说,我们不引入负数的概念,就可以把减法当成加法来算
。所以接下来我们聊4位二进制数的运算,也不必急于引入符号位。因为补码的思想,把减法当成加法时并不是必须要引入符号位的
。
而且我们可以通过下面的例子,也许能回答另一个问题,为什么负数的符号位是‘1’,而不是正数的符号位是‘1’。
(六)补码实例
好吧,接下来我们就做一做四位二进制数的减法吧(先不引入符号位)
0110(6)-0010(2)【6-2=4,但是由于计算机中没有减法器,我们没法算】
这个时候,我们想想时钟运算中,减去一个数,是可以等同于加上另外一个正数(同余数)
那么这个数是什么呢?从时钟运算中我们可以看出这个数与减数相加正好等于模。
那么四位二进制数的模是多少呢?也就是说四位二进制数最大容量是多少?其实就是2^4=16=10000B
那么2的同余数,就等于10000-0010=1110(14)
既然如此
0110(6)-0010(2)=0110(6)+1110(14)=10100(20=16+4)
OK,我们看到按照这种算法得出的结果是10100
,但是对于四位二进制数,最大只能存放4位(硬件决定了),如果我们低四位,正好是0100(4)
,正好是我们想要的结果,至于最高位的‘1’
,计算机会把他放入psw寄存器进位位中。
8位机则会放在cy
中,x86会放在cf
中(这个我们不作讨论)
这个时候,我们再想想在四位二进制数中,减去2,就相当于加上它的同余数14(至于它们为什么同余,还是建议看《计算机组成原理》)
但是减去
2
,从另外一个角度来说,也是加上(-2)
。即加上(-2)
和加上14
其实得到的二进制结果除了进位位,结果是一样的。如果我们把
1110(14)
的最高位看作符号位后就是(-2)
的补码,这可能也是为什么负数的符号位是‘1’
而不是‘0’
,
而且在有符号位的四位二进制数中,能表示的只有‘-8~7’
,而无符号位数(14)
的作用和有符号数(-2)
的作用效果其实是一样的。
那正数的补码呢?加上一个正数,加法器就直接可以实现。所以它的补码就还是它本身。
下图给出带符号位四位二进制的补码表示法
到这里,我们发现原码,反码的问题,补码基本解决了。
在补码中也不存在负零了,
因为1000表示-8
这是因为根据上面的补码图,做减法时,0001(1)+1111(-1)=0000
我们再也不需要一个1000
来表示负0
了,就把它规定为-8
负数与负数相加的问题也解决了1111(-1)+1110(-2)=1101(-3)
可能说得有点绕,但是实在是没办法。其实我觉得补码还可以这样画。
很优美有没有,如果你想想地理课本,0不就相当于本初子午线,-8不就是180°,而正数相当于西经,负数相当于东经。
(七)为何这样求补码
然后我们再来看看为什么负数的补码的求法为什么是反码+1
因为负数的反码加上这个负数的绝对值正好等于1111,再加1,就是1000,也就是四位二进数的模
而负数的补码是它的绝对值的同余数,可以通过模减去负数的绝对值,得到他的补码。
所以 负数的补码就是它的反码+1。
有点绕吧,只能说很难算清楚,你们还是自己算算吧。还有上面我提到的另外一种算法。
接下来,我要说一下我自己算补码的小技巧。
看上面那个图。
如果我们把-8当成负数的原点。那么-5的补码是多少呢?
-5=-8+3
-5的补码就是-8的补码加3
1000(-8) +0011(3)=1011(-5)
所以完全可以口算出-5的补码是1011
当然,也可以记住-1的补码是1111
口算减法得出
对于八位加法器的话,可以把-128
当补码原点。十六位可以把-32768
当补码原点。
是的,128
是256
(八位二进制数的模)的一半,32768
是65536
(十六位二进数的模)的一半
也很方便有没有,而且简单的是
补码原点总是最高位是
‘1’
,其他位是‘0’
所以做加法总是简单得可以口算。
OK,原码,反码,补码之旅就到这里结束。补码第一次看总会觉得很绕,想言简意赅,就怕哪里遗漏了。讲得细致,又不免连自己都觉得啰里啰嗦。谢观
转载自:https://www.imooc.com/article/16813?block_id=tuijian_wz
推荐阅读
-
反传销网8月30日发布:视频区块链里的骗子,币里的韭菜,杜子建骂人了!金融大V周召说区块链!——“一小帮骗子玩一大帮小白,被割韭菜,小白还轮流被割,割的就是你!” 什么区块链,统统是骗子 作者:周召(知乎金融领域大V,毕业于上海财经大学,目前任职上海某股权投资基金合伙人) 有人问我,区块链现在这么火,到底是不是骗局? 我的回答是: 是骗局。而且我并不是说数字货币是骗局,而是说所有搞区块链的都是骗局。 -01- 区块链是一种鸡肋技术 人类社会任何技术的发明应用,本质都是为了提高社会的生产效率。而所谓区块链技术本质不过是几种早已成熟的技术的大杂烩,冗余且十分低效,除了提高了洗钱和诈骗的效率以外,对人类社会的进步毫无贡献。 真正意义上的区块链得包含三个要素:分布式系统(包括记账和存储),无法篡改的数据结构,以及共识算法,三者互为基础和因果,就像三体世界一样。看上去挺让人不明觉厉的,而经过几年的瞎折腾,稍微懂点区块链的碰了几次壁后都已经渐渐明白区块链其实并没有什么卵用,区块链技术已经名存实亡,沦为了营销工具和传销组织的画皮。 因为符合上述定义的、以比特币为代表的原教旨区块链技术,是反效率的,从经济学角度来说,不但不是一种帕累托改进,甚至还可以说是一种帕累托倒退。 原教旨区块链技术的效率十分低下,因为要遍历所有节点,只能做非常轻量级的数据应用,一旦涉及到大量的数据传输与更新,区块链就瞎了。 一方面整条链交易速度会极慢,另一方面数据库容量极速膨胀,考虑到人手一份的存储机制,区块链其实是对存储资源和能源的一种极大的浪费。 这里还没有加上为了取得所谓的共识和挖矿消耗的巨大的能源,如果说区块链技术是屎,那么这波区块链投机浪潮可谓人类历史上最大规模的搅屎运动。 区块链也验证不了任何东西。 所谓的智能合约,即不智能,也非合约。我看有人还说,如果有了智能合约,就可以跟老板签一份放区块链上,如果明年销售业绩提升30%,就加薪10%,由于区块链不能篡改,不能抵赖,所以老板必须得执行,说得有板有眼,不懂行的愣一看,好像还真是那么回事。 但仔细一想,问题就来了。首先,在区块链上如何证明你真的达到了30%业绩提升?即便真的达到老板耍赖如何执行? 也就是说,如果区块链真这么厉害,要法院和仲裁干什么。 人类社会真正的符合成本效益原则的是代理制度。之前有人说要用区块链改造注册会计师行业,我不知道他准备怎么设计,我猜想他思路大概是这样的,首先肯定搞去中心化,让所有会计师到链上来,然后一个新人要成为注册会计师就要所有会计师同意并记录在链上。 那我就请问了,我每天上班累死累活,为什么还要花时间去验证一个跟我无关的的人的专业能力?最优做法当然是组织一个委员会,让专门的人来负责,这不就是现在注册会师协会干的事儿吗?区块链的逻辑相当于什么事情都要拿出来公投,这个绝对是扯淡的。 当然这么说都有点抬举区块链了,区块链技术本身根本没有判断是非能力,如果这么高级的人工智能,靠一个无脑分布式记账就能实现的话,我们早就进入共产主义社会了。 虽然EOS等数字货币采用了超级节点,通过再中心化的方式提高效率,有点行业协会的意思,是对区块链原教旨主义的一种修正,但是依然无法突破区块链技术最本质的局限性。有人说,私有链和联盟链是区块链技术的未来,也是扯淡,因为区块链技术没有未来。如果有,说明他是包装成区块链的伪区块链技术。 区块链所涉及的所有底层技术,不管是分布式数据库技术,加密技术,还是点对点传输技术等,基本都是早已存在没什么秘密可言的技术。 比特币系统最重要的特性是封闭性和自洽性,他验证不了任何系统自身以外产生的信息的真实性。 所谓系统自身产生的信息,就是数据库数据的变动信息,有价值的基本上有且只有交易信息。所以说比特币最初不过是中本聪一种炫技的产物,来证明自己对几种技术的掌握,你看我多牛逼,设计出了一个像三体一样的系统。因此,数字货币很有可能是区块链从始至终唯一的杀手应用。 比特币和区块链概念从诞生到今天已经快10年了,很多人说区块链技术在爆发的前夜,但这个前夜好像是不是有点过长了啊朋友,跟三体里的长夜有一拼啊。都说区块链技术像是90年代初的互联网,可是90年代初的互联网在十年发展后,已经出现了一大批伟大的公司,阿里巴巴在99年都成立了,区块链怎么除了币还是币呢? 正规的数字货币未来发展的形式无外乎几种,要么就是论坛币形式,或者类似股票的权益凭证等。问题是论坛币和股票之前,本来也都电子化了,区块链来了到底改变了什么呢? 所有想把TOKEN和应用场景结合起来的人最后都很痛苦,最后他们会发现区块链技术就是脱裤子放屁,自己辛苦搞半天,干嘛不自己作为中心关心门来收钱?最后这些人都产生了价值的虚无感,最终精神崩溃,只能发币疯狂收割韭菜,一边嘴里还说着我是个好人之类的奇怪的话。 因此,之前币圈链圈还泾渭分明,互相瞧不起,但这两年链圈逐渐坐不住了,想着是不是趁着泡沫没彻底破灭之前赶快收割一波,不然可能什么都捞不着了。 前段时间和一个名校毕业的链圈朋友瞎聊天,他说他们“致力于用区块链技术解决数字版权保护问题”,我就问他一个问题,你们如何保证你链的版权所有权声明是真实的,万一盗版者抢先一步把数据放在链上怎么办。他说他们的解决方案是连入国家数字版权保护中心的数据库进行验证…… 所以说区块链技术就是个鸡肋,研究到最后都会落入效率与真实性的黑洞,很多人一头扎进链圈后才发现,真正意义上的区块链技术,其实什么都干不了。 -02- 不是蠢就是坏的区块链媒体 空气币和区块链的造富神话,让区块链自媒体也开始迎风乱扭。一群群根本不知道区块链为何物的妖魔鬼怪纷纷进驻区块链自媒体战场,开始大放厥词胡编乱造。 任何东西,但凡只要和区块,链,分,分布式,记账,加密,验证,可追溯等等这些个关键词沾到哪怕一点点,这些所谓的区块链媒体人就会像狗闻到了屎了一样疯狂地把区块链概念往上套。 这让我想起曾经一度也是热闹非凡的物联网,我曾经去看过江苏一家号称要改变世界的“物联网”企业,过去一看是生产路由器的,我黑人问号脸,对方解释说没有路由器万物怎么互联,我觉得他说得好有道理,竟无言以对。 好,下面让我们进入奇葩共赏析时间,来看看区城链媒体经常有哪些危言耸听的奇谈怪论 区块链(分布式记账)的典型应用是*?? 正如前面所说,真正意义上的区块链分布式记账,不光包括“记”这个动作,还包括分布式存储和共识机制等。而*诞生远远早于区块链这个词的出现,勉强算是“分布式编辑”吧,就被很多区块链媒体拿来强行充当区块链技术应用的典范。 其实事实恰恰相反,*恰恰是去中心化失败的典范,现在如果没有精英和专业人士的编辑和维护,*早就没法看了。 区块链会促进社会分工?? 罗振宇好像就说过类似的话,虽然罗振宇说过很多没有逻辑的话,但这句话绝对是最没逻辑思维的。很多区块链自媒体也常常用这句话来忽悠老百姓,说分工代表效率提高社会进步,而区块链“无疑”会促进分工,他们的理由仅仅是分工和分布式记账都共用一个“分”字,就强行把他们扯到一起。 实际情况恰恰相反,区块链是逆分工的,区块链精神是号召所有人积极地参与到他不擅长也不想掺合的事情里面去。 区块链不能像上帝一样许诺他的子民死后上天国,只能给他们许诺你们是六度人脉中的第一级,我可以赚后面五级人的钱,你处于金字塔的顶端。
-
彻底明白电脑原码、反码与补码的奥秘:打破旧有的误解
-
彻底明白原码、反码和补码的工作机制与内在逻辑
-
彻底明白电脑系统里的数字储存(三):原码、反码、补码与移码的详细解析