程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> C++ >> C++入門知識 >> 浮點數的二進制表示

浮點數的二進制表示

編輯:C++入門知識

浮點數是屬於有理數中某特定子集的數的數字表示,在計算機中用以近似表示任意某個實數。具體的說,這個實數由一個整數或定點數即尾數)乘以某個基數計算機中通常是2)的整數次冪得到,這種表示方法類似於基數為10的科學記數法。

前幾天,我在讀一本C語言教材,有一道例題:

  1. #include <stdio.h>  
  2. void main(void){  
  3. int num=9; /* num是整型變量,設為9 */ 
  4. float* pFloat=&num; /* pFloat表示num的內存地址,但是設為浮點數 */ 
  5. printf("num的值為:%d\n",num); /* 顯示num的整型值 */ 
  6. printf("*pFloat的值為:%f\n",*pFloat); /* 顯示num的浮點值 */ 
  7. *pFloat=9.0; /* 將num的值改為浮點數 */ 
  8. printf("num的值為:%d\n",num); /* 顯示num的整型值 */ 
  9. printf("*pFloat的值為:%f\n",*pFloat); /* 顯示num的浮點值 */ 

運行結果如下:

  1. num的值為:9  
  2. *pFloat的值為:0.000000  
  3. num的值為:1091567616  
  4. *pFloat的值為:9.000000 

我很驚訝,num和*pFloat在內存中明明是同一個數,為什麼浮點數和整數的解讀結果會差別這麼大?

要理解這個結果,一定要搞懂浮點數在計算機內部的表示方法。我讀了一些資料,下面就是我的筆記。

1、在討論浮點數之前,先看一下整數在計算機內部是怎樣表示的。

  1. int num=9; 

上面這條命令,聲明了一個整數變量,類型為int,值為9二進制寫法為1001)。普通的32位計算機,用4個字節表示int變量,所以9就被保存為00000000 00000000 00000000 00001001,寫成16進制就是0x00000009。

那麼,我們的問題就簡化成:為什麼0x00000009還原成浮點數,就成了0.000000?

2、根據國際標准IEEE 754,任意一個二進制浮點數V可以表示成下面的形式:

V = (-1)^s×M×2^E

1)(-1)^s表示符號位,當s=0,V為正數;當s=1,V為負數。

2)M表示有效數字,大於等於1,小於2。

3)2^E表示指數位。

舉例來說,十進制的5.0,寫成二進制是101.0,相當於1.01×2^2。那麼,按照上面V的格式,可以得出s=0,M=1.01,E=2。

十進制的-5.0,寫成二進制是-101.0,相當於-1.01×2^2。那麼,s=1,M=1.01,E=2。

IEEE 754規定,對於32位的浮點數,最高的1位是符號位s,接著的8位是指數E,剩下的23位為有效數字M。

圖1 

對於64位的浮點數,最高的1位是符號位S,接著的11位是指數E,剩下的52位為有效數字M。

圖2

3、IEEE 754對有效數字M和指數E,還有一些特別規定。

前面說過,1≤M<2,也就是說,M可以寫成1.xxxxxx的形式,其中xxxxxx表示小數部分。IEEE 754規定,在計算機內部保存M時,默認這個數的第一位總是1,因此可以被捨去,只保存後面的xxxxxx部分。比如保存1.01的時候,只保存01,等到讀取的時候,再把第一位的1加上去。這樣做的目的,是節省1位有效數字。以32位浮點數為例,留給M只有23位,將第一位的1捨去以後,等於可以保存24位有效數字。

至於指數E,情況就比較復雜。

首先,E為一個無符號整數unsigned int)。這意味著,如果E為8位,它的取值范圍為0~255;如果E為11位,它的取值范圍為0~2047。但是,我們知道,科學計數法中的E是可以出現負數的,所以IEEE 754規定,E的真實值必須再減去一個中間數,對於8位的E,這個中間數是127;對於11位的E,這個中間數是1023。

比如,2^10的E是10,所以保存成32位浮點數時,必須保存成10+127=137,即10001001。

然後,指數E還可以再分成三種情況:

1)E不全為0或不全為1。這時,浮點數就采用上面的規則表示,即指數E的計算值減去127或1023),得到真實值,再將有效數字M前加上第一位的1。

2)E全為0。這時,浮點數的指數E等於1-127或者1-1023),有效數字M不再加上第一位的1,而是還原為0.xxxxxx的小數。這樣做是為了表示±0,以及接近於0的很小的數字。

3)E全為1。這時,如果有效數字M全為0,表示±無窮大正負取決於符號位s);如果有效數字M不全為0,表示這個數不是一個數NaN)。

4、好了,關於浮點數的表示規則,就說到這裡。

下面,讓我們回到一開始的問題:為什麼0x00000009還原成浮點數,就成了0.000000?

首先,將0x00000009拆分,得到第一位符號位s=0,後面8位的指數E=00000000,最後23位的有效數字M=000 0000 0000 0000 0000 1001。

由於指數E全為0,所以符合上一節的第二種情況。因此,浮點數V就寫成:

V=(-1)^0×0.00000000000000000001001×2^(-126)=1.001×2^(-146)

顯然,V是一個很小的接近於0的正數,所以用十進制小數表示就是0.000000。

5、再看例題的第二部分。

請問浮點數9.0,如何用二進制表示?還原成十進制又是多少?

首先,浮點數9.0等於二進制的1001.0,即1.001×2^3。

那麼,第一位的符號位s=0,有效數字M等於001後面再加20個0,湊滿23位,指數E等於3+127=130,即10000010。

所以,寫成二進制形式,應該是s+E+M,即0 10000010 001 0000 0000 0000 0000 0000。這個32位的二進制數,還原成十進制,正是1091567616。

原文地址:http://www.ruanyifeng.com/blog/2010/06/ieee_floating-point_representation.html

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved