大家好,我是雜燴君。
上篇文章分享幾個實用的代碼片段(第二彈)我們分享了一段代碼:
有位讀者發(fā)問:(type * )0不是指向空地址嗎?(type*)0->member不是訪問非法內存了嗎?為什么不會出錯?
這篇文章我們就來解釋這個問題。
GET_MEMBER_SIZE分析
// 獲取結構體成員大小#define GET_MEMBER_SIZE(type, member) sizeof(((type*)0)->member)
雖然說這里用了 ((type*)0)->member ,看起來似乎有問題?訪問非法地址0地址?
其實不是的,注意這里用到了 sizeof操作符 。在C語言中,sizeof() 是一種內存容量度量函數,其字節(jié)數的計算是在 編譯階段 進行的。
C語言源程序經過編譯器進行詞法分析、語法分析等過程生成中間語言(object后綴的文件)編譯期間會生成一個字符表和靜態(tài)分配空間(如new static 全局變量)它們所需的內存空間可以計算出來放在鏈接庫后的可執(zhí)行文件中(虛擬內存即磁盤),在運行時將放在可執(zhí)行文件中的偏移量加載到內存的堆中同時將局部變量加載到棧中。
所有內存的開辟只有程序運行的時候才會在物理內存中開辟,即sizeof(((type*)0)->member)的操作不是等到程序運行期間計算的,而是在編譯階段就計算了,所以GET_MEMBER_SIZE宏定義并沒有訪問非法內存的操作。
進一步的,我們看看上面那個代碼實例中,結構體成員的字節(jié)數是不是在編譯階段計算出的,編譯出匯編文件:
gcc -S member_size.c -o member_size.s
這個匯編文件我們可能不全看懂所有指令,但大概知道如下三個指令的意思我們就大概可以知道這段匯編代碼的意思了。
- leaq:加載有效地址指令,即將有效地址復制到寄存器中。
- movl:數據傳送指令。
- call指令: 將當前的 IP 或 CS和IP 壓入棧中, 轉移(jmp)。
可以看到,從上到下,依次會把立即數1、1、2、4、3、12放到esi寄存器中。
為什么是這些立即數?
我們編譯運行一下我們的程序:
可以看到,正好就是我們需要求的結構體各成員的大小及結構體的大小,所以GET_MEMBER_SIZE(type, member)是在編譯階段起作用的。
其實,GET_MEMBER_SIZE宏定義中的0只是看做一個隨意給的地址,方便求成員的大小,如果寫為0容易引起誤解,不妨可以寫為一個任意值,比如修改為100,也是可以計算出各結構體成員的大小的。
最后,如果 ((type*)0)->member 在其它地方使用,會出現什么問題呢?自然就是這位讀者所理解的:操作非法地址。會引起段錯誤。比如添加如下一行代碼:
編譯運行:
段錯誤的定位方法可查閱往期文章:分享一種你可能不知道的bug定位方法、嵌入式段錯誤的3種調試方法匯總!
GET_MEMBER_OFFSET分析
// 獲取結構體成員偏移量#define GET_MEMBER_OFFSET(type, member) ((size_t)(&(((type*)0)->member)))
該宏返回的是以0地址為基準的地址,也不涉及訪問0地址的操作。
以上就是本次的分享。
期待你的三連支持!
私信回復【嵌入式書籍】,可獲取博主精心整理的嵌入式電子書一份