C++虛函數(shù)和多態(tài)學(xué)習(xí)筆記
1、什么是虛函數(shù)和多態(tài)
虛函數(shù)是在類中被聲明為virtual的成員函數(shù),當(dāng)編譯器看到通過指針或引用調(diào)用此類函數(shù)時,對其執(zhí)行晚綁定,即通過指針(或引用)指向的類的類型信息來決定該函數(shù)是哪個類的。通常此類指針或引用都聲明為基類的,它可以指向基類或派生類的對象。
多態(tài)指同一個方法根據(jù)其所屬的不同對象可以有不同的行為(根據(jù)自己理解,不知這么說是否嚴(yán)謹(jǐn))。
舉個例子說明虛函數(shù)、多態(tài)、早綁定和晚綁定:
李氏兩兄妹(哥哥和妹妹)參加姓氏運動會(不同姓氏組隊參加),哥哥男子項目比賽,妹妹參加女子項目比賽,開幕式有一個參賽隊伍代表發(fā)言儀式,兄妹倆都想去露露臉,可只能一人去,最終他們決定到時抓鬮決定,而組委會也不反對,它才不關(guān)心是哥哥還是妹妹來發(fā)言,只要派一個姓李的來說兩句話就行。運動會如期舉行,妹妹抓鬮獲得代表李家發(fā)言的機會,哥哥參加了男子項目比賽,妹妹參加了女子項目比賽。比賽結(jié)果就不是我們關(guān)心的了。
現(xiàn)在讓我們來做個類比(只討論與運動會相關(guān)的話題):
(1)類的設(shè)計:
李氏兄妹屬于李氏家族,李氏是基類(這里還是抽象的純基類),李氏又派生出兩個子類(李氏男和李氏女),李氏男會所有男子項目的比賽(李氏男的成員函數(shù)),李氏女會所有女子項目的比賽(李氏女的成員函數(shù))。姓李的人都會發(fā)言(基類虛函數(shù)),李氏男和李氏女繼承自李氏當(dāng)然也會發(fā)言,只是男女說話聲音不一樣,內(nèi)容也會又差異,給人感覺不同(李氏男和李氏女分別重新定義發(fā)言這個虛函數(shù))。李氏兩兄妹就是李氏男和李氏女兩個類的實體。
(2)程序設(shè)計:
李氏兄妹填寫參賽報名表。
(3)編譯:
李氏兄妹的參賽報名表被上交給組委會(編譯器),哥哥和妹妹分別參加男子和女子的比賽,組委會一看就明白了(早綁定),只是發(fā)言人選不明確,組委會看到報名表上寫的是“李家代表”(基類指針),組委會不能確定到底是誰,就做了個備注:如果是男的,就是哥哥李某某;如果是女的,就是妹妹李某某(晚綁定)。組委會做好其它準(zhǔn)備工作后,就等運動會開始了(編譯完畢)。
(4)程序運行:
運動會開始了(程序開始運行),開幕式上我們聽到了李家妹妹的發(fā)言,如果是哥哥運氣好抓鬮勝出,我們將聽到哥哥的發(fā)言(多態(tài))。然后就是看到兄妹倆參加比賽了。。。
但愿這個比喻說清楚了虛函數(shù)、多態(tài)、早綁定和晚綁定的概念和它們之間的關(guān)系。再說一下,早綁定指編譯器在編譯期間即知道對象的具體類型并確定此對象調(diào)用成員函數(shù)的確切地址;而晚綁定是根據(jù)指針?biāo)笇ο蟮念愋托畔⒌玫筋惖奶摵瘮?shù)表指針進(jìn)而確定調(diào)用成員函數(shù)的確切地址。
2、揭密晚綁定的秘密
編譯器到底做了什么實現(xiàn)的虛函數(shù)的晚綁定呢?我們來探個究竟。
編譯器對每個包含虛函數(shù)的類創(chuàng)建一個表(稱為V TA B L E)。在V TA B L E中,編譯器放置特定類的虛函數(shù)地址。在每個帶有虛函數(shù)的類中,編譯器秘密地置一指針,稱為v p o i n t e r(縮寫為V P T R),指向這個對象的V TA B L E。通過基類指針做虛函數(shù)調(diào)用時(也就是做多態(tài)調(diào)用時),編譯器靜態(tài)地插入取得這個V P T R,并在V TA B L E表中查找函數(shù)地址的代碼,這樣就能調(diào)用正確的函數(shù)使晚捆綁發(fā)生。為每個類設(shè)置V TA B L E、初始化V P T R、為虛函數(shù)調(diào)用插入代碼,所有這些都是自動發(fā)生的,所以我們不必?fù)?dān)心這些。利用虛函數(shù),這個對象的合適的函數(shù)就能被調(diào)用,哪怕在編譯器還不知道這個對象的特定類型的情況下。(《C++編程思想》)
在任何類中不存在顯示的類型信息,可對象中必須存放類信息,否則類型不可能在運行時建立。那這個類信息是什么呢?我們來看下面幾個類:
class no_virtual
{
public:
void fun1() const{}
int fun2() const { return a; }
private:
int a;
}
class one_virtual
{
public:
virtual void fun1() const{}
int fun2() const { return a; }
private:
int a;
}
class two_virtual
{
public:
virtual void fun1() const{}
virtual int fun2() const { return a; }
private:
int a;
}
以上三個類中:
no_virtual沒有虛函數(shù),sizeof(no_virtual)=4,類no_virtual的長度就是其成員變量整型a的長度;
one_virtual有一個虛函數(shù),sizeof(one_virtual)=8;
two_virtual有兩個虛函數(shù),sizeof(two_virtual)=8; 有一個虛函數(shù)和兩個虛函數(shù)的類的長度沒有區(qū)別,其實它們的長度就是no_virtual的長度加一個void指針的長度,它反映出,如果有一個或多個虛函數(shù),編譯器在這個結(jié)構(gòu)中插入一個指針( V P T R)。在one_virtual 和two_virtual之間沒有區(qū)別。這是因為V P T R指向一個存放地址的表,只需要一個指針,因為所有虛函數(shù)地址都包含在這個表中。
這個VPTR就可以看作類的類型信息。
那我們來看看編譯器是怎么建立VPTR指向的這個虛函數(shù)表的。先看下面兩個類:
class base
{
public:
void bfun(){}
virtual void vfun1(){}
virtual int vfun2(){}
private:
int a;
}
class derived : public base
{
public:
void dfun(){}
virtual void vfun1(){}
virtual int vfun3(){}
private:
int b;
}
兩個類VPTR指向的虛函數(shù)表(VTABLE)分別如下:
base類
——————
VPTR——> |&base::vfun1 |
——————
|&base::vfun2 |
——————
derived類
———————
VPTR——> |&derived::vfun1 |
———————
|&base::vfun2 |
———————
|&derived::vfun3 |
———————
每當(dāng)創(chuàng)建一個包含有虛函數(shù)的類或從包含有虛函數(shù)的類派生一個類時,編譯器就為這個類創(chuàng)建一個VTABLE,如上圖所示。在這個表中,編譯器放置了在這個類中或在它的基類中所有已聲明為virtual的函數(shù)的地址。如果在這個派生類中沒有對在基類中聲明為virtual的函數(shù)進(jìn)行重新定義,編譯器就使用基類的這個虛函數(shù)地址。(在derived的VTABLE中,vfun2的入口就是這種情況。)然后編譯器在這個類中放置VPTR。當(dāng)使用簡單繼承時,對于每個對象只有一個VPTR。VPTR必須被初始化為指向相應(yīng)的VTABLE,這在構(gòu)造函數(shù)中發(fā)生。
一旦VPTR被初始化為指向相應(yīng)的VTABLE,對象就"知道"它自己是什么類型。但只有當(dāng)虛函數(shù)被調(diào)用時這種自我認(rèn)知才有用。
VPTR常常位于對象的開頭,編譯器能很容易地取到VPTR的值,從而確定VTABLE的位置。VPTR總指向VTABLE的開始地址,所有基類和它的子類的虛函數(shù)地址(子類自己定義的虛函數(shù)除外)在VTABLE中存儲的位置總是相同的,如上面base類和derived類的VTABLE中vfun1和vfun2的地址總是按相同的順序存儲。編譯器知道vfun1位于VPTR處,vfun2位于VPTR+1處,因此在用基類指針調(diào)用虛函數(shù)時,編譯器首先獲取指針指向?qū)ο蟮念愋托畔ⅲ╒PTR),然后就去調(diào)用虛函數(shù)。如一個base類指針pBase指向了一個derived對象,那pBase->vfun2()被編譯器翻譯為 VPTR+1 的調(diào)用,因為虛函數(shù)vfun2的地址在VTABLE中位于索引為1的位置上。同理,pBase->vfun3()被編譯器翻譯為 VPTR+2的調(diào)用。這就是所謂的晚綁定。
我們來看一下虛函數(shù)調(diào)用的匯編代碼,以加深理解。
void test(base* pBase)
{
pBase->vfun2();
}
int main(int argc, char* argv[])
{
derived td;
test(&td);
return 0;
}
derived td;編譯生成的匯編代碼如下:
mov DWORD PTR _td$[esp+24], OFFSET FLAT:??_7derived@@6B@ ; derived::`vftable'
由編譯器的注釋可知,此時PTR _td$[esp+24]中存儲的就是derived類的VTABLE地址。
test(&td);編譯生成的匯編代碼如下:
lea eax, DWORD PTR _td$[esp+24]
mov DWORD PTR __$EHRec$[esp+32], 0
push eax
call test@@YAXPAVbase@@@Z ; test
調(diào)用test函數(shù)時完成了如下工作:取對象td的地址,將其壓棧,然后調(diào)用test。
pBase->vfun2();編譯生成的匯編代碼如下:
mov ecx, DWORD PTR _pBase$[esp-4]
mov eax, DWORD PTR [ecx]
jmp DWORD PTR [eax+4]
首先從棧中取出pBase指針指向的對象地址賦給ecx,然后取對象開頭的指針變量中的地址賦給eax,此時eax的值即為VPTR的值,也就是VTABLE的地址。最后就是調(diào)用虛函數(shù)了,由于vfun2位于VTABLE的第二個位置,相當(dāng)于 VPTR+1,每個函數(shù)指針是4個字節(jié)長,所以最后的調(diào)用被編譯器翻譯為 jmp DWORD PTR [eax+4]。如果是調(diào)用pBase->vfun1(),這句就該被編譯為jmp DWORD PTR [eax]。
評論