程式師世界 >> 編程語言 >> C語言 >> 關於C語言 >> C語言可變參函數的實現

C語言可變參函數的實現

編輯：關於C語言

C語言可變參函數的實現

1 C語言中函數調用的原理

函數是大多數編程語言都實現的編程要素，調用函數的實現原理就是：執行跳轉+參數傳遞。對於執行跳轉，所有的CPU都直接提供跳轉指令；對於參數傳遞，CPU會提供多種方式，最常見的方式就是利用棧來傳遞參數。C語言標准實現了函數調用，但是卻沒有限定實現細節，不同的C編譯器廠商可以根據底層硬件環境自行確定實現方式。

函數調用的一般實現原理，請參考我的博文 C語言中利用setjmp和longjmp做異常處理中的第一段。

2 可變參實現思路

2.1 如何取得後續實參地址

我們以X86架構上的VC++編譯器為例進行舉例說明。例子代碼如下。

void f(int x, int y, int z)
{
    printf("%p, %p, %p\n", &x, &y, &z);
}
int main()
{
    f(100, 200, 300);
    return 0;
}

可能的執行結果：

00FFF674, 00FFF678, 00FFF67C

VC++中函數的參數是通過堆棧傳遞的，參數按照從右向左的順序入棧。調用f時參數在堆棧中的情況如下圖所示：
這裡寫圖片描述

可見，我們只要知道x的地址，就可以推算出y,z的地址，從而通過其地址取得參數y,z的值，而不用其參數名稱取值。如下代碼所示。

void f(int x, int y, int z)
{
    char* px = (char*)&x;
    char *py = px + sizeof(x);
    char *pz = py + sizeof(int);

    printf("x=%d, y=%d, z=%d\n", x, *(int*)py, *(int*)pz);
}
int main()
{
    f(100, 200, 300);
    return 0;
}

可見根據函數的第一個參數，以及後續參數的類型，就可以根據偏移量計算出後續參數的地址，從而取得後續參數值。
於是可以把上述代碼改寫成可變參數的形式。

void f(int x, ...)
{
    char* px = (char*)&x;
    char *py = px + sizeof(x);
    char *pz = py + sizeof(int);

    printf("x=%d, y=%d, z=%d\n", x, *(int*)py, *(int*)pz);
}
int main()
{
    f(100, 200, 300);
    return 0;
}

2.2 如何標識後續參數個數和類型

雖然寫成了可變參形式，但是函數如何判斷後續實參的個數和類型呢？這就需要在固定參數中攜帶這些信息，如printf(char*, …)使用的格式化字符串方法，通過第一個參數來攜帶後續參數個數以及類型的信息。我們實現一個簡單點的，只能識別%s,%d,%f三種標志。

void f(char* fmt, ...)
{
    char* p0 = (char*)&fmt;
    char* ap = p0 + sizeof(fmt);

    char* p = fmt;
    while (*p) {
        if (*p == '%' && *(p+1) == 'd') {
            printf("參數類型為int,值為 %d\n", *((int*)ap));
            ap += sizeof(int);
        }
        else if (*p == '%' && *(p+1) == 'f') {
            printf("參數類型為double,值為 %f\n", *((double*)ap));
            ap += sizeof(double);
        }
        else if (*p == '%' && *(p+1) == 's') {
            printf("參數類型為char*,值為 %s\n", *((char**)ap));
            ap += sizeof(char*);
        }
        p++;
    }

}
int main()
{
    f("%d,%f,%s", 100, 1.23, "hello world");
    return 0;
}

輸出：

參數類型為int,值為 100
參數類型為double,值為 1.230000
參數類型為char*,值為 hello world

為簡化分析參數代碼，定義一些宏來簡化，如下。

#define va_list char*   /* 可變參數地址 */
#define va_start(ap, x) ap=(char*)&x+sizeof(x) /* 初始化指針指向第一個可變參數 */
#define va_arg(ap, t)   (ap+=sizeof(t),*((t*)(ap-sizeof(t)))) /* 取得參數值，同時移動指針指向後續參數 */
#define va_end(ap)  ap=0 /* 結束參數處理 */

void f(char* fmt, ...)
{
    va_list ap;
    va_start(ap, fmt);

    char* p = fmt;
    while (*p) {
        if (*p == '%' && *(p+1) == 'd') {
            printf("參數類型為int,值為 %d\n", va_arg(ap, int));
        }
        else if (*p == '%' && *(p+1) == 'f') {
            printf("參數類型為double,值為 %f\n", va_arg(ap, double));
        }
        else if (*p == '%' && *(p+1) == 's') {
            printf("參數類型為char*,值為 %s\n", va_arg(ap, char*));
        }
        p++;
    }
    va_end(ap);
}
int main()
{
    f("%d,%f,%s,%d", 100, 1.23, "hello world", 200);
    return 0;
}

3 正確的變參函數實現方法

上面的例子中，我們沒有使用任何庫函數就輕松實現了可變參數函數。別高興太早，上述代碼在X86平台的VC++編譯器下可以順利編譯、正確執行。但是在gcc編譯後，運行卻是錯誤的。可見GCC對於可變參數的實參傳遞實現與VC++並不相同。

gcc下編譯運行：
[[email protected] ~]$ ./a.out
參數類型為int,值為 0
參數類型為double,值為 0.000000
Segmentation fault

可見，上述代碼是不可移植的。為了在使得可變參函數能夠跨平台、跨編譯器正確執行，必須使用C標准頭文件stdarg.h中定義的宏，而不是我們自己定義的。（這些宏的名字和作用與我們自己定義的宏完全相同，這絕不是巧合！）每個不同的C編譯器所附帶的stdarg.h文件中對這些宏的定義都不相同。再次重申一下這幾個宏的使用范式：

va_list ap;
va_start(ap, 固定參數名); /* 根據最後一個固定參數初始化 */
可變參數1類型 x1 = va_arg(ap, 可變參數類型1); /* 根據參數類型，取得第一個可變參數值 */
可變參數2類型 x2 = va_arg(ap, 可變參數類型2); /* 根據參數類型，取得第二個可變參數值 */
...
va_end(ap);     /* 結束 */

這次，把我們自己的宏定義去掉，換成#include

#include 
#include 
void f(char* fmt, ...)
{
    va_list ap;
    va_start(ap, fmt);

    char* p = fmt;
    while (*p) {
        if (*p == '%' && *(p+1) == 'd') {
            printf("參數類型為int,值為 %d\n", va_arg(ap, int));
        }
        else if (*p == '%' && *(p+1) == 'f') {
            printf("參數類型為double,值為 %f\n", va_arg(ap, double));
        }
        else if (*p == '%' && *(p+1) == 's') {
            printf("參數類型為char*,值為 %s\n", va_arg(ap, char*));
        }
        p++;
    }
    va_end(ap);

}
int main()
{
    f("%d,%f,%s,%d", 100, 1.23, "hello world", 200);
    return 0;
}

代碼在VC++和GCC下均可以正確執行了。

4 幾個需要注意的問題

4.1 va_end(ap); 必須不能省略

也許在有些編譯器環境中，va_end(ap);確實沒有什麼作用，但是在其他編譯器中卻可能涉及到內存的回收，切不可省略。

4.2 可變參數的默認類型提升

《C語言程序設計》中提到：

在沒有函數原型的情況下，char與short類型都將被轉換為int類型，float類型將被轉換為double類型。實際上，用...標識的可變參數總是會執行這種類型提升。

引用《C陷阱與缺陷》裡的話：

**va_arg宏的第2個參數不能被指定為char、short或者float類型**。
因為char和short類型的參數會被轉換為int類型，而float類型的參數會被轉換為double類型 ……
例如，這樣寫肯定是不對的：
c = va_arg(ap,char);
因為我們無法傳遞一個char類型參數，如果傳遞了，它將會被自動轉化為int類型。上面的式子應該寫成：
c = va_arg(ap,int);

4.3 編譯器無法進行參數類型檢查

對於可變參數，編譯器無法進行任何檢查，只能靠調用者的自覺來保證正確。

4.4 可變參數函數必須提供一個或更多的固定參數

可變參數必須靠固定參數來定位，所以函數中至少需要提供固定參數，f(固定參數，…)。
當然，也可以提供更多的固定參數，如f(固定參數1，固定參數2，…)。注意的是，當提供2個或以上固定參數時，va_start(ap, x）宏中的x必須是最後一個固定參數的名字（也就是緊鄰可變參數的那個固定參數）。

5 C的可變參函數與C++的重載函數

C++的函數重載特性，允許重復使用相同的名稱來定義函數，只要同名函數的參數（類型或數量）不同。例如，

void f(int x);
void f(int x, double d);
void f(char* s);

雖然源代碼中函數名字相同，其實編譯器處理後生成的是三個具有不同函數名的函數（名字改編name mangling）。雖然在使用上有些類似之處，但這顯然與C的可變參數函數完全不是一個概念。

上一頁:C實現頭插法和尾插法來構建鏈表
下一頁:C語言實現雙向非循環鏈表（不帶頭結點）

關於C語言

C編譯器的設計

前言：這個是我們這學期編譯課所要求的大程，我做的是一個C－的

小蜜蜂--大數問題，小蜜蜂--大數

小蜜蜂--大數問題，小蜜蜂--大數解題源代碼： 1 #

用C#2.0實現網絡蜘蛛(WebSpider)(10)

八、其他部分的實現到現在為止，網絡蜘蛛所有核心代碼都已經完

C文件I/O超詳細教程，o超

C文件I/O超詳細教程，o超本文主要參考了C Primer

淺談C#使用TCP/IP與ModBus進行通訊

ClIEnt與Server之間有兩種通訊方式：一種是TCP

C#中只接受數字輸入的控件(5)

四、使用NumericUpDownC#代碼using Sy

熱門圖文

再談“無標題欄窗口的移動技巧” java在Linux下的web應用(一) PHP－－進行模塊化設計 C++初學者---根據輸入的任何一個正整數，輸出可能被表示的連續正整數，---整數讓窗體飄動起來-C＃中Timer組件用法 VS初始化命令 ASP.NET常用技巧代碼分析-小白求懂的幫忙講講用ASP開發網頁需要牢記的注意事項

欄目導航

C C++VC VC.net 關於C語言