有感於 C 的字元陣列實在有夠難(只是你廢),所以決定每天搞懂一點關於它的性質或用法之類的,希望我能夠持之以恆。(2018 的我)
不,你不行。(2021 的我)
字串的基本使用
首先,C 的字串指的其實是字元陣列,而字元陣列的使用通常有以下幾種:
char s1[128] = "hello world";
char s2[] = "hello world";
另外,許多函式都會使用字元指標來操作字串:
char *s3 = s1; // 相當於 char *s3 = &s1[0]
而對於字元指標的宣告,C 有一個特別的地方,他可以直接讓字元指標類的字串有初始值:
char *s4 = "hello world";
像 s4 這種情況,是由編譯器在唯讀記憶體中放入 "hello world"
這個字元陣列,再讓 s4 這個指標指向它。因為是唯讀的記憶體,所以我們不能更改這個字串的內容,但可以更改 s4 指向的位址。
接著讓我們看看字串的輸出:
char s1[128] = "hello world";
printf("%s\n", s1); // hello world
char s2[] = "hello world";
printf("%s\n", s2); // hello world
char *s3 = s1;
printf("%s\n", s3); // hello world
char *s4 = "hello world";
printf("%s\n", s4); // hello world
關於 '\0'
字元
說到 C 的字串,絕對不能不提到 \0
這個字元,不要看它有兩個字(\
和 0
),其實它是一個單一的字元,就像換行字元 \n
一樣。
他的功用是:標記出字串的結束。看到我們上面輸出中的 s1 字串,我們明明就宣告了 128 個空間,但為什麼輸出結果只有 11 個字元?剩下的去哪了呢?正是被 \0
擋掉了。\0
明確的告訴程式:在我後面的都是垃圾,不要用,因此我們才能正確的輸出。
但是,我們在初始化的時候並沒有把 \0
寫出來啊?其實是編譯器會幫我們在字串結尾補上 \0
,所以基本上我們不用擔心忘記加上 \0
就會世界毀滅之類的(並不會)。 另外,\0
的 ASCII 值正好是 0。
我們可以利用 sizeof 來驗證 \0
的存在:
char str[] = "hello world";
printf("%d\n", sizeof str); // 12
可以看到,str 本身只有 11 個字元,但是佔用的空間是 12 個 byte,證實了有一個看不到的字元被放入了 str。
輸入字元陣列
如果要輸入字串的話,有以下幾種方法:
char s1[48];
scanf("%s", s1);
printf("%s\n", s1);
char s2[48];
char *s3 = s2; // 相當於 s3 = &s2[0];
scanf("%s", s3);
printf("%s\n", s3);
這裡要注意的有幾點:首先是輸入只有兩種選擇,至於為什麼,多看一下應該很容易理解;另外就是在對字串使用 scanf()
時,後面的引數不用加 &
,原因是:
s1
代表s1[0]
的位址- 因為
s3
指向s2[0]
,所以s3
本身儲存了s2[0]
的位址
最後要注意的是:scanf()
讀字串時遇到空格就會斷開,而如果有剩下的部分,會被留在緩衝區裡等待下一次的 scanf()
。另外,scanf()
也會在讀入的字串後補上 \0
。
如果想要連同空格一起吃入字串的話,可以這麼寫:
char str[128];
fgets(str, 128, stdin);
上述範例中的 fgets()
原本是要從檔案指標中讀取一行字串時使用的函式,一行指的是遇到 \n
或 EOF,讀取完後,會將 \n
(如果有遇到)和 \0
放入字串尾。
把 str 傳入第一個參數,就能把讀取結果存入 str 內,這裡在它的第三個參數傳入了 stdin
,這是標準輸入(通常是鍵盤)的指標,讓我們可以獲取鍵盤輸入的資料。而第二個參數控制的是讀取進來的字元數(包含 \0
),不能超過這個值。