Pointer는 C 언어에서 제공하는 가장 강력하고 인기있는 기능이지만, 초보 programmer들에게는 악몽과도 같은 것입니다. Pointer가 가리켜야 할 것을 가리키고 있지 않을 때 발생하는 혼란은 끝이 없습니다. (사실 포인터에서 발생하는 이러한 문제들은 대개 메모리 할당과 관련이 있습니다; Chapter 7 참고하기 바랍니다.)
(물론, 위의 목록이 전부는 아닙니다.)
char *p; *p = malloc(10);
p
이지, *p
가 아닙니다.
pointer가 어떤 곳을 가리키게 하려면 다음과 같이 그냥 pointer의
이름을 써야 합니다:
p = malloc(10);
그리고, 이 pointer가 가리키는 메모리 공간을 쓰기 위해서는
다음과 같이 `indirection' operator(연산자)인 *
를 사용합니다:
*p = 'H';
질문하신 것같은 실수는 자주 볼 수 있습니다. 왜냐하면 malloc을 지역 변수 선언의 초기값으로 썼다면 다음과 같이 하기 때문입니다:
char *p = malloc(10);
이 코드를 선언과 지정(assignment)으로 분리시키려면 *
를
제거해야 한다는 것을 기억하기 바랍니다.
요약하면, expression에서 p는 pointer이고, *p는 포인터가 가리키는 곳이라는 (이 경우 하나의 char) 것입니다.
덧붙여 질문 1.21, 7.1, 8.3도 참고하시기 바랍니다.
*p++
'은 `p
'를 증가시키는 것인가요, 아니면, `p
'가
가리키는 것을 증가시키는 것인가요?
*p++
는 *(p++)
와 같습니다; 일단 p를 증가시킨
다음, p
가 증가하기 전에 가리키던 곳의 값을 리턴합니다.
p
가 가리키는 것을 증가시키려면 (*p)++
을 (또는, 부작용이
일어나도 상관없는 경우, ++*p
를 써도 됩니다) 쓰면 됩니다.
int array[5], i, *ip; for (i = 0; i < 5; i++) array[i] = i; ip = array; printf("%d\n", *(ip + 3 * sizeof(int)));
printf("%d\n", *(ip + 3)); /* 또는 ip[3] - 질문 6.3 참고 */위 코드는 배열의 세번째 요소를 출력합니다. 이러한 코드에서 여러분이 직접 포인터에, 그 포인터가 가리키고 있는 대상의 크기만큼 곱해주지 않는 것이 정답입니다. 직접 곱해줄 경우, (위 코드에서는 sizeof(int)에 따라 다르지만 대개 array[6] 또는 array[12]) 존재하지 않는 범위에 접근하려고 할 것입니다.
char *
pointer) 어떤 int를 가리키고 있고,
현재, 이 포인터를 써서 다음 int를 가리키게 하려고 합니다. 왜 이 코드가
동작하지 않을까요?
((int *)p)++;
++
를 써서 증가될 수
없는) rvalue를 만들어 냅니다. (위와 같은 문장을 실수로 만들어냈던,
의도적으로 한 것이든, 또 설령 어떤 컴파일러가--오래된 컴파일러나, gcc의
확장 기능--위와 같은
코드를 원하는 대로 코드를 만들어낸다고 해도 이것은 표준 기능이
아닙니다.
따라서 다음과 같이 하는 것이 옳습니다:
p = (char *)((int *)p + 1);
(p
가 char *
이기 때문에)
또는 간단히 다음과 같이 할 수 있습니다:
p += sizeof(int);또는, (좀 더 복잡하게 직접 캐스팅을 하는) 다음과 같이 할 수도 있습니다.
int *ip = (int *)p; p = (char *)(ip + 1);될 수 있으면 캐스팅 대신 올바른 타입의 포인터를 쓰는 것이 바람직하다는 것을 염두에 두시기 바랍니다.
void f(ip) int *ip; { static int dummy = 5; ip = &dummy; }
그러나 다음과 같이 호출했을 때, 포인터의 값은 변경되지 않는군요.
int *ip; f(ip);
ip
는 변경되지 않습니다. 따라서
이 문제를 해결하려면 함수가 포인터의 주소를 받을 수 있도록
(즉, 인자가 포인터를 가리키는 포인터(pointer-to-pointer)) 만들거나,
함수가 포인터를 리턴하도록 해야 합니다.
void f(ipp) int *ipp; { static int dummy = 5; *ipp = &dummy; } ... int *ip; f(&ip);이 경우, 우리는 `pass by reference'를 흉내내는 효과를 얻습니다.
또 다른 방법은 포인터를 리턴하는 함수를 만드는 것입니다:
int *f() { static int dummy = 5; return &dummy; }질문 4.9와 4.11을 참고하기 바랍니다.
void **
포인터를 써도 되나요?
void f(void **); double *dp; f((void **)&dp);
C 언어에서 범용의 포인터를 가리키는 포인터
(pointer-to-pointer)는 존재하지 않습니다. void *
가 범용의
포인터로 쓰이는 이유는, 단지 다른 포인터 타입의 값에 대입하거나,
대입될 때, 자동으로 변환(conversion)이 일어나기 때문입니다;
이러한 변환은 void **에, void *가 아닌 다른 포인터
타입을 대입하거나, 대입될 때는 일어나지 않습니다.
여러분이 void **를 쓸 때 (예를 들어 void **에
* 연산을 써서 원래의 void *를 얻으려고 할 때),
컴파일러는 void *가, 다른 포인터 타입에서
변환되어서 온 것인지를 알 지 못합니다. 그래서 컴파일러는 말
그대로 void *로 인식합니다; 다른 형태의 implicit conversion을
전혀 수행할 수 없습니다.
즉, 여러분이 작업하고자 하는 void **는 반드시
어딘가에 실제로 있는, void * 값을 가리키고 있는 포인터이어야
합니다. (void **)&dp
와 같은 코드는,
강제로 캐스팅하므로 컴파일러가 경고를 출력하지 않지만,
이식성이 떨어지며, 때때로 원하는 결과를 얻지 못할 수 있습니다;
질문
13.9 참고. 만약 void **가 가리키고
있는 포인터가 void *가 아닐 경우, 그리고 그 포인터가
void *와는 다른 크기나 내부 표현을 (internal representation)
쓰고 있을 경우, 컴파일러는 그 값을
올바른 방법으로 얻지 못합니다.
질문에 주어진 코드를 동작하게 만들려면, void * 타입의 임시 변수를 만드는 것이 바람직합니다:
double *dp; void *vp = dp; f(&vp); dp = vp;변수 vp에 할당하고, 얻어내는 방식을 쓰면, 컴파일러가 (필요한 경우) 적당하게 conversion을 수행할 수 있습니다.
다시 말하지만, 이 모든 논쟁은, 포인터가 타입별로 크기나 표현 방식이 다르다는 가정 아래에서 이뤄진 것이며, 최근의 시스템에서는 이런 경우가 드뭅니다. void **에서 발생할 수 있는 문제를 좀 더 쉽게 알기 위해, 다음과 같은 상황을 생각해 봅시다. 일단 int와 double의 크기와 내부 표현 방식이 다르다고 하고, 다음과 같은 함수를 보기 바랍니다.
void *incme(double *p) { *p += 1; }그리고 나서 다음과 같은 코드를 실행합니다:
int i = 1; double d = i; incme(&d); i = d;당연히, i는 1만큼 증가합니다. (이 것은 앞에서 vp라는 임시 변수를 써서 설명했던 void ** 코드와 같은 방식을 쓴 것입니다.) 이와 달리, 아래와 같은 코드를 실행했다고 생각해 보기 바랍니다:
int i = 1; incme((double *)&i) /* WRONG */이 것은, 앞에서 동작하지 않는다고 말했던 (질문에 나온) 코드와 일치합니다.
extern int f(int *);
상수(constant)의 레퍼런스를 전달할 수 있나요? 다음과 같이 해 봤지만 잘 되질 않습니다:
f(&5);
int five = 5; f(&five);일반적으로, 어떤 간단한 값이 아닌, 어떤 값을 가리키는 포인터를 인자로 받는 함수들은 대개, 그 값을 변경하기 위해서 포인터를 인자로 받습니다. 따라서 상수에 대한 포인터를 전달하는 것은 좋은 방식이라고 말하기 곤란합니다. 만약 f가 정말로 int *를 인자로 받는 함수로 선언되어 있었다면, const int에 대한 포인터를 넘겨 주기 전에 먼저 그 함수가 어떤 일을 하는지 분석해 보아야 합니다. (주어진 함수가 int *가 아닌 const int *를 받는 것으로 선언되어 있었다면, 그 함수 내부에서 인자를 변경하지 않는다는 것이 보장되므로, 안전합니다.)
&
연산자를 써서 주소를 전달함으로써,
`pass by reference'를 흉내낼 수는 있습니다.
또한 배열을 인자로 전달할 경우에는 컴파일러가 자동으로 이 작업을
해 줍니다 (배열 대신 포인터를 사용하는 것은 질문
6.4를 참고하기
바랍니다). 어쨋든, C 언어는 진정한 `pass by reference'나
C++의 레퍼런스 파라메터(parameter)와 같은 것은 없습니다.
(그러나 매크로 함수들은 “pass by name”을 제공합니다.)
덧붙여 질문
4.8,
7.9,
12.27,
20.1도 참고하시기 바랍니다.
*
연산자를 쓸 경우 (그리고
우선 순위를 위해 괄호를 같이 쓸 경우) 진짜(real) 함수 호출로
변경됩니다:
int r, func(), (*fp)() = func; r = (*fp)();위 코드의 마지막 줄의 의미는 다음과 같습니다: fp는 함수를 가리키는 포인터이고, *fp는 이 함수를 뜻합니다. 그리고 뒤따르는 ()는 함수 호출에서 쓰이는 인자를 받는 인자 list입니다. 이때 연산자 우선 순위를 고려해서 *fp를 괄호로 둘러쌉니다. 이러면 완벽한 함수 호출이 됩니다.
다음과 같은 이론도 있습니다: 함수는 항상 포인터를 써서 불려지고, 수식에서 “진짜” 함수 이름은, 초기화에서 이루어지는 것처럼, 항상 함축적으로 포인터로 변환됩니다 (decay): 질문 1.34 참고. 이 이유는 실제로 pcc에서부터 널리 퍼졌고, ANSI 표준에 채택되었습니다. 따라서 fp가 위와 같이, 함수를 가리키는 포인터일 때, r = fp();는 올바른 표현입니다. (이렇게 쓰는 것은 전혀 혼동스러워 할 필요가 없습니다. 왜냐하면, 함수 이름 뒤에 인자 리스트가 따라올 때, 함수 호출 이외에 다르게 쓰이는 경우가 없기 때문입니다.) 직접 *을 써서 함수 호출하는 것은, 오래된 컴파일러로 이식이 필요한 경우에 많이 쓰입니다.
그렇지만, 모든 함수 포인터들은, 쓰이기 전에 원래의 타입으로 다시 변환된다는 가정 아래에서, 서로 다른 함수 포인터를 가리킬 수 있도록 보장되어 있습니다. 따라서 아무런 함수 포인터 타입을 하나 정해서 (일반적으로 int (*)()나 void (*)(). 즉 int나 void를 리턴하는 함수 포인터), 'generic'한 함수 포인터로 쓸 수 있습니다.
만약, 데이터와 함수를 구별하지 않는 포인터가 필요하다면, 그리고 이식성이 중요하다면, union을 써서, 한 멤버는 void *로, 다른 하나는 (앞에서 말한) 함수 포인터로 만들어 씁니다.
다시 말하면, 이러한 정수/포인터 변환은 선례가 많고 예전부터 지원되어 왔으나, 항상 시스템 의존적인 부분이므로, 이식성이 없습니다. 그리고 이런 변환에는 (비록 오래된 컴파일러들은 경고를 보여주지 않을 수 있지만) 항상 직접 캐스팅해 주어야 합니다.
ANSI/ISO C 표준은, C 언어가 널리 구현되기를 바라는 목적에서, 이러한 정수/포인터 변환 보장을 약화시켰습니다. 따라서 포인터를 정수로 변환하거나, 정수를 포인터로 변환하는 것은 항상 `implementation-defined'입니다. (질문 11.33 참고), 그리고 값의 변환없이 이 변환이 이루어진다는 것도 보장하지 않습니다. (즉, 변환 도중, 값이 바뀔 수도 있다는 말입니다.)
따라서 포인터를 정수로 변환하거나, 정수를 포인터로 변환하는 것은 좋은 습관이 아닙니다. 만약, 정수 또는 포인터를 저장해야 하는 타입이 필요하다면 union을 쓰기 바랍니다.
Seong-Kook Shin