C언어 왕초보 질문이 왜 컴파일 및 실행이 가능한지 알아보자

코딩 채널

알림 알림 중 알림 취소

구독자 4410명 알림수신 85명 @은월영

프로그래밍 및 코딩 채널

C/C++ C언어 왕초보 질문이 왜 컴파일 및 실행이 가능한지 알아보자

nano

추천 13 비추천 0 댓글 25 조회수 959 작성일 2023-09-14 15:46:42 수정일 2023-09-15 03:25:52

https://arca.live/b/programmer/86267908

원글: https://arca.live/b/programmer/86258136?p=1

1. a = "ddd"

우선 좌변은 char 타입(정수), 우변은 char[4]인 배열 타입

배열은 값으로 평가될때 포인터로 붕괴(decay)함

따라서 포인터를 정수에 대입하려는 식

그러면 (x86_64의 경우) 포인터가 크기가 8인 정수로 변환되고, 이거를 크기가 1인 정수에 대입하므로 "일반적으로" LSB쪽의 1바이트만 잘려서 대입 됨

즉 a의 값은 "ddd" 문자열이 저장된 "주소"의 하위 1바이트 ('d'가 아니라 """주소""")

2. printf("%s", a)

우선 a가 가변 인자 함수로 넘어갈 때, 기본적으로 int보다 작은 타입들은 int로 캐스팅되어 들어감

따라서 a 값과 같은 값을 가지는 int형 정수로 넘어감

%s는 char *를 받아서 문자열을 출력해주는데, 이 때 전달된 포인터가 NULL일 경우 (null)을 출력해주는 C Library가 있음. 대표적으로 glibc

즉 우연인지 필연인지 "ddd"가 저장된 주소의 하위 1바이트가 0x00이라서 a의 값이 0이었고, 이를 NULL로 인식한 printf가 (null)을 출력해주는 것

과연 정말인지 확인해보자

환경은 mingw-w64-ucrt-x86_64, 컴파일러는 gcc

위 코드는 "ddd" 문자열이 저장되는 주소와 a에 대입된 값을 알아보기 위해 ptr과 a의 값을 각각 포인터와 정수형으로 출력하였다

얘를 컴파일&실행 해보면

보시다시피 "ddd"가 저장된 주소는 0x0000_7FF7_E25D_40'00'이고 따옴표 친 최하위 바이트 0x00이 a에 저장된 것을 볼 수 있다.

그렇다면 만약 문자열의 주소가 0x00으로 끝나지 않는다면 어떤 일이 벌어질까? 그리고 최상위 바이트도 00인데 정말 최하위 바이트가 저장되는걸까?

문자열의 시작주소 대신 시작주소 + 1을 대입해보자

그러면 보다시피 주소가 0x0000_7FF7_4802_40'01'이 되고 최하위 바이트인 0x01이 a에 저장된다.

그런데 주소값 0x0000_0000_0000_0001은 NULL도 아니고(즉 "(null)"을 출력하려 하지 않고) 읽기 가능한 메모리 영역도 아니기 때문에 읽으려는 시도가 실패하고 segmentaion fault가 발생한다.

호기심 해결!

지적환영 태클환영 오타 및 맞춤법 지적도 대환영

*) long -> char 같은 더 작은 타입으로의 캐스팅은 unsigned냐 signed냐에 따라 표준에 써있는 내용이 다르다.

unsigned일 경우에는 직관적으로 하위 바이트를 잘라 넣고(== 2의 거듭제곱으로 modular 연산한 결과), signed의 경우에는 implementation defined, 즉 구현에 따라 동작이 바뀔 수 있다. 이 경우에는 그냥 unsigned랑 동일하게 하위 바이트를 잘라 넣는 것 처럼 보이지만 이것에 의존하는 코드는 좋지 않다.

undefined behavior와 implementation defined는 비슷해 보이지만 다르다. UB는 동작이 표준에 정의되어있지 않고 구현에서 문서화 될 필요가 없으며, impl def는 동작을 표준에서 정하지는 않지만 구현에 따라 일관된 동작을 하며 문서화되어야한다.

즉 사용이 금기시되는 UB와 달리 long -> char같은 구현 정의 동작은 구현마다 다를 수는 있지만 문서화는 되어있으며, 주의깊게 사용하여야한다.

**) int와 signed int는 완전히 동일한 타입이지만 char는 signed char 또는 unsigned char과 동등한 타입으로 정의되어있으며, 둘 중 어느 하나와 동등하더라도 서로 같은 타입은 아니다.

즉 int는 signedness에 따라 int == signed int, unsigned int의 두가지 타입이 있지만 char는 char, signed char, unsigned char의 세가지 타입이 별개로 존재한다. short, long, long long은 int와 마찬가지

***) clang에서는 1번을 경고가 아닌 에러로 처리하므로 -Wno-int-conversion같은 옵션을 줘서 에러를 끄거나, 경고로 바꿔야 컴파일에 성공함.

링크: https://reviews.llvm.org/D129881

수정) a가 함수로 넘어갈 때 -> a가 '가변 인자' 함수로 넘어갈 때

댓글 [25] 글쓰기

ㅇㅇ

2023-09-14 15:49:45 답글

내 뇌는 그냥 하드리셋당했네.....

펼쳐보기▼

primitive

2023-09-14 15:52:16 답글

골때리네

펼쳐보기▼

primitive

2023-09-14 15:54:45 답글

이래서 언어는 컴파일에러를 최대한 많이내주는게 의무읾,,,

펼쳐보기▼

perl

2023-09-14 15:53:45 답글

오 2번 vararg가 아니라 그냥 함수 호출에도 적용됨?
예전에 어디서 읽었던대로면 vararg는 int랑 double로 올린다고 봤던 것 같은데 그냥 일반 함수 호출에도 그랬나

펼쳐보기▼

nano

2023-09-14 16:03:21 답글

기본적으로 호출자는 피호출 함수의 prototype을 몰라도 동일한 코드를 생성함. 그러니까 가변인자 함수랑 일반 함수랑 호출자는 구분하지 않는다는 소리

펼쳐보기▼

perl

2023-09-14 16:06:35 답글

그런가 그거 prototype을 모르면 int로 기본 추론하는거고 알고 있으면 다르게 인식하는걸로 알고있었는데
단지 메모리를 쪼갤 수 있는 단위가 레지스터 크기니까 그냥 하위 바이트만 쓰는 거 아니었음?

foo(char x) {
  printf("%d", sizeof(x));
}
main() {
  foo(123);
}

이거 돌리면 일단은 1로 나오긴 하는데 그럼 일단 1바이트라고 인식하고 있기는 한거 아닌가 헷갈리네

펼쳐보기▼

perl

2023-09-14 16:11:34 답글

foo(float x) {
  printf("%d", *((int*)&x) == 0x3f000000);
}
main() {
  foo(0.5);
}

일단 부동소수점을 프로토타입 아는 상태에서 던져주면 float x일때랑 double x일때가 다른데 정수에 대해서만 그렇게 작동하는건가?

펼쳐보기▼

nano

2023-09-14 16:15:31 답글

https://en.cppreference.com/w/c/language/conversion#Default_argument_promotions
찾아보니까 int, double promotion은 프로토타입이 없는 함수나 가변 인자 함수에서만 일어나는거라서 내가 잘못 알고 있었네

cppreference.com

Implicit conversions - cppreference.com

찾아보니까 int, double promotion은 프로토타입이 없는 함수나 가변 인자 함수에서만 일어나는거라서 내가 잘못 알고 있었네

펼쳐보기▼

perl

2023-09-14 16:16:48 답글

안그래도 integer promotion이 일어나는 규칙같은거 예전에 대학교 1학년때 시험문제에 나왔던 기억은 났는데 연산이 아니라 일반 함수 호출에서도 일어나나 찾아보고있었음

펼쳐보기▼

nano

2023-09-14 16:18:19 답글

다만 이게 위에 char x의 sizeof(x)가 1인거랑은 조금 다른 얘기인게 sizeof(x)는 해당 스코프에서 x의 타입이 char이라서 그런거고 int 프로모션이랑은 관계 없는거 같네

펼쳐보기▼

perl

2023-09-14 16:19:34 답글

하긴 이거 제대로 테스트해볼거면 4바이트 정수 위쪽에 값 채우고 char*로 캐스팅해서 던져주고 값이 일치하는지 확인하는 식으로 갔어야했을것같음

펼쳐보기▼

perl

2023-09-14 16:19:54 답글

만약 실제로 promotion이 일어났다면 위쪽 바이트가 0으로 지워졌을테니까

펼쳐보기▼

nano

2023-09-14 16:22:13 답글

포인터로 캐스팅해서 던지면 인자 타입이 아예 포인터라서 안될거 같고 foo(signed char c) 이런 함수에 foo(-1) 이렇게 던져주고 sign extension 일어났는지 보면 될듯

펼쳐보기▼

perl

2023-09-14 16:22:55 답글

그러니까 int x 매개변수에 *(char*)0x12345678 이런거 주고 00000078인지 12345678인지 확인해야했을거라는 소리였는데 아무튼

펼쳐보기▼

perl

2023-09-14 16:23:15 답글

아무튼 sizeof로는 확실하지 않았을듯 ㅇㅇ

펼쳐보기▼

nano

2023-09-14 16:23:58 답글

이거는 0x12345678 주소의 값을 읽으려고 시도하기때문에 segfault 뜰 듯

펼쳐보기▼

perl

2023-09-14 16:24:31 답글

아 그렇네 int val = 0x12345678;하고 *(char*)&val이 맞지 아래 float 코드처럼

펼쳐보기▼

nano

2023-09-14 16:27:41 답글

얘는 리틀 엔디안에서는 무조건 0x78 뜰 거 같은게 *(char*)&val 이 값이 그냥 0x78이라서 promotion 되든 말든 무조건 0x78일거야

펼쳐보기▼

perl

2023-09-14 16:29:21 답글

이걸 어떻게 테스트해야되나 생각해보니 C에 값을 그대로 넘길 방법이 딱히 떠오르지가 않아서 어쩔줄을 모르겠네
어셈 까서 instruction이 몇바이트짜리인지 보는것밖에 없으려나

펼쳐보기▼

nano

2023-09-14 16:36:00 답글

*수정됨

foo(signed char x)를 foo(0x12345678) 이렇게 호출하고 foo 진입점에서 rdi 레지스터 값 보니까 0x78이야. promotion 안하고 signed char로 캐스팅 하는게 맞는듯

펼쳐보기▼

perl

2023-09-14 16:36:45 답글

perl

2023-09-14 16:37:07 답글

역시 갓언어 너무복잡하네

펼쳐보기▼

nano

2023-09-15 13:29:57 답글

근데 -1은 0xff 가 아니라 0xffffffff로 들어가네

펼쳐보기▼

씹악질겜안분분탕선동충카스테러범

2023-09-14 16:07:41 답글

나도 공부중인데 큰도움됨
C언어 이거는 ㅅㅂ 일단 강좌부터 다 듣고나서 문제풀이 하는게 맞는거같기도하고 몬가 파이썬 배울때보다 뒤지게어려운감이 있어

펼쳐보기▼

판도라_

2023-09-15 03:20:57 답글

와... 지식이 늘었다

펼쳐보기▼

댓글 작성

업로드 중

0초

녹음 중지 삭제

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 공지 정보 질문 잡담 유머 C/C++ C# Python Java Front-end Back-end 앱·겜 AI·Data 그 외

번호 제목

작성자 작성일 조회수 추천

광고 광고 우우 스레기자식

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 52680883

공지 코딩 채널에 오신 것을 환영합니다.

비내리는호남선 2023.09.15 369 7

잡담 앱스토어가 날 강하게 만든다.. [6]

보빗보빗보비빗 2023.09.15 238 4

질문 장고 강의 괜찮은거 있나? [6]

반자음 2023.09.15 143 0

잡담 코딩 특) [22]

유즈퀸 2023.09.15 821 12

잡담 cli의 장점 : 파워풀함 [2]

심호흡 2023.09.15 154 0

앱·겜 고도 엔진 입문 중 느낀점 [12]

판도라_ 2023.09.15 576 0

질문 이건 진짜 개억지 아님? ㅋㅋㅋㅋ [6]

보빗보빗보비빗 2023.09.15 389 1

싱글벙글 코딩 개행 스타일 [1]

Tearinger 2023.09.14 244 6

앱·겜 유니티이슈로 왜 불타는지 정리 [11]

로켓곰군 2023.09.14 394 1

C/C++ C언어 왕초보 질문이 왜 컴파일 및 실행이 가능한지 알아보자 [25]

nano 2023.09.14 960 13

유니티가 깽판치는 걸 보니 언리얼과 고도로 갈아탈것 같은데?

붕탁마Ang 2023.09.14 136 0

C/C++ 2년만에 C언어 다시잡은 빡통의 오늘자 걸음마 [3]

씹악질겜안분분탕선동충카스테러범 2023.09.14 221 0

잡담 아니 유니티 왜저지랄임?? [5]

공기압축기 2023.09.14 239 0

아 서버개발 너무 좋아 [4]

잔향 2023.09.14 257 0

질문 c언어 왕초보 질문 [17]

왕너구리 2023.09.14 375 0

도대체 어쩌다 설치가 이렇게 된거지 [4]

마늘 2023.09.14 169 2

C 다 배우면 C# 배워서 유니티 시작하려고 했는데 [10]

취미로컴퓨터하는학생 2023.09.14 256 0

잡담 아침에 세운 목표 오버킬 했음 근데이제뭐함 [1]

심호흡 2023.09.14 107 0

질문 IOS 개발자 있음? [2]

보빗보빗보비빗 2023.09.14 162 0

글쓰기

전체글 개념글