c언어로 도트 찍어보려 했는데

코딩 채널

알림 알림 중 알림 취소

구독자 4408명 알림수신 85명 @은월영

프로그래밍 및 코딩 채널

질문 c언어로 도트 찍어보려 했는데

novice

추천 2 비추천 0 댓글 6 조회수 461 작성일 2022-11-22 12:49:52

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/programmer/63598307

아스키 코드에 없는 이런거는 변수에 저장이 안 될까요

댓글 [6] 글쓰기

진격의엄ㅋ

2022-11-22 12:52:14 답글

대다수는 인코딩문제입니다

펼쳐보기▼

dbfudslr

2022-11-22 13:27:48 답글

*수정됨

1. C에서 char형 변수와 ' '로 감싸지는 문자(리터럴)에는 1바이트가 할당됨. 

2. 아스키코드에 없는 문자들은 기본적으로 2바이트를 이용하는 유니코드로 표현됨 (이것 또한 인코딩 방식에 따라 달라짐)

3. 따라서 '가', 'あ', '☆' 등등 아스키에 할당되지 않은 문자들을 char형으로 넘겨버리면 오버플로우가 발생하고, 원하는 값을 저장할 수 없음

(추가). 물론 그렇다고 " int a = '가'; " 처럼 저장하는 변수 사이즈를 늘린다고 해결되는 건 아님. 이미 대입되는 데이터가 char형 리터럴이기 때문. C에서 아스키 외 문자를 쓸 거라면 문자열로 관리하는 게 편함.

펼쳐보기▼

스프

2022-11-22 18:12:46 답글

*수정됨

선 요약: 문자열을 쓰되 조심해야 한다

C에서 아스키 코드에 속하지 않은 문자를 쓰는 건 좀 골치아파.

우선 C 코드에서 문자열 리터럴은 사실상 const char 배열 취급이야. 예를 들어 "hello, world!"는 길이 14짜리 const char 배열 (C 문자열은 끝에 \0을 붙여서 문자열의 끝이란 걸 표시함) 이나 다름없다는 거지.

근데 여기에 아스키 코드에 속하지 않은 문자를 넣으려 하면 문제가, 그런 문자들은 1바이트만 (통상적인 char 크기) 써서 표현하기가 불가능하다는 거야. 윗댓 말대로 이건 인코딩에 따라서 달라지기도 하는데, 예를 들어 윈도우에서 기본으로 쓰이는 CP949 인코딩에선 한글 한 글자가 2바이트로 표현되고 인터넷이나 맥, 리눅스 등에서 쓰이는 UTF-8 인코딩에선 한글 한 글자가 3바이트로 표현돼.

이게 무슨 말이냐면, 우리가 생각하는 한 글자가 C언어의 기준에선 '한 글자'가 아닐 수도 있다는 거야. 예시로 "안"은 C언어의 시각에선 윈도우 기준 길이 3짜리 const char 배열이고, 리눅스 기준으론 무려 길이 4짜리 배열이되는 식이야.
참고로 이건 C언어에서 '안' 이 불가능한 이유기도 해.

그래서 저런 문자를 반드시 써야겠다면 char 하나만 써서는 안 되고, 각각 전용(?) 문자열을 만들어준 뒤에 printf에서 %s로 포맷해 통째로 출력해줘야 해.

문제는 리터럴 안에다가 non-ascii 글자를 썼을 때 어떤 char 배열로 바뀌는지가 소스 파일의 인코딩을 따라간다는 거야 ㅡ.ㅡ 만약 소스코드의 인코딩은 CP949인데 프로그램을 실행하는 터미널이 UTF-8을 사용하도록 설정돼 있다면 이 글자들을 출력해봤자 이상한 글자만 잔뜩 나오겠지. 물론 반대도 마찬가지.

그래서 C에서 non-ascii 문자를 다루려면 이런 지뢰를 조심해서 잘 피해야 원하는 결과를 얻을 수 있어.

펼쳐보기▼

호두와몬드

2022-11-23 14:41:32 답글

wchar_t 써

펼쳐보기▼

호두와몬드

2022-11-23 14:49:36 답글

*수정됨

setlocale(LC_ALL, "");

wchar_t wch = L'문자';
wprintf(L"%c", wch);

펼쳐보기▼

어둠의민초단

2022-11-23 18:39:37 답글

*수정됨

C#, Java, Go, Rust같은 언어들은 스트링이 기본적으로 UTF-16, UTF-8인데, C/C++은 기본적으로 아스키라서 힘들더라

펼쳐보기▼

댓글 작성

업로드 중

0초

녹음 중지 삭제

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 공지 정보 질문 잡담 유머 C/C++ C# Python Java Front-end Back-end 앱·겜 AI·Data 그 외

번호 제목

작성자 작성일 조회수 추천

수능 보고 왔습니다 [1]

nell 2022.11.23 159 0

질문 선생님들 알고있는 데이터있으신가요 [1]

DLFW 2022.11.23 102 0

정보 코드잇 11월 30일까지 월 9900원 할인 하더라 [3]

이름이뭐지 2022.11.23 290 0

잡담 노마드코더 타입스크립트 포기함 [10]

이름이뭐지 2022.11.23 613 0

Front-end 책보면서 클론코딩중인데 js video.autoplay 질문 [6]

새벽하늘의군청색 2022.11.23 215 1

Python 암호만들기

파이썬바보 2022.11.23 183 0

질문 [해시] 내가 이해한게 맞는건지 봐줄 사람 [5]

클린티 2022.11.23 166 0

질문 국비충 ㅁㅌㅊ? [12]

ㅇㅇ (112.72) 2022.11.23 1151 0

잡담 카운터해킹도 등장하지 않을까 [3]

간다앗 2022.11.23 191 0

질문 C언어 뉴비 문자열 입력 후 알파벳 개수 출력 관련 질문 [6]

Tako0520 2022.11.22 189 0

질문 c언어로 도트 찍어보려 했는데 [6]

novice 2022.11.22 461 2

되게 우울해진다 [1]

ㅇㅇ (118.43) 2022.11.22 136 1

질문 이거 왜 얕은 복사가 되는거임? [2]

ㅇㅇ (118.43) 2022.11.22 169 0

Python 이미지 압축을 만들어봤다만 [5]

진격의엄ㅋ 2022.11.22 250 3

Python dk tlqkf [2]

ㅇㅇ (14.36) 2022.11.21 213 0

컴공가면 학벌 메리트 별로 없나? [4]

ㅇㅇ (118.235) 2022.11.21 407 2

Python BOJ 16일차 갈무리 + BOJ 1158 [1]

Q9 2022.11.21 128 0

C/C++ c++ 괴담 [2]

스프 2022.11.21 443 1

프로그래밍 할 때 창의성은 무조건적임? [3]

비내리는호남선 2022.11.21 200 0

웹서버 과제 1주일 남았는데 프론트엔드 어케하지 [6]

ㅇㅇ 2022.11.21 171 0

글쓰기

전체글 개념글