Computer Architecture + Operating System/Computer Architecture
Chapter 02-2 : 0과 1로 문자를 표현하는 방법
시데브
2023. 7. 20. 13:22
학습 목표
- 0과 1로 문자를 표현하는 방법, 즉 컴퓨터가 문자를 이해하고 표현하는 다양한 방법에 대해 학습
문자 집합과 인코딩
- 문자 집합(character set) : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
- 문자 인코딩(character encoding) : 문자를 컴퓨터가 이해할 수 있도록 0과 1로 변환하는 과정
- 문자 디코딩(character decoding) : 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있도록 문자로 변환하는 과정
아스키 코드
- 아스키 코드(ASCII; American Standard Code for Information Interchange) : 아스키 문자에 대응된 고유한 수
- 7비트(실제로는 8비트이나, 8비트 중 1비트는 오류 검출을 위한 패리티 비트)로 표현, 정보의 가짓수 2^7개
EUC-KR
한글 인코딩에는 완성형, 조합형 인코딩 두 가지 방식이 존재한다.
- 완성형 인코딩 : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식
- 조합형 인코딩 : 초성, 중성, 종성을 위한 비트열을 각각 할당해 그것들의 조합으로 글자 코드를 완성하는 인코딩 방식
- EUC-KR : KS X 1001, KS X 1003이라는 문자 집합을 기반으로 하는 대표적 완성형 인코딩 방식
- 모든 문자를 표현할 수 없음 -> CP949 : EUC-KR의 확장 버전
유니코드와 UTF-8
- 유니코드 : EUC-KR보다 훨씬 다양한 한글을 포함하며 대부분 나라의 문자, 특수문자, 화살표나 이모티콘까지도 코드로 표현할 수 있는 통일된 문자 집합. UTF-8, UTF-16, UTF-23는 유니코드 문자의 인코딩 방식
출처 : 강민철, <혼자 공부하는 컴퓨터구조 + 운영체제>, 한빛미디어(주), 2022.08.16
728x90
반응형