일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 해커톤
- PCA
- GPT-4
- 티스토리챌린지
- 딥러닝
- LG Aimers 4th
- Classification
- 오블완
- ChatGPT
- 지도학습
- regression
- gpt
- AI
- deep learning
- supervised learning
- LG
- LG Aimers
- 분류
- Machine Learning
- 회귀
- OpenAI
- LLM
- 머신러닝
Archives
- Today
- Total
SYDev
Chapter 02-2 : 0과 1로 문자를 표현하는 방법 본문
Computer Architecture + Operating System/Computer Architecture
Chapter 02-2 : 0과 1로 문자를 표현하는 방법
시데브 2023. 7. 20. 13:22학습 목표
- 0과 1로 문자를 표현하는 방법, 즉 컴퓨터가 문자를 이해하고 표현하는 다양한 방법에 대해 학습
문자 집합과 인코딩
- 문자 집합(character set) : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
- 문자 인코딩(character encoding) : 문자를 컴퓨터가 이해할 수 있도록 0과 1로 변환하는 과정
- 문자 디코딩(character decoding) : 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있도록 문자로 변환하는 과정
아스키 코드
- 아스키 코드(ASCII; American Standard Code for Information Interchange) : 아스키 문자에 대응된 고유한 수
- 7비트(실제로는 8비트이나, 8비트 중 1비트는 오류 검출을 위한 패리티 비트)로 표현, 정보의 가짓수 2^7개
EUC-KR
한글 인코딩에는 완성형, 조합형 인코딩 두 가지 방식이 존재한다.
- 완성형 인코딩 : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식
- 조합형 인코딩 : 초성, 중성, 종성을 위한 비트열을 각각 할당해 그것들의 조합으로 글자 코드를 완성하는 인코딩 방식
- EUC-KR : KS X 1001, KS X 1003이라는 문자 집합을 기반으로 하는 대표적 완성형 인코딩 방식
- 모든 문자를 표현할 수 없음 -> CP949 : EUC-KR의 확장 버전
유니코드와 UTF-8
- 유니코드 : EUC-KR보다 훨씬 다양한 한글을 포함하며 대부분 나라의 문자, 특수문자, 화살표나 이모티콘까지도 코드로 표현할 수 있는 통일된 문자 집합. UTF-8, UTF-16, UTF-23는 유니코드 문자의 인코딩 방식
출처 : 강민철, <혼자 공부하는 컴퓨터구조 + 운영체제>, 한빛미디어(주), 2022.08.16
'Computer Architecture + Operating System > Computer Architecture' 카테고리의 다른 글
Chapter 04-1 : ALU와 제어장치 (0) | 2023.07.23 |
---|---|
Chapter 03-2 : 명령어의 구조 (0) | 2023.07.21 |
Chapter 03-1 : 소스 코드와 명령어 (0) | 2023.07.21 |
Chapter 02-1 : 0과 1로 숫자를 표현하는 방법 (0) | 2023.07.20 |
Chapter 01 : 컴퓨터 구조의 시작 (0) | 2023.07.20 |