Notice
Recent Posts
Recent Comments
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Archives
Today
Total
관리 메뉴

SYDev

Chapter 02-2 : 0과 1로 문자를 표현하는 방법 본문

Computer Architecture + Operating System/Computer Architecture

Chapter 02-2 : 0과 1로 문자를 표현하는 방법

시데브 2023. 7. 20. 13:22

학습 목표

  • 0과 1로 문자를 표현하는 방법, 즉 컴퓨터가 문자를 이해하고 표현하는 다양한 방법에 대해 학습

 

문자 집합과 인코딩

  • 문자 집합(character set) : 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
  • 문자 인코딩(character encoding) : 문자를 컴퓨터가 이해할 수 있도록 0과 1로 변환하는 과정
  • 문자 디코딩(character decoding) : 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있도록 문자로 변환하는 과정

아스키 코드

  • 아스키 코드(ASCII; American Standard Code for Information Interchange) : 아스키 문자에 대응된 고유한 수
  • 7비트(실제로는 8비트이나, 8비트 중 1비트는 오류 검출을 위한 패리티 비트)로 표현, 정보의 가짓수 2^7개

https://park-duck.tistory.com/entry/%EC%95%84%EC%8A%A4%ED%82%A4%EC%BD%94%EB%93%9C%ED%91%9C-ASCII

EUC-KR

 한글 인코딩에는 완성형, 조합형 인코딩 두 가지 방식이 존재한다.

  • 완성형 인코딩 : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식
  • 조합형 인코딩 : 초성, 중성, 종성을 위한 비트열을 각각 할당해 그것들의 조합으로 글자 코드를 완성하는 인코딩 방식
  • EUC-KR : KS X 1001, KS X 1003이라는 문자 집합을 기반으로 하는 대표적 완성형 인코딩 방식
  • 모든 문자를 표현할 수 없음 -> CP949 : EUC-KR의 확장 버전

유니코드와 UTF-8

  • 유니코드 : EUC-KR보다 훨씬 다양한 한글을 포함하며 대부분 나라의 문자, 특수문자, 화살표나 이모티콘까지도 코드로 표현할 수 있는 통일된 문자 집합. UTF-8, UTF-16, UTF-23는 유니코드 문자의 인코딩 방식

https://www.unicode.org/charts/PDF/UAC00.pdf

 

 


  출처 : 강민철, <혼자 공부하는 컴퓨터구조 + 운영체제>, 한빛미디어(주), 2022.08.16