Cute Running Puppy

cs/[OS] 혼자 공부하는 컴퓨터 구조 + 운영체제

[혼공컴운] chapter 02. 데이터

R.silver 2024. 1. 5. 14:27
반응형

| 참고 도서: 혼자 공부하는 컴퓨터 구조+운영체제

02-1. 0과 1로 숫자를 표현하는 방법

정보 단위

  • 비트 (bit): 가장 작은 정보 단위

  • 바이트(byte): 8비트

  • 킬로바이트(kB): 1000byte

  • 메가바이트(MB): 1000kB

  • 기가바이트(GB): 1000MB

  • 테라바이트(TB): 1000GB

  • 워드: CPU가 한 번에 처리할 수 있는 데이터의 크기

    이진법

  • 이진법: 0과 1으로 모든 숫자를 표현 하는 방법

  • 음수 표현: 2의 보수법 + flag 사용

십육진법

이진법으로 모든 숫자를 표현하면 숫자의 길이가 너무 길어짐 & 이진법으로 변환하기 쉬움-> 십육진법으로 해결
15를 넘어가는 시점에서 올림

  • 0x--으로 표시
  • 이진수 -> 십육진수: 네자리씩 십육진수로 변환하고 이어 붙이기
  • 십육진수 -> 이진수: 한 자리씩 이진수로 변환하고 이어 붙이기

02-2. 0과 1로 문자를 표현하는 방법

문자 집합과 인코딩

  • 문자 집합: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음
  • 문자 인코딩: 문자를 0과 1로 면환하기
  • 문자 디코딩: 0과 1을 문자로 변환하기

아스키 코드

초창기 문자 집합 중 하나
영어 알파벳, 아라비아 숫자, 일부 특수 문자 포함
7비트로 표현 -> 128개의 문자 표현 가능

EUC-KR

대표적인 완성형 인코딩 방식
초성, 중성, 종성이 모두 결합된 한글 단어에 2바이트 크기의 코드 부여

한글을 표현하기 위한 두 가지 인코딩 방식

  • 완성형 인코딩: 초성, 중성, 종성의 조합으로 이루어진 완성된 글자에 고유한 코드를 부여하는 방식
  • 조합형 인코딩: 초성, 중성, 종성에 각각 코드를 부여하여 이들의 조합으로 글자 코드를 완성하는 방식

CP949

DUC-KR이 모든 한글 문자를 표현할 수 없기에 등장한 인코딩 방식
그러나 한글 전체를 표현하기에는 부족

유니코드와 UTF-8

  • 유니코드: 모든 언어를 아우르는 문자 집합
  • UTF-8: 유니코드를 인코딩 하는 방식
반응형