ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [컴퓨터구조] 2장. 데이터
    CS/컴퓨터구조 2023. 8. 23. 22:57

    1. 0과 1로 숫자를 표현하는 방법

     

    1-1. 컴퓨터는 0과 1만 이해할 수 있다. = 이진법 사용

    컴퓨터에서 정보를 나타내는 가장 작은 단위는 bit(비트) 이다. 1bit는 0 또는 1만 표현 가능 ⇒ N bit로 표현할 수 있는 정보 수 = 2^N 개

    *워드: CPU가 한 번에 처리할 수 있는 데이터 크기. 만약 CPU가 한 번에 64비트를 처리할 수 있다면 1워드는 64비트가 됨.

     

    1-2. 이진법으로 음수 표현

    이진법으로 음수를 표현하는 방법 중 하나는 2의 보수를 그 이진수의 음의 값으로 이해하는 것이 있다.

    2의 보수: 어떤 이진수가 2^n이 되기 위해 필요한 값 중 가장 수(를 이진법으로 표현한 수)

    ex) 101 의 2의 보수: 1000 - 101 = 11

     

    2의 보수 쉽게 구하는 방법: 음수로 표현하고 싶은 이진수를 0은 1로, 1은 0으로 뒤집은 후 다시 1을 더한다.

    ex) 101 → 010 → 010+1 = 011

     

    컴퓨터 내부적으로 이진수에 양수/음수를 의미하는 flag 값을 붙여 표현한다.

    ex) 양수 flag + 1010 ⇒ 컴퓨터는 10을 의미한다고 이해

         음수 flag + 1010 ⇒ 컴퓨터는 1010 을 2의 보수로 갖는 0110의 음의 값인 -6으로 이해

     

    2의 보수로 음수를 표현하는 데에는 한계가 존재한다

       1) 0의 ‘2의 보수’는 자리 수가 달라져 버린다.(한 자리 더 길어짐)

       2) 2^n 값은 ‘2의 보수’를 구하면 자기 자신이 나오므로 음수 값을 구할 수 없다.

     

    1-3. 이진법과 십육진법

    모든 수를 이진법으로 표현하기에는 길이가 길어지므로 변환이 쉬운 십육진법으로 대신 나타내기도 한다.

     

    이진수 → 십육진수

    십육진법으로는 한 자리 당 16가지 표현이 가능 = 2^4 만큼 표현 가능

    이진법으로는 한 자리 당 2가지 표현만 가능하므로 이진수 네 자리(=2^4)를 합해야 십육진수 한 자리(=2^4)를 표현할 수 있음.

    ⇒이진수를 네 자리씩 끊어 십육진수 한 자리로 변환하면 된다.

    ex) 1101011을 네 자리씩 끊어 십육진수로 변환하면 1101 = D, 1011 = B ⇒ 이진수 11011011 = 십육진수 DB

     

    십육진수 → 이진수

    위와 동일한 원리로 십육진수 한 자리를 이진수 네 자리로 변환하여 표현하면 된다.

    ex) 38CE2 = 0011 1000 1100 1111 0010

     

     

    2. 0과 1로 문자를 표현하는 방법

    문자 집합 Character Set: 컴퓨터가 인식하고 표현할 수 있는 문자의 모음

    문자 인코딩: 문자 → 컴퓨터가 이해할 수 있는 이진법으로 변환

    문자 디코딩: 이진수 → 사람이 이해할 수 있는 문자로 변환

    코드 포인트: 각 문자에 할당된 고유한 값(십진수 or 십육진수)

     

    아스키코드: 1bit의 패리티 비트 + 7bit(문자 표현) = 총 128개 의 문자 표현 가능

    한계: 표현 가능한 문자 수 부족

     

    c.f) 한글 인코딩 방식

    - 완성형 인코딩: 한 음절마다 코드 포인트 부여

    - 조합형 인코딩: 각 초성, 중성, 종성 마다 코드 포인트를 부여하는 방식

     

    EUC-KR: 한글을 완성형으로 인코딩하는 문자 집합, 글자 하나에 2바이트 크기(=16비트 =16진수 4자리)의 코드 부여.

    한계: 모든 한글 음절 표현 불가능(ex. 뷇), 다국어 지원 서비스는 지원하려는 모든 나라의 언어들의 개별 인코딩을 고려해야 하는 문제 존재.

     

    유니코드: 한글(완성형 인코딩)을 포함한 여러 나라 언어, 특수 문자, 기호 등을 표현하는 문자 집합. 인코딩 방식이 다양.(UTF-8 / UTF-16 / UTF-32 등)

    UTF-N: 가변 길이 인코딩(인코딩 결과는 1~4바이트, 각 글자에 부여된 코드 포인트에 따라 다름.)

     

    * 본 글의 일부 설명과 그림의 출처는 인프런 강의 '혼자-공부하는-컴퓨터구조-운영체제'와 동명의 서적 입니다.

    https://www.yes24.com/Product/Goods/111378840

     

    혼자 공부하는 컴퓨터 구조+운영체제 - 예스24

    혼자 해도 충분합니다! 1:1 과외하듯 배우는 IT 지식 입문서이 책은 독학으로 컴퓨터 구조와 운영체제를 배우는 입문자가 ‘꼭 필요한 내용을 제대로 학습’할 수 있도록 구성했다. 뭘 모르는지

    www.yes24.com

     

    'CS > 컴퓨터구조' 카테고리의 다른 글

    6장. 메모리와 캐시메모리  (0) 2023.08.31
    5장. CPU 성능 향상 기법  (0) 2023.08.26
    4장. CPU  (0) 2023.08.26
    3장. 명령어  (0) 2023.08.24
    [컴퓨터구조] 1. 컴퓨터 구조 시작하기  (0) 2023.08.22

    댓글

Designed by Tistory.