정수의 저장 원리

정수의 저장 원리

이 문서에서는 정수의 저장 원리에 대해 깊이 있게 다룬다.

컴퓨터 메모리 체계

컴퓨터는 전기를 이용해 동작하며, 전기를 세게 흘리거나 약하게 흘리는 두 가지 상태를 이용하여 모든 계산을 처리한다. 따라서 데이터 저장 체계도 두 가지 상태인 0과 1로 구분하며 이를 저장할 수 있는 가장 작은 단위를 비트(bit)라고 부른다.

비트만으로는 데이터 저장의 한계가 있기 때문에, 비트들을 모아서 하나의 단위를 구상하였고 8개의 비트를 모아 바이트라는 단위를 만들게 된다.

1byte = 8bit = 2^8 종류 = 256종류

1바이트는 256개의 값을 표현할 수 있다. 이를 표현하면 다음과 같다.

00000000
00000001
00000010
00000011

...

11111110
11111111

00000000은 0이며 순서대로 번호를 붙이면 11111111은 255가 된다. 이는 프로그래머 용 계산기를 통해서도 확인할 수 있다. 하지만 숫자에는 부호라는 것이 존재하기 때문에 무조건 0부터 번호를 붙일 수도 없는 상황이다. 하지만 컴퓨터는 양수와 음수 개념을 모르기 때문에 여기서 보수가 등장한다.

보수

보수는 진법과 합쳐 2의 보수, 10의 보수등으로 불리며, 더하여 밑수가 되는 값을 말한다. 이해를 위해 좀 더 쉽게 설명하면 자리수가 고정일 때, 더해서 0이 되도록 만드는 수가 보수의 정의이다. 2진수일 때는 2의 보수, 10진수일 때는 10의 보수라고 부른다.

만약 자리수가 한 자리인 10진수가 있을 경우, 4에 대한 10의 보는 6이다.

4+6=04 + 6 = 0

4와 6을 더하면 10이 나오지만, 한 자리라고 정해져 있기 때문에 1은 버려지고 0만 남게 된다. 이러한 특징을 이용하면 우리는 음수의 개념을 몰라도 값을 유추할 수 있게 된다.

다시 컴퓨터가 사용하는 2진수로 돌아와서 크기를 1바이트로 고정시키고 생각해본다.

1바이트에서 표현 가능한 가장 큰 숫자는 11111111이다. 이 숫자에 얼마를 더하면 00000000이 될까?

답은 1이다.

11111111+00000001=0000000011111111 + 00000001 = 00000000

물론 1111111100000001을 더하면 100000000이 되지만, 크기가 1바이트로 고정이기 때문에 넘치는 값(overflow)은 버려진다. 따라서 00000000, 즉 0이 된다. 따라서 1111111100000001은 2의 보수 관계이다. 2진수에 있어서는 더해서 0이되는 수라는 의미이다. 이러한 사실들을 바탕으로 우리는 다음과 같이 정리할 수 있다.

  • 1111111100000001은 더하면 0이된다.

  • 1111111100000001은 2의 보수 관계이다.

  • a + b = 0일 때, a가 1이면 b는 -1이다.

  • 00000001이 1이므로, 11111111은 -1이라고 볼 수 있다.

즉, -1은 다음과 같이 계산한다.

  1. 1의 2진수 값을 구한다.

  2. 1번의 모든 자리를 뒤집는다(1의 보수)

  3. 2번에 1을 더한다.

이를 기호로 표시하면 다음과 같다.

-1 = ~1 + 1

부호를 고려하여 범위 설정(signed)

1바이트를 부호를 고려하여 구분하면 다음과 같이 나눠진다. 값의 범위는 -128부터 127까지이다.

2진수

10진수

10000000

-128

10000001

-127

10000010

-126

...

...

11111110

-2

11111111

-1

00000000

0

00000001

1

00000010

2

...

...

01111101

125

01111110

126

01111111

127

따라서 부호를 고려하여 1바이트 범위 내에서 계산을 수행할 경우 127 + 1128이 아닌 -128이다. 따라서 순환형 구조를 가진다라고 표현한다. 또한 음수들을 살펴보면 맨 앞자리가 1이라는 것을 알 수 있으며 이러한 특징을 이용하여 맨 앞자리를 부호 비트(signed bit)로 부른다. 주의할 점은 애초에 부호를 고려해서 만든 것이 아니라 만들고 나서 보니 부호 비슷한 역할을 수행한다라고 보는 것이 앞으로 이해에 도움이 될 것이다.

부호를 고려하지 않고 범위 설정(unsinged)

부호를 고려하지 않을 경우 1바이트 범위 내에서 0부터 255까지의 값을 가진다.

2진수

10진수

00000000

0

00000001

1

00000010

2

...

...

11111101

253

11111110

254

11111111

255

부호를 고려하지 않을 경우 부호비트가 발생하지 않는다.

결론

각각의 정해진 크기에 따라 signedunsigned로 범위를 나누면 다음과 같다.

크기

signed

unsigned

1byte

-128 ~ 127

0 ~ 255

2byte

-32,768, ~ 32,767

0 ~ 65,535

4byte

-2,147,483,648 ~ 2,147,483,647

0 ~ 4,294,967,295

8byte

-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807

0 ~ 18,446,744,073,709,551,615

Last updated