바이트

컴퓨터의 기억장치의 크기를 나타내는 단위

v  d  e  h
바이트 크기
SI 접두어전통적 용법이진 접두어
기호(이름)기호기호(이름)V값
kB (킬로바이트)10001 = 103KB10241 = 210KiB (키비바이트)210
MB (메가바이트)10002 = 106MB10242 = 220MiB (메비바이트)220
GB (기가바이트)10003 = 109GB10243 = 230GiB (기비바이트)230
TB (테라바이트)10004 = 1012TB10244 = 240TiB (테비바이트)240
PB (페타바이트)10005 = 1015PB10245 = 250PiB (페비바이트)250
EB (엑사바이트)10006 = 1018EB10246 = 260EiB (엑스비바이트)260
ZB (제타바이트)10007 = 1021ZB10247 = 270ZiB (제비바이트)270
YB (요타바이트)10008 = 1024YB10248 = 280YiB (요비바이트)280

바이트(byte)는 컴퓨터기억장치의 크기를 나타내는 단위로 자주 쓰이며, 많은 프로그래밍 언어에서 정수형에 속하는 자료형이기도 하다. 바이트의 실질적 의미는 ASCII 문자 하나를 나타낼 수 있다는 것이다. 따라서 여러 바이트를 한 워드로 사용하고 있는 현재에도 대부분의 컴퓨터 하드웨어에서 메모리의 주소 단위로 사용된다.

스토리지 크기가 늘어남에 따라 10진, 2진 해석의 차이가 커진다. 이를 백분율로 비교 차트이다.

역사

"바이트"(byte)라는 용어는 1956년 6월 워너 벅홀츠(Werner Buchholz)가 창안하였는데[1][2][3][a], 당시 IBM 스트레치 컴퓨터의 초기 설계를 하고 있던 시기였으며[4][5][6][2][3][7][8], 비트 및 가변 필드 길이(VFL) 명령을 한 바이트 크기로 인코딩하려던 참이었다.[2] 우연적으로 비트(bit)로 발음되지 않도록 "바이트"(byte)로 철자를 바꾸었다.[6][2][9]

정의

바이트의 정의는 여러 가지가 있으며, 서로 비슷한 뜻을 지니지만 섞어 쓸 경우 혼동을 부를 수도 있다.

  1. 일정한 개수의 비트로 이루어진 연속된 비트열. ‘일정한 개수’가 항상 정해진 건 아니지만, 최근에는 사실상 1바이트를 8비트로 간주하는 경우가 흔하다.
  2. 이진 컴퓨터의 워드 안에서 주소로 표현할 수 있는 가장 작은 단위에 해당하는 연속된 비트열. 예를 들어서 CDC 6000 계열의 메인프레임은 60비트 부동소수점 실수를 6비트짜리 바이트 10개로 나눴으며, 따라서 대문자 로마자와 숫자만을 표현할 수 있는 천공 카드에 결과를 출력하기가 용이했다. 또한 CDC의 경우 12비트 I/O를 사용했기 때문에 12비트를 1바이트라 부르기도 했다. 이 정의 역시 최근에는 대부분 8비트를 가리키지만, 역사적으로 6비트, 7비트, 9비트 등의 바이트가 존재했다.
  3. 직렬 데이터 스트림(예를 들어서 모뎀 등)에서 의미를 가지는 가장 작은 연속된 비트열. 여기에는 시작 비트, 종료 비트, 패리티 비트 등이 포함될 수 있으며, 예를 들어 7비트 ASCII 부호를 저장할 경우 최소 7비트에서 최고 12비트가 한 바이트가 될 수 있다.
  4. 몇몇 프로그래밍 언어자료형. 예를 들어 C의 경우 한 바이트는 실행 환경에서 쓰이는 문자들을 담을 수 있을 만큼 큰 단위(C 표준 3.5항)로 정의되며, 한 바이트를 담는 char 자료형은 부호가 있느냐 없느냐와 상관 없이 적어도 8비트 이상(5.2.4.2.1항)이어야 한다. 자바byte 자료형은 항상 부호가 있으며 8비트로 정의된다.

한 바이트 안의 비트의 개수가 중요할 경우에는 흔히 옥텟(octet)과 같이 크기가 일정한 단위를 쓰기도 하며, 특히 컴퓨터 네트워크전기통신에서 흔히 쓰인다. 또한 프랑스어에서는 옥텟을 바이트의 뜻으로 쓰기도 한다.

기호와 접두어

IEEE 1541에서는 바이트의 기호를 ‘B’로 정했으며 접두어와 함께 많이 사용되지만, IEC 60027-2에서는 여기에 대한 언급이 없다. 또한 B는 유사한 분야에서 쓰이는 의 단위이기도 하다. 비슷하게 IEEE 1541은 비트의 기호를 ‘b’로 정했지만 IEC 60027-2는 bit를 그대로 기호로 쓰고 있다.

바이트보다 더 큰 단위를 나타내기 위해 기호에 접두어를 붙여 쓸 수 있다. 여기에는 기존의 10진법 기준 SI 접두어와 IEC 60027-2에서 정의한 이진 접두어가 공존하고 있는데, SI 접두어 뒤에 ‘i’를 붙이면 비슷한 크기의 이진 접두어가 된다. (예를 들어, 1MB = 1,000,000 바이트 ≒ 1,048,576 바이트 = 1MiB) 하지만 SI 접두어를 이진 접두어의 의미로 사용하는 경우도 흔히 볼 수 있으며 두 기준이 서로 섞이는 경우도 있다. 예를 들어 1.44MB 플로피 디스크의 실제 용량은 1.44MB(= 1,440,000 바이트)나 1.44MiB(= 약 1,509,949 바이트)가 아닌 1440KiB(= 1,474,560 바이트)이다.

바이트는 추상적인 단위이기 때문에 바이트보다 더 작은 단위를 나타내는 접두어는 존재하지 않는다. 다만 비트보다 크고 바이트보다 작은 단위는 몇 개가 있다.

관련 단위

  • 옥텟(octet): 한데 묶여 쓰이는 2진 이진부호모음. 바이트가 8비트를 가리킬 때 서로 같은 뜻을 갖는다. 전기통신 분야에서는 바이트란 용어 대신 옥텟이란 표현을 사용한다. 팔중수라고도 부른다.
  • 니블(nibble) = 1바이트의 절반으로 보통 4비트를 가리킨다. 이때 바이트 하나는 상위 니블(상위 4비트)과 하위 니블(하위 4비트)로 나눌 수 있다.
  • 비트(bit): 비트는 전산학과 정보 이론의 정보 단위이다.
  • 워드(word): 전자통신 기기에 따라 2바이트 또는 4바이트를 묶어서 부르는 단위이다.
  • 킬로바이트(kbyte): 1024 바이트는 1 킬로바이트이다.

같이 보기

각주

내용주