デジタルデータの単位と容量
- 著者:YAMANJO
- 公開日:2008年7月25日
- 最終更新日:2024年10月2日
2進数からなるデジタルデータは、8ビットを1単位として1文字を表現しています。デジタルデータの単位とデータサイズの表現方法は必ず理解しておく必要があります。
デジタルデータの単位
デジタルデータは、0と1の2進数のみで成り立っていることを前項で学習しました。
2種類の数字だけであらゆる表現を行うため、元となるアナログデータに品質を近づけようとするとデータ量は増大していきます。逆に品質を落とすとデータ量は減少します。
本項では、こうしたデータ量をあらわす「単位」について学習していきたいと思います。
まず、デジタルデータの最小値は「0」もしくは「1」の数字1桁分のサイズになります。これは疑問の余地がありません。
この1桁分のデータの最小単位を、
ビット(bit)
と言います。
ただし、ビット単位では、サイズが小さすぎて扱いやすいものではありません。1ビットでは「0」か「1」の2通りのデータしか扱うことができないため、1ビットでは「1」か「2」のどちらかしか表現できません。
そこで、ある程度の数値まで表現できるように、いくつかのビットをまとめたもを最小単位として利用します。このようなビットの集合体の単位規格がいくつか存在します。
なかでも、もっとも一般的な単位が、
バイト(Byte)
と呼ばれる単位です。
バイト(Byte)のビット数は、
8ビット(1バイト=8ビット)
になります。
つまり、8桁分の2進数を1単位とするのが「バイト」です。「バイト」はコンピュータに関連する単位の中で、私たち一般のユーザーがもっとも多く接する単位となりますので、しっかり覚えておいてください。
ビットは小文字の「b」や「bit」、バイトは大文字の「B」の表記が使われます。
では、なぜ8ビットなのかというと、
半角英数字1文字分のデータサイズ
になるからです。
コンピュータはアメリカ生まれなので、英語が基本となります。
コンピュータに関することは英語が前提になっていますので、半角英数字(アルファベットと数字)を表現することのできる最低限のビット数を最小単位として定めています。
逆に言えば、日本語は1バイトでは表現しきれません。この問題については、文字コードとは で詳しく学習します。
ではなぜ、8ビットで半角英数字1文字分となるのでしょうか?
それは、8桁の2進数で何通りのビット列を表現できるのかを考えると理解することができます。数学の知識が少し必要になりますが、それほど難解ではありません。
8桁の0と1の並びをいくつ作成することができるかということです。下表のとおり、8桁の2進数と10進数を対応させてみます。
2進数 | 10進数 |
---|---|
00000000 | 0 |
00000001 | 1 |
00000010 | 2 |
00000011 | 3 |
00000100 | 4 |
00001000 | 8 |
00001010 | 10 |
2進数 | 10進数 |
---|---|
00010000 | 16 |
00010100 | 20 |
00100000 | 32 |
01000000 | 64 |
10000000 | 128 |
11111110 | 254 |
11111111 | 255 |
このように、8桁の2進数では、0から255までの256通りを表現することができます。(28=256)
256通りを表現することができれば、半角英数字はすべて表現することができます。なぜなら、アルファベットはAからZまで26文字で、小文字を加えても52文字しかありません。数字を10種類加えてもおつりがくるからです。
さらに、&・<>などの記号を加えたとしても256文字なら十分に足りるので、1バイトあれば英語圏の人々にとって必要な文字や記号をすべて表現することができるといことになります。
逆に、日本語や中国語などの漢字を扱う人々にとっては、256種類ではとてもすべての文字を表現することはできません。日本人が使う「常用漢字」だけでも軽く千を超えるからです。
IT技術はアメリカ生まれアメリカ育ちなので、他の国ましてアジアの国のことなど想定していなかったことになりますが、いずれにしても8ビットと決まり、
実質的に1バイトが最小単位
になっています。
日本では、日本語の1文字を表現するのに2バイト(16ビット) を使います。2バイトを使うと、216=65,536 種類の文字を表現することができます。
デジタルデータのサイズ(容量)
では、これらを踏まえて「バイト」単位について、さらに詳しく学習して行きましょう。
お金である「円」が、1円、1千円、1万円と位が上がっていくように、バイトの単位も、1バイト → 1メガバイト → 1ギガバイト → 1テラバイトと位が上がっていきます。
下表のとおり、1,000倍で位が上がります。
単位 | データサイズ | 正確なデータ量(Byte) |
---|---|---|
1B(バイト) | 1B | 1 |
1KB(キロバイト) | 1,000B | 210=1,024 |
1MB(メガバイト) | 1,000KB | 220=1,048,576 |
1GB(ギガバイト) | 1,000MB | 230=1,073,741,824 |
1TB(テラバイト) | 1,000GB | 240=1,099,511,627,776 |
このように、キロが1,000倍、メガが100万倍、ギガが10億倍、テラが1兆倍と慣用的に10の累乗で増えていきますが、実際は、2の累乗となるため正確には異なります。そのため、テラまでの位になるとかなりの誤差があります。
どちらの意味で用いるかは状況や用途によって異なりますが、基本的には、わかりやすい10の累乗を用いますので、1,000倍で位が上がっていくと覚えておきましょう。
メガバイト(MB)やギガバイト(GB)の表示はよく目にする機会もあると思いますが、以下の表に例をあげてみます。データサイズの知識があれば、これらの製品についても理解が深まるのではないでしょうか?
製品名 | データサイズ |
---|---|
フロッピーディスク(FD) | 1.44MB |
CD-R | 650MB・700MB |
DVD-R | 片面 4.7GB/両面 9.4GB |
ブルーレイディスク | 片面1層式 25GB/2層式 50GB |
※これらの製品については、補助記憶装置(2) で学習します。
フロッピーディスクはもはや流通しておらず、知らない方も多いかもしれませんが、容量の決まっている規格製品として参考までに掲載しました。
ブルーレイディスクなどの大容量の記録媒体は、一昔前のパソコン本体のハードディスクという記憶装置よりも多い容量を持っています。技術の進歩が恐ろしく早いので、新製品もどんどん出ています。
データ単位については、パソコンを扱ううえで必ず必要になる知識です。しっかり覚えておきましょう。
更新履歴
- 2008年7月25日
- ページを公開。
- 2009年3月6日
- ページをXHTML1.0とCSS2.1で、Web標準化。レイアウト変更。
- 2018年1月19日
- ページをSSL化によりHTTPSに対応。
- 2024年10月2日
- 内容修正。
著者プロフィール
YAMANJO(やまんじょ)
- 経歴
- 岡山県出身、1980年生まれ(申年)の♂です。現在、総合病院で電子カルテなどの情報システム担当SEとして勤務。医療情報学が専門ですが、ネットワーク保守からプリンタの紙詰まり、救急車の運転手までこなしています。
- 医療情報技師、日本DMAT隊員。ITパスポート、シスアドなど、資格もろもろ。
- 趣味は近所の大衆居酒屋で飲むこと、作曲(ボカロP)、ダイビング。
- 関連リンク
- 詳細なプロフィールはこちら
- 作成したボカロ曲などはYoutubeへ
- X(Twitter)