デジタルデータとは|デジタルの意味と特徴
- 著者:YAMANJO
- 公開日:2008年7月25日
- 最終更新日:2024年9月11日
コンピュータが取り扱えるのはデジタルデータのみです。アナログデータの仕組みと特徴が理解できていれば、デジタルデータがどういうものかを理解することができます。
デジタルとはどういう意味か
デジタルとは、情報工学上の理論では「状態を示す量を数値化して処理を行う方式」という、アナログと同様に素人では理解し難い定義がなされています。
しかし、前項で学習したアナログの理解があれば、デジタルの理解は比較的容易です。
アナログとは「とどこまでも精密に測定できる情報」でした。つまり、原音や現象そのものに限りなく近い情報です。その情報を電気信号に変換して、そのままテープなどに焼き付けたものがアナログデータでした。
デジタルの定義は「数値化」された情報です。何を数値化するのかというと、アナログデータに他なりません。
したがって、
アナログ信号を数値化したものがデジタル
ということになります。
アナログの電気信号を数値に置き換えるという意味ですが、アナログデータにもう一段階の行程を加えて、数値化まで行ったデータということです。考え方としては容易ではないでしょうか。
ただ、なぜ数値化するのかという疑問が当然あると思いますが、それについては後述します。まず、どのように数値化するのかを理解しておきましょう。
前項と同様、デジタルをデジタル時計に例えると、デジタル時計はドットの点滅のように一定の間隔で「数値」を表示します。誰が見ても何時何分何秒までとらえ方は同じです。
まさにアナログ時計の針の変化を数値化していると言えます。このように、あいまいにしか表現できないアナログ情報をきっちりと数値化して可視化するイメージになります。
砂時計を例にすると、砂の一粒まで数値に対応させたものがデジタルです。アナログでは明確な時間を表示することができませんが、砂の一粒まで明確に時間を表現することができます。
音や風景であれば、音の高さや大きさ、風景の色や明るさなどを数値で表現します。あくまでイメージですが、音や色を「0~255」のように決められた値に対応させることで、数値で表現することが可能になります。
こうして一定の間隔で情報を測定し、それを数値化していくのです。すると、どんなアナログデータであっても数値で表現することが可能になります。
ただし、この間隔は非常に短く(細かく)、アナログのように滑らかな連続性が失われないようにしなければなりません。間隔が長いと当然品質が落ちていきます。
とは言え、流れていく時間や音をすべて数値化して表現することはできません。砂の一粒が落ちる時間を数値化させることはできても、砂の一粒が落ちていく途中の経過を数値化させることは非常に困難だからです。
言い換えると、いくら細かい間隔で数値化を行ったとしても、その測定時点を数値化することしかできません。つまり、変化の中に無限の細かさが存在するアナログとは異なり、デジタルは定量的で限定的な情報しか持ち得ないということになります。
要するに、
元のアナログデータのすべての情報はデジタル化することができない
ということです。
下図のように、アナログは時間の流れにそってスムーズな矢印で表現でき、どこまでも細かい情報が含まれています。対してデジタルは、スムーズな線にはならず、定規のように特定の間隔でしか情報を測定できません。
私なりに定義すると、
明確に値を提示できるが、測定できる細かさに限界がある情報である
と言えます。
この「どこまで細かく」という度合によってデータサイズが異なってきます。砂時計の例で言えば、1秒間隔で数値化するのか、砂の一粒まで細かく測定して数値化するのかといった測定の細かさや密度によって、デジタルデータの品質が左右されることになります。
私たちの身の回りにあるデジタルの製品やサービスには、
パソコン、スマートフォン、CD、DVD、デジカメ、デジタル放送
などがあります。
デジタルデータとは
前項と同様に、データを「形式として保存されたもの」と定義すると、デジタルデータとは、デジタル情報を特定の形式にまとめた単位ということになります。
したがって、
アナログ信号を数値化したデジタル情報を特定の媒体に保存したものがデジタルデータ
になります。
アナログデータの場合、アナログ信号をそのまま焼き付けるようなかたちで媒体に保存されます。例えばレコードは、音声信号をそのまま物理的な溝の形状として記録します。音声のアナログ信号がレコードの溝の形状に刻み込まれ、その溝を針がトレースすることで再生されるという具合です。
対してデジタルデータは、数値化された情報であるため、
データの中身は数値のみ
になります。
そのため、様々な媒体や方法で記録することができます。例えば、CDやDVD、USBメモリ、ハードディスクなど様々です。このことがすでにデジタルのメリットなのですが、メリット・デメリットについては後述します。
もう少し数値化のイメージを広げてみましょう。
例えば、音楽CDなどの音声データの場合は「このタイミングでこの高さの音をこの強さで出す」という情報、写真などの画像データの場合は「この位置にこの色を出す」という情報を数値で表します。
これらの情報もすべて数値で表すことができます。例えば「このタイミング」というのは時間であり、スタートから「何秒後」のように数値で表現できます。
次に「この高さの音」という情報は、いわゆるドレミの音階で、周波数を使って表現することができます。例えば、音楽の基準ピッチである「A(ラ)」の音の周波数は「440Hz(ヘルツ)」に決まっています。
440Hzは1秒間に440回振動するということですが、ドレミファソラシドの各音階もそれぞれ異なる周波数で表現することができます。「この強さ」というのは音の強弱のことで、これも数値に対応させることで強弱の表現が可能です。
画像の場合は、ピクセルの座標位置を示してその色を指定することで表現できます。デジタル画像は、ピクセル(画素)という小さな点の集まりだということはご存じだと思います。
例えば900万画素のカメラであれば、900万個のピクセルによって画像が構成されているということです。それぞれのピクセルを座標で指定し、色に対応させた数値を指定することで画像を表現することができます。
音楽などの複雑な音声も、どんな風景の画像でも数値データで表現することができるのです。また、音声と画像が表現できれば動画も表現することが可能です。(音声、画像、動画については、その他の基礎知識 で詳しく学習します)
デジタル化のプロセス
アナログの連続的な情報は「サンプリング」→「量子化」→「符号化」というプロセスでデジタル化されます。
難しそうなネーミングですが、考え方は単純です。サンプリングは「測定」すること、量子化はサンプリングされたアナログ値を「デジタル値」に変換すること、符号化はコンピュータが直接扱える「2進数」に変換することです。
下図のようなグラフでイメージするとわかりやすくなります。ただし、画像データについては時間軸がないため、時間軸を持つ音声データをイメージしてみましょう。
サンプリング
測定の間隔を決めて、サンプルの測定を行うことをサンプリングと言います。アナログ信号の時間軸(X軸)に、等間隔でサンプル測定を行う縦線が入り、測定ポイントが決まります。
矢印と定規のイメージ図で示したように、デジタルデータは特定の間隔でアナログ信号を測定して数値化します。この間隔が狭いほどデジタルデータは純正のアナログデータに近づきます。
サンプリングによって、アナログ信号からアナログ値が抽出されます。アナログ値については、次の量子化と合わせて説明します。
量子化
抽出されたアナログ値をデジタル値に変換することを量子化と言います。アナログ値は「連続的な値」であるため、そのままではコンピュータで扱うことができません。
アナログデータは絶えず連続的な変化を続け、理論的には無限にサンプルを測定することができます。ゆえに、どの地点のサンプルを測定したとしても、明確な値を提示することができません。
例えば、アナログ信号から「0.1」というアナログ値を測定したとしても、それが「0.10000001」かもしれないし「0.09999999」かもしれません。どんなに細かく測定しても、さらに詳細な値が得られる可能性があることを意味します。これが連続的な値の意味です。
コンピュータで扱うためには、このような性質のアナログ値をそのまま使うと膨大なデータ量になってしまいます。そこで、一定の範囲内の近似値に丸める処理が量子化になります。
近似値に丸めるというのは、離散的(連続でない)な整数などのキリの良い値に割り当てるという意味です。ただし、アナログ値が「0.7」だった場合、単純にデジタル値を「1」とするのではなく、量子化の計算式があります。
例えば「0.7×255=178.5」のような計算で算出され、もっとも近い整数に丸めると「179」になります。計算式はいくつもあり、これ以上は専門的になるので割愛しますが、基本的には整数に丸められます。
整数に丸める理由は、単純に処理速度を速くするためです。少数があると計算回路が複雑になり、処理時間がかります。そのため、音声データは再生がスムーズでなくなり、音が途切れたり、遅延が生じる可能性があります。
こうして、量子化によって連続する切れ目のないアナログデータから、切れ目のある離散的なデジタルデータへ変換されたことになります。滑らかな曲線からカクカクしたグラフになるイメージです。
とは言え、現在のデジタルデータはアナログデータとほぼ遜色はありません。人間の目や耳で把握できる限界以上に細かくサンプリングが行われているからです。
例えば、標準的な音楽CDのサンプリングレートは「44.1kHz」です。これは1秒間に「44,100回」のサンプリングが行われることを意味します。また、スマートフォンのカメラでも「4800万画素」以上が標準となっています。
画像のデジタル化の場合は、時間の概念がないため、同じグラフで説明することはできませんが、大雑把に言えばサンプリングは画素数に対応しています。量子化はサンプリングで得られた各ピクセルの色や輝度の値を、同様に離散的な数値に変換します。
符号化
量子化によって変換された整数を、さらに「2進数」に変換することを符号化と言います。
符号化とは「コード化」の意味で使われ、文字コードなどの特定のコードへの変換の際にも使われる用語ですが、この場合は2進数への変換を意味します。
2進数の意味と、なぜ2進数への変換が必要なのかについては次項で学習します。
以上がデジタル化のプロセスになります。
このようなアナログからデジタルへの変換行程を、
AD変換(エーディー変換)
と言います。
Aは「Analog」でDは「Digital 」の意味です。AD変換はこの3つのプロセスを経て完了します。
そして、
デジタル化されたデータは再生するときにまたアナログ信号に戻して再生される
ことになります。
この変換を「DA変換(ディーエー変換)」と言います。AD変換の逆で、アルファベットの意味は同じです。
AD変換の時点で、量子化にともなう情報の欠損が起きているので、完全に元のアナログ信号に戻すことはできません。
ただし、先述のように人間の器官の限界以上のサンプリングと量子化がなされており、まず判別することはできないと言われています。
デジタルデータの特徴
デジタルデータは、もうおわかりのとおりアナログデータよりも情報量が劣ります。サンプリングと量子化の過程でどうしても情報が欠け、アナログの連続性は失われます。
では、なぜそうまでしてデジタル化するのかというと、デメリットよりもメリットの方が大きいからです。
まず第1に、
コンピュータ(パソコン)で容易に処理することができる
ということです。
デジタルデータの中身は数値であり、コンピュータの得意分野であることは言うまでもありません。コンピュータで処理できるということは、編集や加工も容易ということです。
これにより、デジタルコンテンツの制作やデータ分析など、多岐にわたる分野での利用が可能になっています。
第2に、
データ伝送が容易にできる
ことも大きなメリットです。
数字をやり取りするだけで良いため、インターネットをはじめとするネットワークを利用して、容易にデータを伝送することができます。一瞬のうちに世界中のどこにいても送受信できる仕組みは、社会に大きな変革をもたらしました。
そして第3に、
時間の経過やコピーに関係なく劣化しない
という、アナログデータ最大の欠点を補うメリットがあります。
これもデータの中身が数値だからに他なりません。数値には物理的な劣化がありません。どれだけ複製(コピー)しても、どれだけの時間が経過しても、元の状態のまま同じ情報を保持することができます。
おかげで、重要なデータ(個人情報、法的文書、研究データなど)を正確に保存し続けることが可能になりました。しかも、劣化による修復やメンテナンスがほぼ不要になるため、コスト削減にも寄与します。
また複製が非常に容易で、いくらでもオリジナルと同じデータを複製することができます。
では、逆にデメリットは何でしょうか?
まず1つは、先述のとおりアナログデータより情報量が劣るため、
アナログデータ(リアル)との誤差が生じる
ということです。
実際には人間の感覚では誤差を判別できないレベルまで再現が可能になっていますが、品質はサンプリングと量子化の精度によって変わります。
そのため、
誤差を小さくすればするほどデータ量が増大し処理時間がかかる
ことになります。
サンプリング間隔が短く(細かく)なればなるほど元のアナログデータに近づきますが、データ量が増えるのは当然です。こうした特性は当然デメリットになり得ます。
また、デジタルと言えども機器の性能に依存してしまう点は変わりません。例えば、ブルーレイディスクは従来のDVDの約5倍のデータ量です。だからこそ高画質を実現できていますが、それをスムーズに再生できる機器がなければ意味がありません。
デジタル技術の進歩は驚くほど速いため、新しい製品やサービスの登場にユーザーが追いついていない感もあります。デジタルデータの大きな可能性は、長所であり短所であるのかもしれません。
また、通信と複製が容易な反面、これを悪用したセキュリティリスクの高さもデメリットとなり得ます。
更新履歴
- 2008年7月25日
- ページを公開。
- 2009年3月1日
- ページをXHTML1.0とCSS2.1で、Web標準化。レイアウト変更。
- 2018年1月19日
- ページをSSL化によりHTTPSに対応。
- 2024年9月11日
- 内容修正。
著者プロフィール
YAMANJO(やまんじょ)
- 経歴
- 岡山県出身、1980年生まれ(申年)の♂です。現在、総合病院で電子カルテなどの情報システム担当SEとして勤務。医療情報学が専門ですが、ネットワーク保守からプリンタの紙詰まり、救急車の運転手までこなしています。
- 医療情報技師、日本DMAT隊員。ITパスポート、シスアドなど、資格もろもろ。
- 趣味は近所の大衆居酒屋で飲むこと、作曲(ボカロP)、ダイビング。
- 関連リンク
- 詳細なプロフィールはこちら
- 作成したボカロ曲などはYoutubeへ
- X(Twitter)