Представление информации в ЭВМ.
Компьютеризация общества и компьютерная обработка информации приводит к необходимости ее представления в двоичной виде.
На сегодняшнее время компьютеры способны обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Однако большинство существующих компьютеров способно хранить и обрабатывать только дискретную информацию. Следовательно, любой вид информации, подлежащий к обработке на ЭВМ необходимо закодировать в числовом виде.
Рассмотрим способы представления информации в ЭВМ.
Представление целых чисел.
Для эффективности использования памяти в ЭВМ используют разные методы представления целых чисел. При этом применяется формат с фиксированной запятой.
Для положительных (без знаковых) чисел все биты ячейки памяти участвуют в указании количественного значения числа. Например, 1 байт=8 битам дает возможность задать числа в диапазоне от 00000000 до 11111111 в двоичной системе (0-255 в десятичной системе). Если же используется для кодирования машинное слово (2 байта), то возможен числовой диапазон от 0 до 2^16-1=65535 в десятичной системе.
В случае если нужно указать число со знаком, старший бит в двоичной системе выделяется для указания знака. При этом одним байтом можно задать числа от -128 до +127, а 16 разрядное целое со знаком позволяет указать числовой диапазон от -32768 до +32767 в десятичной системе. Для замены операции вычитания операцией сложения, отрицательные числа в памяти компьютера хранятся в дополнительном коде.
В компьютере операции над целым числами выполняются целочисленным процессорам по определенным правилам.
Представление вещественных чисел.
Для выполнения операций с большей точностью в компьютере используется формат представления чисел с плавающей запятой. При таком кодировании часть разрядов отводится для указания порядка, другая часть для указания мантиссы и один бит для указания знака. Например, при длине числа 32 бита (двойное машинное слово) 1 бит отводится для указания знака, 8 бит – указание порядка и 24 бита – для мантиссы. Это позволяет задать диапазон от 10^-38 до 10^38 .
Операции над такими числами выполняет математический сопроцессор.
Представление текстовой информации.
В случае текстовой информации, каждому символу сопоставляется двоичное число, образуя таблицу кодировок символов. Существует различные стандарты кодировок: ASCII, UCS-2, UCS-4. Например, в таблице ASCII одним байтом кодируются 256 символов (включая управляющие символы). Согласно этой кодировке букве b соответствует код 01100010, о – 01101111, k – 01101011. И слово book записывается четырьмя байтами 01100010 01101111 01101111 01101011.
Представление графической информации.
Для кодирования графической информации все изображение делиться на равные участки – пиксели. Чем больше пикселей, тем качественнее представление графического изображения. Каждый пиксель задается двоичным кодом цвета дискретизированной области. В основном применяют кодировки RGB (Red-Green-Blue) - для устройств, работающих по принципу излучения (мониторы), CMYK (Cyan-Yellow-Magenta-Black) - для устройств, работающих по принципу отражения от белого (печать на бумагу).
В системе RGB при глубине цвета 24 бита, состояние пикселя задается 24 битами, из которых 8 бит используется для задания интенсивности красного, 8 бит – интенсивности зеленого и последние 8 бит - интенсивности синего. Таким образом, три цвета, каждый из которых имеет 256 уровней интенсивности, смешиваются в разных соотношениях, и получается 224 различных цветов.
Не трудно подсчитать объем памяти необходимый для хранения изображения на экране монитора разрешением 800х600 точек при глубине цвета 24 бит.
800*600*3байта=1440000 байт=1.44 Мбайт.
В таком виде сохраняется информация в графических файлах с расширением BMP. Но для уменьшения занимаемого объема применяются различные методы сжатия типа JPG, GIF и т. д.
Представление звуковой информации.
В электронных устройствах регистрации звука формируется непрерывно меняющиеся во времени напряжение или ток, т.е. аналоговый электрический сигнал. Для записи этого сигнала в компьютер необходима дискретизация этого сигнала по уровню и по времени. Эту функцию выполняю специальные электронные устройства – аналогово-цифровые преобразователи. Через каждый короткий промежуток времени в виде двоичного числа регистрируется уровень сигнала. Таким образом, звуковой сигнал представляет собой поток двоичных чисел.
Обычно глубина кодирования (дискретизация по уровню) составляет 16 бит (65536 уровней), а частота дискретизации 24000 раз в секунду. Можно подсчитать поток информации при таком качестве звука
16 бит*24000 с-1=2 байта*24000 с-1=48000 байт в секунду=48 Кбайт/с
При воспроизведении звука цифровыми устройствами, поток чисел обратно представляются в аналоговый сигнал при помощи цифро-аналогового преобразователя.
Универсальный звуковой формат файла без сжатия это WAV. Наиболее распространенный формат со сжатием - MP3.
Представление видео - информации.
Видео представляет собой поток последовательно сменяющихся кадров изображений. Следовательно, представление видео в ЭВМ сводится к представлению потока графической информации. Телевизионный формат воспроизведения видео использует разрешение кадра 720*576 точек с 24 битовой глубиной цвета. Скорость воспроизведения составляет 25 кадров в секунду. Объем передаваемой при этом информации составляет:
24бита*720*576*25=248832000 бит/с или приблизительно 30 Мбайт/с.
Это составляет очень большой поток данных, поэтому при хранении и передачи видео используют разные методы сжатия (MPEG, AVI). В современных цифровых видеокамерах запись видео выполняется в цифровой форме после предварительного сжатия.