- Преподавателю
- Информатика
- Подходы к понятию информации и измерению информации. Информационные объекты различных видов. Универсальность дискретного (цифрового) представления информации. Представление информации в двоичной системе счисления
Подходы к понятию информации и измерению информации. Информационные объекты различных видов. Универсальность дискретного (цифрового) представления информации. Представление информации в двоичной системе счисления
Раздел | Информатика |
Класс | - |
Тип | Конспекты |
Автор | Nusratova F.E. |
Дата | 01.12.2015 |
Формат | doc |
Изображения | Есть |
Раздел 2. ИНФОРМАЦИЯ И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ
Тема 2.1. Информация и измерение информации
Подходы к понятию информации и измерению информации. Информационные объекты различных видов. Универсальность дискретного (цифрового) представления информации. Представление информации в двоичной системе счисления.
Слово «информация» происходит от латинского слова informatio, что в переводе означает сведение, разъяснение, ознакомление.
Можно выделить следующие подходы к определению информации:
* традиционный (обыденный) - используется в информатике: Информация - это сведения, знания, сообщения о положении дел, которые человек воспринимает из окружающего мира с помощью органов чувств (зрения, слуха, вкуса, обоняния, осязания).
* вероятностный - используется в теории об информации: Информация - это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределённости и неполноты знаний.
Для человека: Информация - это знания, которые он получает из различных источников с помощью органов чувств.
Вся информация, которую обрабатывает компьютер, представлена двоичным кодом с помощью двух цифр - 0 и 1. Эти два символа 0 и 1 принято называть битами
(от англ. binary digit - двоичный знак)
Бит - наименьшая единица измерения объема информации.
Название
Усл. обозн.
Соотношение
Байт
Байт
1 байт = 23 бит = 8 бит
Килобит
Кбит
1Кбит = 210 бит = 1024 бит
КилоБайт
Кб
1 Кб = 210 байт = 1024 байт
МегаБайт
Мб
1 Мб = 210 Кб = 1024 Кб
ГигаБайт
Гб
1 Гб = 210 Мб = 1024 Мб
ТераБайт
Тб
1 Тб = 210 Гб = 1024 Гб
Вопрос: «Как измерить информацию?» очень непростой.
Ответ на него зависит от того, что понимать под информацией.
Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными.
Измерение информации
В информатике используются различные подходы к измерению информации:
Содержательный подход к измерению информации.
Сообщение, уменьшающее неопределенность знаний человека в два раза, несет для него 1 бит информации.
Количество информации, заключенное в сообщении, определяется по формуле Хартли:
где N - количество равновероятных событий;
I - количество информации (бит), заключенное в сообщении об одном из событий.
Алфавитный (технический) подход к измерению информации - основан на подсчете числа символов в сообщении.
Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой, то количество информации, заключенное в сообщении вычисляется по формуле:
Ic - информационный объем сообщения
К - количество символов
N - мощность алфавита (количество символов)
i - информационный объем 1 символа
Двоичное кодирование информации
К достоинству двоичной системы счисления относится - простота совершаемых операций, возможность автоматической обработки информации с использованием двух состояний элементов ПК и операцию сдвиг
Кодирование - это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.
Декодирование - расшифровка кодированных знаков, преобразование кода символа в его изображение
Двоичное кодирование - кодирование информации в виде 0 и 1
Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться:
-
числа
-
символьная информация (буквы, цифры, знаки)
-
графические изображения
-
звук
Двоичное кодирование чисел
Для записи информации о количестве объектов используются числа.
Числа записываются с использованием особых знаковых систем, которые называют системами счисления.
100 → 11001002
Система счисления - совокупность приемов и правил записи чисел с помощью определенного набора символов.
Все системы счисления делятся на две большие группы:
ПОЗИЦИОННЫЕ
Количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра.
0,7
7
70
НЕПОЗИЦИОННЫЕ
Количественное значение цифры числа не зависит от того, в каком месте (позиции или разряде) записана та или иная цифра.
XIX
Двоичное кодирование текста
Кодирование - присвоение каждому символу десятичного кода от 0 до 255 или соответствующего ему двоичного кода от 00000000 до 11111111
Присвоение символу определенного кода - это вопрос соглашения, которое фиксируется в кодовой таблице.
В качестве международного стандарта была принята кодовая таблица ASCII (American Standard Code for Information Interchange) :
Коды с 0 по 32 (первые 33 кода) - коды операций (перевод строки, ввод пробела, т.е. соответствуют функциональным клавишам);
Коды с 33 по 127 - интернациональные, соответствуют символам латинского алфавита, цифрам, знакам арифметических операций, знакам препинания;
Коды с 128 по 255 - национальные, т.е. кодировка национального алфавита.
на 1 символ отводится 1 байт (8 бит), всего можно закодировать 28 = 256 символов
С 1997 года появился новый международный стандарт Unicode, который отводит для кодировки одного символа 2 байта (16 бит), и можно закодировать 65536 различных символов (Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, множество математических, музыкальных, химических и прочих символов)
В настоящий момент существует пять кодировок кириллицы: КОИ-8, CP1251, CP866, ISO, Mac. Для преобразования текстовых документов из одной кодировки в другую существуют программы, которые называются Конверторы.
Двоичное кодирование графики
Кодирование графической информации
Пространственная дискретизация - перевод графического изображения из аналоговой формы в цифровой компьютерный формат путем разбивания изображения на отдельные маленькие фрагменты (точки) где каждому элементу присваивается код цвета.
Пиксель - min участок изображения на экране, заданного цвета
Растровое изображение формируется из отдельных точек - пикселей, каждая из которых может иметь свой цвет. Двоичный код изображения, выводимого на экран храниться в видеопамяти. Кодирование рисунка растровой графики напоминает - мозаику из квадратов, имеющих определенный цвет
Качество кодирования изображения зависит от:
1) размера точки (чем меньше её размер, тем больше кол-во точек в изображении);
2) количества цветов (чем большее кол-во возможных состояний точки, тем качественнее изображение) Палитра цветов - совокупность используемого набора цвета
Качество растрового изображения зависит от:
1) разрешающей способности монитора - кол-во точек по вертикали и горизонтали.
2) используемой палитры цветов (16, 256, 65536 цветов)
3) глубины цвета - количество бит для кодирования цвета точки
Для хранения черно-белого изображения используется 1 бит.
Цветные изображения формируются в соответствии с двоичным кодом цвета, который хранится в видеопамяти. Цветные изображения имеют различную глубину цвета. Цветное изображение на экране формируется за счет смешивания трех базовых цветов - красного, зеленого и синего. Для получения богатой палитры базовым цветам могут быть заданы различные интенсивности.
Двоичное кодирование звука
В аналоговой форме звук представляет собой волну с непрерывно меняющейся амплитудой и частотой. На компьютере работать со звуковыми файлами начали с начала 90-х годов. В основе кодирования звука с использованием ПК лежит - процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от - частоты дискретизации и её разрешения (глубины кодирования звука - количество уровней)
Временная дискретизация - способ преобразования звука в цифровую форму путем разбивания звуковой волны на отдельные маленькие временные участки, где амплитуды этих участков квантуются (им присваивается определенное значение).
Это производится с помощью аналого-цифрового преобразователя, размещенного на звуковой плате. Таким образом, непрерывная зависимость амплитуды сигнала от времени заменяется дискретной последовательностью уровней громкости. Современные 16-битные звуковые карты кодируют 65536 различных уровней громкости или 16-битную глубину звука (каждому значению амплитуды звук. сигнала присваивается 16-битный код)
Качество кодирования звука зависит от:
1) глубины кодирования звука - количество уровней звука
2) частоты дискретизации - количество изменений уровня сигнала в единицу времени (как правило, за 1 сек).
N - количество различных уровней сигнала
i - глубина кодирования звука
Информационный объем звуковой информации равен:
I = i * k* t
где i - глубина звука (бит)
K - частота вещания (качество звука) (Гц) (48 кГц - аудио CD)
t - время звучания (сек)
Представление видеоинформации
В последнее время компьютер все чаще используется для работы с видеоинформацией. Простейшей такой работой является просмотр кинофильмов и видеоклипов. Следует четко представлять, что обработка видеоинформации требует очень высокого быстродействия компьютерной системы.
Что представляет собой фильм с точки зрения информатики? Прежде всего, это сочетание звуковой и графической информации. Кроме того, для создания на экране эффекта движения используется дискретная по своей сути технология быстрой смены статических картинок. Исследования показали, что если за одну секунду сменяется более 10-12 кадров, то человеческий глаз воспринимает изменения на них как непрерывные.
6