Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Свойства и измерение информации





Перейдем к рассмотрению важнейших качественных и количественных характеристик информации (свойств):

  • адекватность;
  • актуальность;
  • полнота;
  • избыточность;
  • надежность, достоверность — степень доверия, вероятность ошибки;
  • ценность — пригодность к практическому использованию.

Под адекватностью понимают степень соответствия воспринимаемой информации тому, что было заложено при создании ее носителя (данных). Адекватность информации следует отличать от ее достоверности. Любой вымысел в художественном произведении является адекватным, вопрос о его достоверности даже не ставится. Неадекватной информация может оказаться из-за применения различных методов при создании данных и их обработке. Например, в судоходстве красным фонарем отмечается разрешенный фарватер, а на железной дороге — запрет движения. Истории известен случай, когда красный фонарь, вывешенный над пролетом моста, послужил причиной крупной катастрофы.

Актуальность — это степень соответствия информации текущему моменту. С актуальностью информации часто связывают ее ценность. Достоверная и адекватная, но несвоевременная информация может приводить к принятию ошибочных решений. В русском языке есть поговорка: «Знал бы прикуп — жил бы в Сочи». Это пример коммерческой актуальности информации.

Под полнотой информации понимается ее достаточность для принятия решения. Полнота информации может зависеть как от объема данных, так и от применяемых методов. Обнаружив след ладони руки на месте преступления, вы еще не можете сделать вывод о человеке, оставившем его. Воспользовавшись дополнительными данными базы дактилоскопического учета и применив соответствующий метод идентификации, вы, вероятно, сделаете соответствующий вывод. При этом следует помнить, что метод идентификации позволяет сделать заключение об идентичности следа с места преступления и отпечатков в базе данных, а не о способе (причине) его появления на месте преступления. Для заключения о способе появления следа рук подозреваемого на месте преступления необходима дополнительная информация, например, о возможности перемещения предмета, на котором был обнаружен этот след.

Под избыточностью понимают наличие дублирующих сведений. Дублирование сведений приводит к увеличению объема данных, но облегчает процесс их восприятия. Общеизвестно, что из текста на русском языке может быть удалено 20–25% букв без утраты смысла. Чтение же такого текста будет затруднено. В ряде случаев, используя слова с одним корнем и изменяя приставки, суффиксы и окончания, можно строить целые предложения с понятным смыслом. Визуальная информация, которую мы получаем органами зрения, имеет избыточность около 90%. Факт избыточности визуальной информации используется в различных автоматизированных системах распознавания образов. Например, программа FineReader способна определить по нечеткому изображению буквы алфавита. В то же время количество ошибок при распознавании будет уменьшаться с увеличением четкости (объема) изображения. Чем больше избыточность данных, тем шире набор методов, с помощью которых можно получить из них адекватную информацию.

При создании компьютерных программ обработки данных перед программистами постоянно стоит задача выбора между увеличением объема данных, хранимых на носителях или в оперативной памяти, и скоростью их обработки. Внеся в базы данных дополнительные сведения, можно увеличить скорость выбора необходимых объектов, но общее увеличение объема данных требует больших ресурсов запоминающих устройств и, в свою очередь, может замедлить процесс обработки.

Достоверность информации — это соответствие ее объективной реальности. Достоверная информация получается при обработке достоверных данных адекватными методами. Несоответствие данных объективной реальности может образоваться как в процессе их хранения или передачи, так и в процессе подготовки. При этом искажение данных может быть случайным и преднамеренным. Например, на место преступления может быть специально подброшен предмет с отпечатками пальцев постороннего лица. Если достоверные данные, например MMS сообщение сотового телефона, обработать неадекватным методом, как простое SMS сообщение, то получится недостоверная информация.

К свойствам актуальности и полноты тесно примыкает ценность информации.

Неактуальная информация теряет свою ценность, так как она не пригодна для практического использования. Неполная информация также менее ценна.

Приведенный выше список не исчерпывает все свойства информации. Некоторые авторы выделяют доступность информации, скорость обработки и другие свойства. Для выяснения, является какой-либо признак свойством информации или нет, необходимо исходить из определения информации.

Для определения количества информации используют несколько методов – это математический (энтропийный) и технический (объемный).

1.) Математическое понятие информации связано с ее измерением. В теории информации принят энтропийный подход, который устанавливает ценность информации, содержащейся в сообщении для его получателя, и исходит из следующей модели. Получатель сообщения имеет представление о возможности наступления некоторых событий. Это представление в общем случае недостоверно и выражается вероятностями, с которыми он ожидает то или иное событие. Общая мера неопределенности (энтропия) характеризуется формулой S =In W, где W — число всевозможных комбинаций, которыми может быть выражено некоторое состояние.

Количество информации в сообщении определяется тем, насколько уменьшается эта мера после получения сообщения. Тривиальное сообщение не несет информации. Сообщение несет полную информацию о некотором событии, если оно снимает всю неопределенность.

Шеннон — единица измерения количества информации, равная количеству информации, содержащейся в сообщении, выраженном одним из двух равновероятных, взаимоисключающих и исчерпывающих состояний.

Дит — единица количества информации, содержащейся в сообщении о состоянии системы, имеющей десять равновероятных состояний; количество информации, равное единице, при выборе основания логарифма, равного десяти.

Пример:

1) Бросание монеты. До падения монеты вероятность выпадения одной из сторон 0,5 и возможны две комбинации. После падения реализована единственная комбинация.

2) Одним из жителей города, население которого составляет примерно 1 млн, совершено преступление.

Неопределенность относительно лица, совершившего это преступление определяется энтропией S0 = log21000000 = 20 бит.

Получено сообщение, что преступник — мужчина. Информация, содержащаяся в этом сообщении, — I0 = log22 = 1 бит.

В результате энтропия стала S1 = S0 — I0 = 19 бит.

Получено сообщение о возрасте преступника (при интервале возраста 78 — 14 = 64 года). Информация, содержащаяся в этом сообщении, будет равна I2 = log264 = 6 бит.

В результате энтропия стала S2 = S1 — I2 = 19 бит.

 

2.) В технике часто используют более простой и грубый объемный способ измерения информации. Он основан на подсчете числа символов в сообщении, т.е. связан с длиной сообщения и не учитывает его содержания. При объемном способе применяют две стандартные единицы измерения информации: бит и байт.

Бит (от англ. Bit, образовано от сочетания binary digit—двоичная цифра). Это количество информации, содержащееся в сообщении «да» или «нет» (в двоичном коде «1» и «0»). Он позволяет полностью передать информацию о реализации события, которое может иметь два исхода. Например, бросание монеты.

Байт — это количество информации, которое можно передать с помощью 8 двоичных символов, восьмиразрядного двоичного кода. Он позволяет полностью передать информацию о реализации события, которое может иметь 28 = 256 исходов. Например, нажатие на одну из клавиш компьютера.

Производные единицы измерения информации следующее.

1 байт = 8 бит

1 Кбит (Килобит) = 210 = 1024 бит (~ 1 тыс.бит);

1 Мбит (Мегабит) = 220 = 1024 Кбит (~ 1 млн. бит);

1 Гбит (Гигабит) = 230 = 1024 Мбит (~ 1 млрд. бит);

1 Кб (Килобайт) = 210 = 1024 байт (~ 1 тыс. байт);

1 Мб (Мегабайт) = 220 = 1024 Кб (~ 1 млн. байт);

1 Гб (Гигабайт) = 230 = 1024 Мб (~ 1 млрд. байт);

1 Тб (Терабайт) = 240 = 1024 Гб (~ 1 триллион байт);

1 Пб (Пикобайт) = 250 = 1024 Тб (~ 1 биллион байт);

1 Экзабайт = 260 = 1024 Пб;

1 Зеттабайт = 270 = 1024 Экзабайт;

1 Йоттабайт = 280 = 1024 Зеттабайт.

«кило» с системе измерений (система СИ) обозначает число 1000, но в вычислительной технике это 1024 байта. Поэтому, если говорят, «64 Кбайта», то это означает 64*1024 или 65536 байтов. Мегабайт, в свою очередь, обозначает 1024*1024 или 1048576 байтов. В этих же единицах (а именно, байт, КБайт, Мбайт, Гбайт) измеряются и объемы памяти в компьютере.

Результаты, полученные двумя рассмотренными способами измерения информации, как правило, не совпадают. Энтропийное количество информации никогда не превосходит Объемного.

При измерении информации, циркулирующей в ЭВМ, используют в основном технический подход (Объемный).

 

 

ПОНЯТИЕ И ОСОБЕННОСТИ







Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

Система охраняемых территорий в США Изучение особо охраняемых природных территорий(ООПТ) США представляет особый интерес по многим причинам...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.