3.3. Единицы измерения

Единицы измерения информации служат для измерения объёма информации — величины, исчисляемой логарифмически.  Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или в квантовых системах в физике.

Чаще всего измерение информации касается объёма компьютерной памяти и объёма данных, передаваемых по цифровым каналам связи.

Объёмы информации можно представлять как логарифм количества состояний.

Бит (один двоичный разряд в двоичной системе счисления) — одна из самых известных единиц измерения информации.

Впервые слово bit было использовано Шенноном для логарифмической единицы информации в 1948 г.

В зависимости от точек зрения, бит может определяться следующими способами:

По Шеннону

Бит — это двоичный логарифм  вероятности равновероятных событий или сумма произведений вероятности на двоичный логарифм вероятности при равновероятных событиях; см. информационная энтропия.

Бит — базовая единица измерения количества информации, равная количеству информации, содержащемуся в опыте, имеющем два равновероятных исхода; см. информационная энтропия. Это тождественно количеству информации в ответе на вопрос, допускающий ответы «да» либо «нет» и никакого другого (то есть такое количество информации, которое позволяет однозначно ответить на поставленный вопрос).

Один разряд двоичного кода (двоичная цифра). Может принимать только два взаимоисключающих значения: да/нет, 1/0, включено/выключено, и т. п. В электронике 1 двоичному разряду соответствует 1 двоичный триггер, который имеет два устойчивых состояния.

В вычислительной технике и сетях передачи данных обычно значения 0 и 1 передаются различными уровнями напряжения либо тока. Например, в микросхемах на основе ТТЛ 0 представляется напряжением в диапазоне от +0 до +0,8 В, а 1 в диапазоне от +2,4 до +5,0 В.

В вычислительной технике, особенно в документации и стандартах, слово «бит» часто применяется в значении «двоичный разряд». Например: старший бит — старший двоичный разряд байта или слова, о котором идёт речь.

Байт  — единица хранения и обработки цифровой информации. Чаще всего байт считается равным восьми битам, в этом случае он может принимать одно из 256 (28) различных значений. Для того, чтобы подчеркнуть, что имеется в виду восьмибитный байт, в описании сетевых протоколов используется термин «октет» (лат. octet).

Байт в современных x86-совместимых компьютерах — это минимально адресуемый набор фиксированного числа битов.

Иногда байтом называют последовательность битов, которые составляют подполе машинного слова, используемое для кодирования одного текстового символа (хотя правильней это называть символом, а не байтом). На некоторых компьютерах возможна адресация слов разной длины. Это предусмотрено инструкциями извлечения полей ассемблеров LDB и DPB на PDP-10 и в языке Common Lisp.

Ряд ЭВМ 1950-х и 1960-х годов использовали 6-битовые символы в 48-битовых или 60-битовых машинных словах. В некоторых моделях ЭВМ производства Burroughs Computer Corporation  размер символа был равен 9 битам. Во многих современных цифровых сигнальных процессорах используется машинное слово длиной 16 бит и больше.

Название «байт» было впервые использовано в 1956 году В. Бухгольцем при проектировании первого суперкомпьютера IBM 7030  для пучка одновременно передаваемых в устройствах ввода-вывода шести битов, позже, в рамках того же проекта, байт был расширен до восьми бит.

Байтовая адресация памяти была впервые применена в системе IBM System/360.  В более ранних компьютерах адресовать можно было только целиком машинное слово, состоявшее из нескольких символов, что затрудняло обработку нечисловых данных.

Килобайт — единица измерения количества информации, равная в зависимости от контекста 1000 или 1024 (210) стандартным (8-битным) байтам. Применяется для указания объёма памяти в различных электронных устройствах.

1 Килобайт (КБ) = 8 Килобит (Кб)

Для измерения больших количеств байтов служат единицы «килобайт» = 1000 байт и «Кбайт» (кибибайт, kibibyte) = 1024 байт. Такой порядок величин имеют, например:

  • Сектор диска обычно равен 512 байтам то есть половине Кбайт, хотя для некоторых устройств может быть равен одному или двум Кбайт.
  • Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
  • «Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Единицы «Мегабайт» = 1000 Килобайт = 1000000 байт и «Мбайт» (мебибайт, mebibyte) = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт.

Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны.

Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Единицы «Гигабайт» = 1000 Мегабайт = 1000000000 байт и «Гбайт» (гибибайт, gibibyte) = 1024 Мбайт = 230 байт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Терабайт  — единица измерения количества информации, равная 1 099 511 627 776 (240) стандартным (8-битным) байтам или 1024 Гигабайтам. Применяется для указания объёма памяти в различных электронных устройствах.

Петабайт — единица измерения количества информации, равная 1015 или 250 байтам.

Примеры использования «Петабайтов» для описания объема данных в разных сферах:

Интернет — Google обрабатывает около 24 Петабайт данных каждый день.

Телекоммуникации — через сети AT&T еженедельно проходит 19 Петабайт трафика.

Физика — четыре эксперимента на большом адронном коллайдере производят данные для последующей обработки объемом 4 Петабайта в год.

Архивы — Архив Интернета содержит около 3 Петабайт данных на 2009 год. При этом в среднем каждый месяц объем архива увеличивается на 100 Терабайт.

Фильмы — для создания спецэффектов к фильму Аватар компанией Weta Digital было задействовано более Петабайта данных.

Эксабайт — единица измерения количества информации, равная 1018 или 260байтам.

Интересные факты:

По данным исследования компании IDC, общий объём цифровой информации, имеющейся на земном шаре в 2006 году, составил 161 Эксабайт; то же исследование прогнозировало не менее шестикратного увеличения этого объема за 2007—2010 гг. Аналогичное исследование, проведенное через год, выявило 281 Эксабайт созданной и скопированной цифровой информации в 2007 г. во всём мире (в среднем по 45 ГБ информации на каждого жителя планеты).

Аналитики из Калифорнийского университета утверждают, что человечеству потребовалось 300 тысяч лет, чтобы создать первые 12 Эксабайт информации, зато вторые 12 Эксабайт были созданы всего за два года.

По прогнозам экспертов Cisco к 2012 году среднемесячный объём глобального IP-трафика достигнет уровня 44 Эксабайта.

64-разрядный указатель может адресовать пространство в 16 Эксабайт.

Зеттабайт — единица измерения количества информации, равная 270 байтам.

Йоттабайт (ЙБ, Йбайт; англ. yottabyte — септибайт) — единица измерения количества информации, равная 1024 или 280 байтам.


Copyright © 2015 Vyatka state agricultural academy (VyatSAA)

Copyright © 2015 Valeriya Shelpyakova

Copyright © 2015 Akeksandra Shishkina

Copyright © 2015 Valeriy Dyachkov

XHTML | CSS