Единицы измерения информации
Материал из Википедии — свободной энциклопедии
Единицы измерения информации служат для измерения объёма информации — величины, исчисляемой логарифмически.[1] Это означает, что когда несколько объектов рассматриваются как один, количество возможных состояний перемножается, а количество информации — складывается. Не важно, идёт речь о случайных величинах в математике, регистрах цифровой памяти в технике или даже квантовых системах в физике.
Чаще всего измерение информации касается объёма компьютерной памяти и объёма данных, передаваемых по цифровым каналам связи.
Содержание |
[править] Первичные единицы
Небольшой объём информации следует представлять как логарифм[2] количества состояний.
Наименьшее целое число, логарифм которого положителен — 2, и соответствующая ему единица — бит — является основой исчисления информации в цифровой технике. Единица, соответствующая числу 3 (трит) равна бита, числу 10 (хартли) — бита.
Такая единица как нат, соответствующая натуральному логарифму, для нужд цифровой техники не применяется, поскольку основание натуральных логарифмов не является целым числом.
[править] Единицы, производные от бита
Целые количества бит отвечают количеству состояний, равному степеням двойки.
Особое название имеет 4 бита — ниббл (или полубайт), количество информации, содержащейся в шестнадцатеричной цифре.
[править] Байт
Измерения в байтах | ||||||
---|---|---|---|---|---|---|
Десятичная приставка | Двоичная приставка | |||||
Название | Символ | Степень | Название | Символ | Степень | |
МЭК | ГОСТ 8.417-2002 | |||||
байт | B | 100 | байт | B | байт, Б | 20 |
килобайт | kB | 103 | кибибайт | KiB | Кбайт, КБ | 210 |
мегабайт | MB | 106 | мебибайт | MiB | Мбайт, МБ | 220 |
гигабайт | GB | 109 | гибибайт | GiB | Гбайт, ГБ | 230 |
терабайт | TB | 1012 | тебибайт | TiB | Тбайт, ТБ | 240 |
петабайт | PB | 1015 | пебибайт | PiB | Пбайт, ПБ | 250 |
эксабайт | EB | 1018 | эксбибайт | EiB | Эбайт, ЭБ | 260 |
зеттабайт | ZB | 1021 | зебибайт | ZiB | Збайт, ЗБ | 270 |
йоттабайт | YB | 1024 | йобибайт | YiB | Йбайт, ЙБ | 280 |
Следующей по порядку популярной единицей информации является 8 бит, или байт (о терминологических тонкостях написано ниже). Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.
Такие величины как машинное слово и т.п., составляющие несколько байт, в качестве единиц измерения почти никогда не используются.
[править] Килобайт
Для измерения больших количеств байтов служат единицы «килобайт» = 1000 байт и «Кбайт»[3] (кибибайт, kibibyte) = 1024 байт (о путанице десятичных и двоичных единиц и терминов см. ниже). Такой порядок величин имеют, например:
- Сектор диска обычно равен 512 байтам т.е. половине Кбайт, хотя для некоторых устройств может быть равен одному или двум Кбайт.
- Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).
- «Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, т.е. 4 Кбайт.
Объём информации, получаемой при считывании дискеты «3,5″ высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.
[править] Мегабайт
Единицы «мегабайт» = 1000 килобайт = 1000000 байт и «Мбайт»[3] (мебибайт, mebibyte) = 1024 Кбайт = 1048576 байт применяются для измерения объёмов носителей информации. Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт. Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД десятичные мегабайты были более популярны. Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.
[править] Гигабайт
Единицы «гигабайт» = 1000 мегабайт = 1000000000 байт и «Гбайт»[3] (гибибайт, gibibyte) = 1024 Мбайт = 230 байт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7%.
Размер 32-битного адресного пространства равен 4 Гбайт ≈ 4,295 гигабайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флеш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.
Для исчисления ещё больших объёмов информации имеются единицы терабайт—тебибайт (1012 и 240 соответственно), петабайт—пебибайт (1015 и 250 соответственно) и т.д.
[править] Терминологические тонкости
[править] Что такое «байт»?
В принципе, байт определяется для конкретного компьютера как минимальный шаг адресации памяти, который на старых машинах не обязательно был равен 8 битам (память кстати, и не обязательно состоит из битов. см. напр. троичный компьютер). Традиционно (и в соответствии с современными стандартами) байт равен восьми битам. В таких обозначениях как Кбайт (русское) или KB (английское) под байт(B) подразумевается именно 8 бит, хотя сам термин «байт» не вполне корректен с точки зрения теории. Кстати, строчная латинская буква b обозначает не байт, а бит. Во французском языке используются обозначения o, Ko, Mo и т.д. (от слова octet) дабы подчеркнуть, что речь идёт именно о 8 битах.
[править] Чему равно «кило»?
Долгое время разнице между множителями 1000 и 1024 старались не придавать большого значения. Во избежание недоразумений следует чётко понимать различие между:
- двоичными кратными единицами, обозначаемыми согласно ГОСТу как «Кбайт», «Мбайт», «Гбайт» и т.д.;
- единицами килобайт, мегабайт, гигабайт и т.д., понимаемыми как научные термины.
Последние по определению равны соответственно байт. В качестве терминов для «Кбайт», «Мбайт», «Гбайт» и т.д. МЭК предлагает «кибибайт», «мебибайт», «гибибайт» и т.д., однако эти термины критикуются за непроизносимость и не встречаются в устной речи.
В различных областях информатики предпочтения в употреблении десятичных и двоичных единиц тоже различны. Причём, хотя со времени стандартизации терминологии и обозначений прошло уже несколько лет, далеко не везде стремятся прояснить точное значение используемых единиц. В английском языке для «киби»=1024 иногда используют прописную букву K, дабы подчеркнуть отличие от обозначаемой строчной буквой приставки СИ кило. Однако, такое обозначение не опираются на авторитетный стандарт, в отличие от российского ГОСТа касательно «Кбайт».
[править] Примечания
- ↑ С точки зрения физики, величина информации (как и близкая к ней по смыслу энтропия) безразмерна. На практике, как и при измерении безразмерных же углов, пользуются различными практически удобными единицами.
- ↑ Можно говорить о «просто» логарифме, поскольку численные величины логарифмов по разным основаниям пропорциональны. Таким образом, вопрос выбора единицы измерения информации фактически равнозначен выбору основания для логарифма количества состояний. Следует также заметить, что информация случайной величины точно равна логарифму количества состояний лишь при равномерном распределении. Во всех прочих случаях количество информации будет меньше.
- ↑ 1 2 3 ГОСТ 8.417-2002 «Единицы величин»