5.8: Властивості інформації
- Page ID
- 29781
Зручно думати про фізичні величини як про розміри. Наприклад, розміри швидкості - це довжина в часі, і тому швидкість виражається в метрах в секунду. Подібним чином зручно думати про інформацію як про фізичну величину з розмірами. Можливо, це трохи менш природно, адже ймовірності за своєю суттю безрозмірні. Однак зауважте, що формула використовує логарифми до основи 2. Вибір бази зводиться до масштабного коефіцієнта для інформації. В принципі, будь-яка база\(k\) може бути використана, і пов'язана з нашим визначенням ідентичністю.
\(\log_k(x) = \dfrac{\log_2(x)}{\log_2(k)} \tag{5.15}\)
При логарифмах base-2 інформація виражається в бітах. Пізніше ми знайдемо природні логарифми, щоб бути корисними.
Якщо в розділі є дві події з ймовірностями\(p\) і\((1 − p)\), інформація для кожного символу дорівнює
\(I = p\log_2\Big(\dfrac{1}{p}\Big) + (1-p)\log_2\Big(\dfrac{1}{1-p}\Big)\tag{5.16}\)
яка показана, як функція\(p\), на малюнку 5.3. Він найбільший (1 біт) для\(p\) = 0,5. Таким чином, інформація є максимумом, коли ймовірності двох можливих подій рівні. Крім того, для всього діапазону ймовірностей між\(p\) = 0.4 і\(p\) = 0.6 інформація близька до 1 біту. Вона дорівнює 0 для\(p\) = 0 і для\(p\) = 1. Це розумно, оскільки для таких значень результат\(p\) є певним, тому ніяка інформація не отримується, вивчаючи її.
Для розділів з більш ніж двома можливими подіями інформація на символ може бути вищою. Якщо\(n\) можливі події, інформація на символ лежить між 0 і\(\log_2(n)\) бітами, максимальне значення досягається, коли всі ймовірності рівні.

