Дана дискретная информационная система с источником символов s={a,b,c} и вероятностями p(a)=0.5, p(b)=0.3, p(c)=0.2: вычислите энтропию источника, покажите, как строится оптимальный префиксный код (например, код Хаффмана), оцените среднюю длину кода и обсудите, какие ограничения и компромиссы возникают в практической реализации с задержкой и ошибками канала
Предыдущий
вопрос Следующий
вопрос

Question

Дана дискретная информационная система с источником символов s={a,b,c} и вероятностями p(a)=0.5, p(b)=0.3, p(c)=0.2: вычислите энтропию источника, покажите, как строится оптимальный префиксный код (например, код Хаффмана), оцените среднюю длину кода и обсудите, какие ограничения и компромиссы возникают в практической реализации с задержкой и ошибками канала
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

Дана дискретная инфо...

eva

27 Окт в 13:34

8 +8

0

Helper · Answer 1

Энтропия источника:

H=-\sum_{x\in\{a,b,c\}} p(x)\log_2 p(x)= -\big(0.5\log_2 0.5 + 0.3\log_2 0.3 + 0.2\log_2 0.2\big)

-\big(0.5\cdot(-1) + 0.3\cdot\log_2 0.3 + 0.2\cdot\log_2 0.2\big)\approx 0.5 + 0.3\cdot1.737 + 0.2\cdot2.322\approx 1.4855\ \text{бит/символ}.

Построение оптимального префиксного (Хаффмана) кода:
- Сортируем вероятности:

0.5, 0.3, 0.2

.
- Сливаем два наименьших:

0.3 + 0.2 = 0.5

. Осталось две ветви

0.5

и

0.5

.
- Присваиваем бит для верхнего разветвления; внутри объединённой ветви

0.3

и

0.2

— ещё один бит.
Один возможный код (символы и длины):

a:0\quad(\ell(a)=1),\qquad b:10\quad(\ell(b)=2),\qquad c:11\quad(\ell(c)=2).

Средняя длина кода:

\bar{L}=\sum_x p(x)\ell(x)=0.5\cdot1+0.3\cdot2+0.2\cdot2=1.5\ \text{бит/символ}.

Избыточность относительно энтропии:

\bar{L}-H \approx 1.5-1.4855 \approx 0.0145\ \text{бит/символ}.

Ограничения и компромиссы в практической реализации (задержка и ошибки канала):
- Дискретность длин: префиксные коды дают целочисленные длины бит → небольшая избыточность (здесь мала).
- Задержка: Хаффман — потоковый и мгновенный (минимальная буферизация), но для ещё более близкого к энтропии сжатия используют блочное кодирование или арифметическое кодирование, что увеличивает задержку (нужно накапливать блок).
- Чувствительность к ошибкам: переменная длина приводит к сильной локальной деградации и потере синхронизации при ошибках; фиксированная длина устойчивее. Для надёжности требуется канальное кодирование (FEC) или добавление синхросигналов, что увеличивает нагрузку и задержку.
- Изменчивость статистики: при несоответствии модели (реальные p отличаются) эффективность падает; адаптивный Хаффман исправляет это, но добавляет вычислительную сложность и возможные задержки/накладные расходы.
- Сложность реализации: простые префиксные коды лёгки в декодировании; арифметическое/асимпт. кодирование даёт лучшую эффективность, но сложнее и чувствительнее к ошибкам и точности арифметики.
Краткое резюме: энтропия ≈

1.4855

бит/символ, оптимальный префиксный код (Хаффман) даёт среднюю длину

1.5

бит/символ с очень малой избыточностью; выбор между немедленной передачей (малая задержка) и более плотным кодированием (меньше избыточности, больше задержки и чувствительности к ошибкам) — главный практический компромисс.

Другие вопросы eva

Другие вопросы
eva