Распределение источника символов равно p = {0.5, 0.25, 0.125, 0.125}. Вычислите энтропию источника в битах, оцените минимальную среднюю длину кодового слова при оптимальном префиксном коде (теоретически), и для бинарного симметричного канала с вероятностью ошибки ε = 0.1 вычислите ёмкость канала и поясните, какие последствия это имеет для проектирования кодов исправления ошибок

10 Ноя в 06:58
3 +3
0
Ответы
1
Энтропия источника:
H=−∑ipilog⁡2pi=−(0.5log⁡20.5+0.25log⁡20.25+0.125log⁡20.125+0.125log⁡20.125)=1.75 H=-\sum_i p_i\log_2 p_i = -\big(0.5\log_2 0.5 + 0.25\log_2 0.25 + 0.125\log_2 0.125 + 0.125\log_2 0.125\big)=1.75
H=i pi log2 pi =(0.5log2 0.5+0.25log2 0.25+0.125log2 0.125+0.125log2 0.125)=1.75
(в битах).
Минимальная средняя длина кодового слова при оптимальном префиксном коде:
для данных вероятностей (двоичные степени) оптимальный Хаффман-код даёт длины {1,2,3,3}\{1,2,3,3\}{1,2,3,3}, и средняя длина
Lmin⁡=0.5⋅1+0.25⋅2+0.125⋅3+0.125⋅3=1.75 L_{\min}=0.5\cdot1+0.25\cdot2+0.125\cdot3+0.125\cdot3=1.75
Lmin =0.51+0.252+0.1253+0.1253=1.75
то есть Lmin⁡=H\;L_{\min}=HLmin =H (точно).
Ёмкость бинарного симметричного канала (BSC) с ε=0.1\varepsilon=0.1ε=0.1:
C=1−H2(ε),H2(ε)=−εlog⁡2ε−(1−ε)log⁡2(1−ε). C=1-H_2(\varepsilon),\quad H_2(\varepsilon)=-\varepsilon\log_2\varepsilon-(1-\varepsilon)\log_2(1-\varepsilon).
C=1H2 (ε),H2 (ε)=εlog2 ε(1ε)log2 (1ε).
Численно
H2(0.1)≈0.4690,C≈1−0.4690=0.5310 бит/канал.исп. H_2(0.1)\approx0.4690,\qquad C\approx1-0.4690=0.5310\ \text{бит/канал.исп.}
H2 (0.1)0.4690,C10.4690=0.5310 бит/канал.исп.

Последствия для проектирования кодов исправления ошибок:
- Чтобы передавать информацию без ошибок при больших длинах блоков, кодовая скорость RRR должна быть меньше или равна CCC. То есть после сжатия источника до ~ 1.75\,1.751.75 бит/символ нужно обеспечивать каналовую скорость R≤0.531R\le0.531R0.531 бит/канал.исп.
- Это означает минимальное число канал.исп. на символ источника примерно
HC≈1.750.531≈3.295, \frac{H}{C}\approx\frac{1.75}{0.531}\approx3.295,
CH 0.5311.75 3.295,
т.е. в среднем нужны ≈3.3 канал.исп. на символ (на практике — целое число или большие блоки).
- Практически: сначала сжать источник (эффективно до 1.75\,1.751.75 бит/симв), затем применить код канал.с коррекцией ошибок с R≲0.53R\lesssim0.53R0.53 (например LDPC, polar, turbo) и достаточной длиной блока — чтобы приблизиться к пропускной способности; нужно учитывать требуемую остаточную вероятность ошибки, задержку и сложность декодирования.
10 Ноя в 07:19
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир