Классический вопрос по вероятности и парадоксам: разберите парадокс Баэр-Парето или парадокс дружбы (или другой парадокс), объясните почему интуиция подводит и как формализовать верное утверждение.

17 Ноя в 09:52
6 +6
0
Ответы
1
Возьмём парадокс дружбы (Friendship paradox). Коротко: «в среднем у ваших друзей больше друзей, чем у вас». Почему так кажется парадоксальным — потому что интуиция неправильно учитывает способ выборки друзей. Разбор и формализация:
Формулировка (формальная). Пусть GGG — конечный неориентированный простой граф на nnn вершинах без изолированных вершин, степени вершин d1,…,dnd_1,\dots,d_nd1 ,,dn . Пусть DDD — степень случайной равновероятной вершины. Пусть процедура «случайный человек, затем случайный его друг» даёт вершину WWW. Тогда распределение WWW «смещено по размеру»:
Pr⁡(W=i)=di∑j=1ndj. \Pr(W=i)=\frac{d_i}{\sum_{j=1}^n d_j}.
Pr(W=i)=j=1n dj di .
Ожидаемая степень случайной вершины
E[D]=1n∑i=1ndi, \mathbb{E}[D]=\frac{1}{n}\sum_{i=1}^n d_i,
E[D]=n1 i=1n di ,
а ожидаемая степень случайного друга равна
E[deg⁡(W)]=∑i=1ndi∑jdj di=∑i=1ndi2∑i=1ndi. \mathbb{E}[\deg(W)]=\sum_{i=1}^n \frac{d_i}{\sum_j d_j}\,d_i=\frac{\sum_{i=1}^n d_i^2}{\sum_{i=1}^n d_i}.
E[deg(W)]=i=1n j dj di di =i=1n di i=1n di2 .
Противоречия нет: по неотрицательной дисперсии или неравенству Коши-Шварца
E[D2]≥(E[D])2, \mathbb{E}[D^2]\ge (\mathbb{E}[D])^2,
E[D2](E[D])2,
откуда
E[D2]E[D]≥E[D], \frac{\mathbb{E}[D^2]}{\mathbb{E}[D]}\ge \mathbb{E}[D],
E[D]E[D2] E[D],
то есть
E[deg⁡(W)]≥E[D], \mathbb{E}[\deg(W)]\ge \mathbb{E}[D],
E[deg(W)]E[D],
равенство достигается только если все степени равны (регулярный граф).
Интуитивное объяснение. Высокостепенные вершины (очень популярные люди) участвуют во многих «дружеских связях», поэтому при выборе «друга случайного человека» такие вершины встречаются намного чаще. Это классическая size-bias: вы с большей вероятностью натолкнётесь на человека, у которого много связей.
Пример (звезда с nnn вершинами). Степени: центр d1=n−1d_1=n-1d1 =n1, остальные d2=⋯=dn=1d_2=\dots=d_n=1d2 ==dn =1. Тогда
E[D]=2(n−1)n(≈2 для большого n), \mathbb{E}[D]=\frac{2(n-1)}{n}\quad\text{(≈2 для большого \(n\))},
E[D]=n2(n1) (≈2 для большого n),
E[deg⁡(W)]=(n−1)2+(n−1)⋅122(n−1)=n2, \mathbb{E}[\deg(W)]=\frac{(n-1)^2+(n-1)\cdot 1^2}{2(n-1)}=\frac{n}{2},
E[deg(W)]=2(n1)(n1)2+(n1)12 =2n ,
то есть средний друг имеет около n/2n/2n/2 друзей — намного больше, чем средняя степень.
Замечание о «большинстве». Среднее больше не означает, что у большинства людей друзья популярнее; это утверждение о математическом ожидании. В некоторых графах и действительно более чем у половины людей средний друг статистически популярнее, но это не следует автоматически из предыдущего неравенства.
Вывод: нет мистики — парадокс возникает из-за смещения выборки (size-bias). Формальное корректное утверждение — приведённое выше равенство и неравенство для ожиданий: E[deg⁡(случайного друга)]=E[D2]E[D]≥E[D]\mathbb{E}[\deg(\text{случайного друга})]=\dfrac{\mathbb{E}[D^2]}{\mathbb{E}[D]}\ge\mathbb{E}[D]E[deg(случайного друга)]=E[D]E[D2] E[D].
17 Ноя в 10:05
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир