В многопоточной POSIX-программе показан фрагмент: int counter = 0; void* inc(void*){ for(int i=0;i
Предыдущий
вопрос Следующий
вопрос

Question

В многопоточной POSIX-программе показан фрагмент: int counter = 0; void* inc(void*){ for(int i=0;i
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

В многопоточной POSI...

eva

10 Окт в 13:31

5 +1

0

Helper · Answer 1

Коротко — потому что ++ не атомарен. Операция counter++ разлагается на загрузку значения из памяти, увеличение и запись обратно. Два потока могут одновременно загрузить одно и то же значение, оба увеличить и записать — одно из приращений «теряется». Это классическая гонка данных $d a t a r a ce$ .

Ниже — несколько способов исправления с кратким обоснованием и влиянием на производительность.

1) Мьютекс $pthread_mutex_t$

Как исправляет: критическая секция вокруг counter++ гарантирует взаимное исключение, только один поток выполняет ++ одновременно.Пример:
include

int counter = 0;
pthread_mutex_t m = PTHREAD_MUTEX_INITIALIZER;
void inc $v o i d < / e m >$ {
for(int i=0;i<1000000;i++){
pthread_mutex_lock(&m);
counter++;
pthread_mutex_unlock(&m);
}
return NULL;
}

Производительность: простая и надёжная, но при высокой частоте коротких критических секций даёт серьёзную деградацию. Издержки: захват/освобождение мьютекса

лок / уловка

, возможные контекстные переключения при ожидании, сильное касание кеш-линий

c a c h e - l in e b o u n c in g

— фактически сериализация всех приращений.

2) Атомарные операции $C 11 s t d a t o mi c или GCC / Cl an g in t r in s i cs$

Как исправляет: атомарный инкремент выполняется как одна атомарная инструкция

илиспомощью C A S

, предотвращая потерю инкрементов.Пример

C 11

:
include

atomic_int counter = ATOMIC_VAR_INIT $0$ ;
void inc $v o i d < / e m >$ {
for(int i=0;i<1000000;i++)
atomic_fetch_add_explicit(&counter, 1, memory_order_relaxed);
return NULL;
}

Можно использовать GCC: atomic_fetch_add(&counter, 1, ATOMIC_RELAXED) или старые __sync_fetch_and_add.Производительность: быстрее, чем мьютекс в большинстве случаев, особенно если использован memory_order_relaxed

нетлишнихбарьеров

. Но при сильной конкуренции атомик всё равно вызывает кеш-бег

c a c h eco h ere n cy t r a ff i c

и становится узким местом — инкременты логически сериализуются на уровне кэш-контроля.

3) Батчинг / per-thread локальные счётчики $рекомендуемыйподходпривысокомнасыщении$

Идея: каждый поток инкрементирует локальную переменную без синхронизации, и только периодически или в конце одним атомиком добавляет накопленное значение в глобальный counter. Это сильно уменьшает количество синхронизаций.Пример:
int counter = 0; // глобальный
void inc

v o i d < / e m >

{
int local = 0;
for(int i=0;i<1000000;i++){
local++;
if

l oc a l == 1000

{ // flush каждые 1000
atomic_fetch_add(&counter, local, ATOMIC_RELAXED);
local = 0;
}
}
if

l oc a l

atomic_fetch_add(&counter, local, ATOMIC_RELAXED);
return NULL;
}Производительность: очень хорошая при больших объёмах инкрементов — минимизирует трафик кеш-линии и уменьшает количество атомик-операций.

4) Шардирование/striped counters

Идея: иметь массив счетчиков по числу потоков

илипоядрам

: каждый поток пишет только в свой слот, а финальная сумма вычисляется суммированием всех слотов.Производительность: как per-thread локальные счётчики, но более систематично предотвращает конфликт записи в одну кэш-линию

надовыравниватьслоты, чтобыизбежать f a l ses ha r in g

.

5) Детерминированное планирование / сериализация

Что это значит: сделать исполнение потоков детерминированным/последовательным

например, запускатьодинпотокдоконца, затемдругой; илииспользовать r u n t im e, которыйобеспечиваетдетерминированныеинтерлевинги

.Как исправляет: устраняет гонки за счёт отсутствия одновременного доступа, даёт строго детерминированный counter.Производительность: обычно значительно хуже, т. к. лишает программу параллелизма — если цель была ускорение за счёт многопоточности, этот подход сводит его на нет. Может быть полезен для отладки или воспроизводимого тестирования

recor d - re pl a y, D t h re a d s ит . п .

.

Дополнения по выбору памяти/порядка $m e m oryor d er in g$

Если глобальный счётчик используется только для учёта суммарных инкрементов и вам не требуется упорядоченность относительно других операций — atomic_fetch_add с memory_order_relaxed достаточно и быстрее

недаётлишнихбарьеров

.Если нужен строгий глобальный порядок, используйте memory_order_seq_cst

поумолчанию

или stronger ordering, но это может быть дороже.

Коротко о производительности и выборе

Для корректности: достаточно атомарной операции или мьютекса.Для простоты и совместного доступа с другими данными: мьютекс — самый прямой, но может стать узким местом.Для высокой производительности при большом количестве инкрементов: per-thread буферизация или sharded counters + редукция

суммированиевконце

— наилучший компромисс.Атомики — удобны и обычно быстрее мьютекса, но при очень высокой конкуренции всё равно будут замедляться из‑за кеш‑кооперации.Детерминизация решает проблему согласованности только ценой потери параллелизма; в реальных рабочих нагрузках это редко оптимально, разве что для отладки/воспроизводимости.

Резюме: причина — гонка данных. Простое исправление — использовать atomic_fetch_add $илимьютекс$ . Для максимальной производительности при интенсивных инкрементах — агрегировать в локальные счётчики или использовать полосные $s ha r d e d$ счётчики, чтобы уменьшить конкуренцию за одну память/кэш-линию.

В многопоточной POSIX-программе показан фрагмент: int counter = 0; void* inc(void*){ for(int i=0;i Предыдущий вопрос Следующий вопрос

Другие вопросы eva

В многопоточной POSIX-программе показан фрагмент: int counter = 0; void* inc(void*){ for(int i=0;i
Предыдущий
вопрос Следующий
вопрос

Другие вопросы
eva