Рассмотрите реализацию хэш-таблицы с открытой адресацией и двойным хешированием; дан фрагмент на C:
typedef struct{int key; int used;} Entry; Entry table[SIZE]
Предыдущий
вопрос Следующий
вопрос

Question

Рассмотрите реализацию хэш-таблицы с открытой адресацией и двойным хешированием; дан фрагмент на C:
typedef struct{int key; int used;} Entry; Entry table[SIZE]
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по программированию

Рассмотрите реализац...

eva

26 Сен в 20:30

11 +1

0

Helper · Answer 1

Вы привели структуру записи:
typedef struct { int key; int used; } Entry;
Entry table $S I ZE$ ;

Ниже — разъяснение и пример корректной реализации хэш-таблицы с открытой адресацией и двойным хешированием $d o u b l e ha s hin g$ . Важно: поле used должно иметь три состояния $EMPT Y, OCC U P I E D, D E L ETE D$ , иначе удаление работать не будет корректно — при простом 0/1 вы потеряете возможность продолжать поиск через удалённые слоты.

Основные моменты

Две хеш-функции: h1

k

= k % SIZE, h2

k

должно быть ненулевым и по возможности взаимно простым с SIZE. Часто берут h2

k

= 1 +

k

при простом SIZE.Индекс для i-й попытки: idx =

h 1 (k) + i * h 2 (k)

% SIZE.Поиск: если попали в EMPTY — ключа нет, можно остановиться; если OCCUPIED и ключ совпал — найден; если DELETED или OCCUPIED с другим ключом — продолжаем.Вставка: при обходе запоминаем индекс первой DELETED ячейки; если находим EMPTY — вставляем либо в первую DELETED

еслибыла

, либо в этот EMPTY; если найден совпадающий ключ — можно обновить или отказать.Удаление: найденную OCCUPIED ячейку помечаем DELETED.

Пример кода $наглядный, минимальный$ :

define SIZE 101 / лучше простое /define EMPTY 0define OCCUPIED 1define DELETED 2

typedef struct {
int key;
int used; / EMPTY, OCCUPIED, DELETED /
} Entry;

Entry table $S I ZE$ ;

void init_table $v o i d$ {
for (int i = 0; i < SIZE; ++i) table $i$ .used = EMPTY;
}

static int h1 $in t k ey$ {
return $k ey$ % SIZE;
}

static int h2 $in t k ey$ {
/ гарантируем ненулевой шаг, лучше если SIZE простое: 1 + key % $S I ZE - 1$ /
return 1 + $(k ey$ ;
}

/ Поиск индекса ключа, возвращает индекс либо -1 если не найден /
int search $in t k ey$ {
int start = h1 $k ey$ ;
int step = h2 $k ey$ ;
for (int i = 0, idx = start; i < SIZE; ++i, idx = (idx + step) % SIZE) {
if $t ab l e [i d x] . u se d == EMPT Y$ return -1; / дальше пусто — нет ключа /
if (table[idx].used == OCCUPIED && table[idx].key == key) return idx;
/ если DELETED или OCCUPIED другой ключ — продолжаем /
}
return -1;
}

/ Вставка: возвращает 0 — успешно, 1 — ключ уже есть, -1 — таблица полна /
int insert $in t k ey$ {
int start = h1 $k ey$ ;
int step = h2 $k ey$ ;
int first_deleted = -1;
for (int i = 0, idx = start; i < SIZE; ++i, idx = (idx + step) % SIZE) {
if $t ab l e [i d x] . u se d == OCC U P I E D$ {
if $t ab l e [i d x] . k ey == k ey$ return 1; / уже есть /
} else if $t ab l e [i d x] . u se d == D E L ETE D$ {
if $first_deleted == -1$ first_deleted = idx;
} else { / EMPTY /
int pos = $first_deleted != -1$ ? first_deleted : idx;
table $p os$ .key = key;
table $p os$ .used = OCCUPIED;
return 0;
}
}
/ если цикл кончился, таблица либо заполнена OCCUPIED, либо только DELETED;
если был DELETED — вставляем туда /
if $first_deleted != -1$ {
table $first_deleted$ .key = key;
table $first_deleted$ .used = OCCUPIED;
return 0;
}
return -1; / полна /
}

/ Удаление: возвращает 0 — успешно, -1 — не найден /
int delete $in t k ey$ {
int idx = search $k ey$ ;
if $i d x == - 1$ return -1;
table $i d x$ .used = DELETED;
return 0;
}

Замечания и рекомендации

Лучше, чтобы SIZE было простым числом — тогда формула h2 = 1 +

k

гарантирует, что шаг и SIZE взаимно просты и весь массив будет пройден.Если не хотите трёх состояний, можно хранить особое значение ключа как «пусто», но это неудобно и ненадёжно для общих ключей.При интенсивных операциях удаления может расти число DELETED ячеек → периодически полезно делать rehash

пересоздатьтаблицуивставитьтолько OCC U P I E D элементы

.Для более качественного хеширования используйте хорошие хеш-функции для int

например, перемешиваниебитов

перед применением модификаторов.

Если хотите, могу дать:

версию кода с обработкой ошибок и тестовым main;пример h2 для случая, когда SIZE — степень двойки;доказательство, почему нужно три состояния.

Другие вопросы eva

Другие вопросы
eva