В следующем фрагменте Python-функции намереваются найти k‑й наименьший элемент массива, но она работает неверно для некоторых входов: def kth_smallest(arr, k): pivot = arr[0] left = [x for x in arr if x pivot] if k
Предыдущий
вопрос Следующий
вопрос

Question

В следующем фрагменте Python-функции намереваются найти k‑й наименьший элемент массива, но она работает неверно для некоторых входов: def kth_smallest(arr, k): pivot = arr[0] left = [x for x in arr if x pivot] if k
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

В следующем фрагмент...

eva

12 Окт в 08:16

4 +1

0

Helper · Answer 1

Ниже — разбор проблем в исходном фрагменте, исправленный вариант и оценка сложности.

Исходный код:
def kth_smallest $a rr, k$ :
pivot = arr $0$ left = [x for x in arr if x < pivot]
right = [x for x in arr if x > pivot]
if k <= len $l e f t$ :
return kth_smallest $l e f t, k$ elif k == len $l e f t$ + 1:
return pivot
else:
return kth_smallest $r i g h t, k - l e n (l e f t) - 1$

Основные логические ошибки и ситуации, приводящие к неправильному поведению или падению

Дубликаты равные pivot теряются. Компрехеншены left и right исключают элементы == pivot

кромесамого p i v o t

, поэтому элементы, равные pivot, никуда не попадают. Пример: arr =

2, 2, 2

, k = 2 — функция рекурсивно вызовет себя на пустом right и упадёт или зациклится.Неправильная обработка случаев, когда k попадает в диапазон равных pivot

еслиихбольшеодного

. Код считает только один pivot, поэтому для k внутри блока равных вернёт неверный ответ.Нет проверки границ k (k < 1 или k > len(arr)) — возможны неверные вызовы или бесконечная рекурсия.Нет явного базового случая для пустого массива — вызов на пустом списке приведёт к arr

0

и падению.Выбор pivot = arr

0

делает алгоритм чувствительным к порядку входа

например, уже отсортированный массив даст худшую производительность O(n^2)

. Для среднего времени лучше выбирать случайный pivot или применять медиану из трёх.

Исправленный простой вариант $разделениенатричасти — меньше / равно / больше, случайный p i v o t$ :
import random

def kth_smallest $a rr, k$ :
if not 1 <= k <= len $a rr$ :
raise IndexError("k is out of bounds")
if len $a rr$ == 1:
return arr $0$ pivot = random.choice $a rr$ lows = [x for x in arr if x < pivot]
pivots = $x f or x ina rr i f x == p i v o t$ highs = [x for x in arr if x > pivot]

if k <= len

l o w s

:
return kth_smallest

l o w s, k

elif k <= len

l o w s

+ len

p i v o t s

:
return pivot
else:
return kth_smallest

hi g h s, k - l e n (l o w s) - l e n (p i v o t s)

Почему это исправляет ошибки

Все элементы распределяются в три группы: <pivot, ==pivot, >pivot — ничего не теряется.Если k попадает в диапазон группы равных — возвращаем pivot.Проверяем границы k и добавлен базовый случай len

a rr

== 1.Случайный pivot даёт ожидаемое линейное среднее время и предотвращает злостные паттерны входа.

Альтернатива для экономии памяти: in-place quickselect $L o m u t o / Ho a re$ . Она использует обмены в массиве и работает с индексами $O (1) дополнительнойпамяти, рекурсивнаяглубина — O (l o g n) всреднем$ . Вот простой in-place $L o m u t o$ вариант:

import random

def partition $a, l o, hi$ :
pivot = a $hi$ i = lo
for j in range $l o, hi$ :
if a $j$ < pivot:
a $i$ , a $j$ = a $j$ , a $i$ i += 1
a $i$ , a $hi$ = a $hi$ , a $i$ return i

def quickselect_inplace $a, k$ :
if not 1 <= k <= len $a$ :
raise IndexError("k is out of bounds")
lo, hi = 0, len $a$ - 1
k_index = k - 1
while lo <= hi:

случайный выбор опорного элемента pivot_index = random.randint

l o, hi

a

pivot_index

, a

hi

= a

hi

, a

pivot_index

p = partition

a, l o, hi

if p == k_index:
return a

p

elif p > k_index:
hi = p - 1
else:
lo = p + 1
raise RuntimeError

" u n re a c hab l e "

Оценка сложности
1) Исправленная версия с созданием новых списков $первыйвариант$ :

Среднее

ожидаемое

время: O

n

— при случайном выборе pivot ожидается линейная сложность.Худшее время: O

n^2

— если pivot постоянно очень плох

например, всегдаэкстремальныйэлемент

.Доп. память

пиковая

: в среднем O

n

присбалансированныхразделенияхсуммарныеразмерысписковпоуровнямрекурсииограничены O (n)

, но в худшем случае

сильнонеудачныеразбиения, рекурсияглубиной O (n)

— O

n^2

из‑за накопления копий списков на стеке вызовов.

2) In-place quickselect:

Среднее время: O

n

Худшее время: O

n^2

зависитотвыбора p i v o t; можноуменьшитьвероятностьплохогослучаярандомизациейилимедианойизтрёх

Доп. память: O

1

дополнительной памяти

изменяетсямассивнаместе

плюс стек вызовов — O

l o g n

в среднем, O

n

в худшем случае

можнопереписатьитеративно, тогдастек O (1)

.

Рекомендации

Если важна простота и читабельность — использовать первый исправленный вариант с разделением на три списка и random.choice.Если важна экономия памяти и производительность в худших практических случаях — использовать in-place quickselect с рандомизированным опорным элементом.Всегда проверяйте границы k и обрабатывайте пустые массивы/базовые случаи.

Другие вопросы eva

Другие вопросы
eva