В данном фрагменте Python кода функция сортирует список чисел но работает медленно и иногда возвращает неверный результат: def weird_sort(a): for i in range(len(a)): for j in range(i+1,len(a)): if a[i] > a[j]: a[i], a[j] = a[j], a[i] return a; найдите логическую ошибку, оцените сложность алгоритма, предложите исправление и модификации для работы с большими объёмами данных
Предыдущий
вопрос Следующий
вопрос

Question

В данном фрагменте Python кода функция сортирует список чисел но работает медленно и иногда возвращает неверный результат: def weird_sort(a): for i in range(len(a)): for j in range(i+1,len(a)): if a[i] > a[j]: a[i], a[j] = a[j], a[i] return a; найдите логическую ошибку, оцените сложность алгоритма, предложите исправление и модификации для работы с большими объёмами данных
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по информатике

В данном фрагменте P...

eva

12 Окт в 08:19

5 +5

0

Helper · Answer 1

Коротко — логическая ошибка в отступах: функция возвращает список внутри внешнего цикла, поэтому сортировка прерывается после первой итерации и список может остаться частично отсортированным.

Разбор и исправление

Исходный код $спроблемой — re t u r n внутрицикла$ :
def weird_sort $a$ :
for i in range $l e n (a)$ :
for j in range $i + 1, l e n (a)$ :
if a $i$ > a $j$ :
a $i$ , a $j$ = a $j$ , a $i$ return a # <- возвращаем слишком рано!

Правильный вариант — return должен быть после завершения обоих циклов:
def weird_sort $a$ :
for i in range $l e n (a)$ :
for j in range $i + 1, l e n (a)$ :
if a $i$ > a $j$ :
a $i$ , a $j$ = a $j$ , a $i$ return a

Альтернативы и улучшения

1) Использовать встроенную сортировку Python $рекомендуетсядляобщегослучая — быстрая, надежная$ :
def weird_sort $a$ :
a.sort # in-place, O $n l o g n$ return a

или возвращающая новый список: return sorted

a

2) Немного оптимизировать ваш O $n^2$ -алгоритм $уменьшитьчислообменов$ — классический selection sort:
def selection_sort $a$ :
n = len $a$ for i in range $n$ :
min_idx = i
for j in range $i + 1, n$ :
if a $j$ < a $min_idx$ :
min_idx = j
if min_idx != i:
a $i$ , a $min_idx$ = a $min_idx$ , a $i$ return a

Сложность

Исходный двоичный цикл: время O

n^2

точно n (n - 1) /2 сравнений

. Количество обменов в худшем случае тоже O

n^2

висходнойверсиивыменяетеприкаждомобнаружениименьшегоэлемента

.Selection sort: O

n^2

сравнений, но только O

n

обменов.Встроенный sorted

/list.sort

: O

n l o g n

в среднем и в худшем

T im sor t

, память O

n

в худшем для некоторых сценариев, обычно работает очень быстро на реальных данных.

Работа с большими объёмами данных

Если данные в памяти помещаются: используйте list.sort или sorted. Для чисел можно рассмотреть numpy.sort $эффективнодлябольшихмассивовчисел$ .

Если данные не помещаются в ОЗУ $внешняясортировка$ :

Разбиваете файл/поток на чанки, сортируете каждый чанк в памяти и сохраняете отсортированные чанки на диск.Затем выполняете k-way merge

например, h e a pq . m er g e в P y t h o n

по отсортированным файлам, записывая результат в выходной файл.
Пример концепта

упрощённо

:
import heapq, tempfile
def external_sort

infile, outfile, chunk_size=10_000_00

:
chunks =

with open

in f i l e

as f:
while True:
chunk = list

islice(f, chunk_size)

if not chunk:
break
chunk =

in t (x) f or x in c h u nk

chunk.sort

tmp = tempfile.TemporaryFile

m o d e =^{'} w + t^{'}

tmp.writelines(f"{x}\n" for x in chunk)
tmp.seek

0

chunks.append

t m p

with open

o u t f i l e,^{'} w^{'}

as out:
for val in heapq.merge

* [ma p (in t, c) f orc in c h u nk s]

:
out.write(f"{val}\n")

Для параллельной обработки: разбить данные на части, отсортировать параллельно $m u lt i p rocess in g / M a pR e d u ce$ , затем выполнить k-way merge.

Если данные лежат в БД — сортировать средствами СУБД $индексы, OR D ERB Y с e x t er na l sor t$ .

Для очень больших потоков и простых числовых ключей можно использовать radix sort / counting sort $линейноевремя$ при ограниченном диапазоне ключей.

Коротко по практическим рекомендациям

Для большинства задач — заменить ваш код на a.sort

или sorted

a

.Если нужен in-place и вы не хотите побочных эффектов — a.sort

; return a.Если память ограничена — использовать внешнюю сортировку

c h u nk + m er g e

или системные инструменты

sor t в U ni x

.Для почти отсортированных данных insertion sort

илиоставить T im sor t

будет быстрым.

Если нужно, могу:

Подправить ваш конкретный фрагмент кода в проекте.Показать рабочую реализацию внешней сортировки с учётом чтения/записи файлов.Рассчитать примерно время и место при конкретных объёмах данных.

Другие вопросы eva

Другие вопросы
eva