Объясните поведение и сложность этого фрагмента на Python, укажите возможные ошибки и способы улучшения (включая использование структур данных):
def f(arr):
res = []
for i in range(len(arr)):
if arr[i] not in res:
res.append(arr[i])
return res
Предыдущий
вопрос Следующий
вопрос

Question

Объясните поведение и сложность этого фрагмента на Python, укажите возможные ошибки и способы улучшения (включая использование структур данных):
def f(arr):
res = []
for i in range(len(arr)):
if arr[i] not in res:
res.append(arr[i])
return res
Предыдущий
вопрос Следующий
вопрос

Главная

Вопросы и ответы

Вопросы и ответы по программированию

Объясните поведение ...

eva

3 Ноя в 19:15

4 +1

0

Helper · Answer 1

Кратко о поведении:
- Функция возвращает элементы из `arr`, оставляя только первые вхождения (удаляет повторные), сохраняет порядок.
Сложность:
- Временная: исходный код —

O(n2)\mathcal{O}(n^2)

в худшем и среднем случае, потому что для каждого из

n

элементов делается проверка `x in res` за

O(∣res∣)\mathcal{O}(|res|)

(в сумме ~

1 + 2 + ... + n

).
- Память: дополнительная —

O(n)\mathcal{O}(n)

(список `res`).
Возможные ошибки и ограничения:
- Производительность сильно падает на больших списках из‑за квадратичной сложности.
- Если `arr` не итерируемый (например, `None`) — возникнет ошибка `TypeError`.
- Предложенный метод работает с любыми объектами, сравниваемыми через `==`. При использовании ускорений с множеством (`set`) нужно учитывать, что элементы должны быть хешируемыми — иначе при добавлении в `set` будет `TypeError`.
- Если важна идентичность объектов (а не равенство), оптимизации на основе `set`/`dict` по значению изменят семантику; можно использовать `id()` для сравнения по идентичности, но это другое поведение.
Способы улучшения (с примерами):
1) Быстро и правильно для хешируемых элементов — использовать множество для проверки вхождения (сохранение порядка):
```python
def f(arr):
seen = set()
res = []
for x in arr:
if x not in seen:
seen.add(x)
res.append(x)
return res
```
- Временная сложность: в среднем

O(n)\mathcal{O}(n)

. Память:

O(n)\mathcal{O}(n)

.
2) Короткий вариант (Python 3.7+, порядок ключей в dict гарантирован):
```python
def f(arr):
return list(dict.fromkeys(arr))
```
- Работает только если элементы хешируемы; тоже в среднем

O(n)\mathcal{O}(n)

.
3) Если элементы могут быть не‑хешируемыми (например, списки), но нужно сравнение по равенству:
- Можно использовать список для `seen` как fallback (медленнее, но корректно):
```python
def f(arr):
seen = []
res = []
for x in arr:
if x not in seen:
seen.append(x)
res.append(x)
return res
```
(это снова

O(n2)\mathcal{O}(n^2)

в худшем случае).
- Или пытаться хешировать представление: `try: h = hash(x)` / `except TypeError: ...` — осторожно: преобразование в строку/кортеж может быть дорого или некорректно.
4) Если нужно сравнение по идентичности (same object), можно хранить `id`:
```python
def f_by_identity(arr):
seen_ids = set()
res = []
for x in arr:
ix = id(x)
if ix not in seen_ids:
seen_ids.add(ix)
res.append(x)
return res
```
- Сравнение по `id` != сравнение по `==`.
Рекомендация:
- Если элементы хешируемы — использовать `seen = set()` или `dict.fromkeys`, это даёт реальное ускорение до

O(n)\mathcal{O}(n)

.
- Если элементы могут быть не‑хешируемы и семантика требует равенства — либо оставить текущий подход, либо реализовать гибрид: пытаться добавить в set, при `TypeError` обрабатывать через список `seen_unhashable`.

Другие вопросы eva

Другие вопросы
eva