Forwarded from Python/ django
🐍 Почему Python `deepcopy()` такой медленный и что использовать вместо
Функция
🔥 Почему
1. Рекурсия на всём дереве объектов
Python проходит по каждому вложенному элементу, даже если их сотни тысяч.
2. Определение метода копирования
Для каждого объекта проверяется, можно ли вызвать
3. Memo-словарь для ссылок
Чтобы избежать бесконечных циклов при копировании (например, объект ссылается сам на себя), Python ведёт словарь уже скопированных элементов. Это полезно, но замедляет работу.
4. Реализация на чистом Python
В отличие от сериализации (`pickle`),
📊 Пример замеров скорости
💻 Результат (у вас может отличаться, но смысл тот же):
- d
- p
- р
⚡ Когда что использовать
✅ copy.deepcopy()
Подходит, если структура очень сложная, а вам нужна стопроцентно независимая копия.
✅ pickle.loads(pickle.dumps(obj))
Быстрее на больших структурах, плюс удобно, если данные нужно сохранять.
✅ json.loads(json.dumps(obj))
Хорошо для простых словарей и списков с базовыми типами.
✅ Ручное копирование (list comprehension, dict comprehension)
Лучший вариант, если вы знаете структуру данных и хотите максимум скорости.
📌 Итог
d
Если важна производительность — используйте сериализацию или ручные методы копирования, они могут быть в десятки и сотни раз быстрее.
Ставь 🔥, сохраняй себе в копилку Python-трюков, чтобы не забыть 😉
@pythonl
Функция
copy.deepcopy() кажется удобной: она создаёт полную копию объекта со всеми вложенными структурами. Но на практике она часто оказывается очень медленной и становится бутылочным горлышком в проектах. Давайте разберёмся почему так происходит и какие есть альтернативы. 🔥 Почему
deepcopy() тормозит 1. Рекурсия на всём дереве объектов
Python проходит по каждому вложенному элементу, даже если их сотни тысяч.
2. Определение метода копирования
Для каждого объекта проверяется, можно ли вызвать
__deepcopy__, или приходится идти стандартным путём. 3. Memo-словарь для ссылок
Чтобы избежать бесконечных циклов при копировании (например, объект ссылается сам на себя), Python ведёт словарь уже скопированных элементов. Это полезно, но замедляет работу.
4. Реализация на чистом Python
В отличие от сериализации (`pickle`),
deepcopy() не ускорена на уровне C, поэтому работает медленнее. 📊 Пример замеров скорости
import copy, pickle, time
data = [[i for i in range(1000)] for _ in range(1000)]
# deepcopy
start = time.time()
a = copy.deepcopy(data)
print("deepcopy:", time.time() - start)
# pickle
start = time.time()
b = pickle.loads(pickle.dumps(data))
print("pickle roundtrip:", time.time() - start)
# list comprehension (для списков списков)
start = time.time()
c = [sub[:] for sub in data]
print("manual copy:", time.time() - start)
💻 Результат (у вас может отличаться, но смысл тот же):
- d
eepcopy: ~2.5 сек - p
ickle: ~0.8 сек - р
учное копирование: ~0.02 сек (!) ⚡ Когда что использовать
✅ copy.deepcopy()
Подходит, если структура очень сложная, а вам нужна стопроцентно независимая копия.
✅ pickle.loads(pickle.dumps(obj))
Быстрее на больших структурах, плюс удобно, если данные нужно сохранять.
✅ json.loads(json.dumps(obj))
Хорошо для простых словарей и списков с базовыми типами.
✅ Ручное копирование (list comprehension, dict comprehension)
Лучший вариант, если вы знаете структуру данных и хотите максимум скорости.
📌 Итог
d
eepcopy() — это универсальный инструмент, но он платит за универсальность скоростью. Если важна производительность — используйте сериализацию или ручные методы копирования, они могут быть в десятки и сотни раз быстрее.
Ставь 🔥, сохраняй себе в копилку Python-трюков, чтобы не забыть 😉
@pythonl
https://habr.com/ru/companies/domclick/articles/804535/
https://habr.com/ru/companies/domclick/articles/942584/ - 2 обьемные статьи о мониторинге celery
#celery #monitoring
https://habr.com/ru/companies/domclick/articles/942584/ - 2 обьемные статьи о мониторинге celery
#celery #monitoring
https://mkennedy.codes/posts/python-numbers-every-programmer-should-know/ - статья\бенчмарк о производительности python
#benchmark #memory #speed #cpu
#benchmark #memory #speed #cpu
Michael Kennedy's Thoughts on Technology
Python Numbers Every Programmer Should Know
A cheat sheet of real-world timing and memory numbers to guide performance-sensitive decisions.
https://habr.com/ru/companies/spring_aio/articles/991088/ - хорошие советы по использованию redis
#redis
#redis
Хабр
Redis — это больше, чем просто кэш
Пора перестать воспринимать Redis как временное хранилище key-value. Сегодня это многофункциональный движок, объединяющий в себе брокер сообщений с поддержкой Pub/Sub, гео-БД с Spatial-индексами, и...