Python/ django

Идёт регистрация на Робозон — хакатон по оптимизации складских процессов от Ozon Tech.

Призовой фонд: 15 000 000 рублей.

Три задачи на выбор, два месяца на решение, один реальный бизнес-процесс, в рамках которого и нужно думать.

Какие решения ждут:
— модель движения товаров в сортировочном центре;
— проект-конструкция автосортера;
— алгоритм классификации и обработки товаров с помощью CV.

Робозон — это возможность поработать с логикой и ограничениями высоконагруженной среды. Проверить свои навыки на процессах индустрии e-com. Обсудить решения с экспертами Ozon Tech.

❤6🔥3😁2👍1🎉1

3.03K views16:18

Python/ django

🖥

10 GitHub-репозиториев для Парсинга

Сохрани, если работаешь с парсингом, RAG, LLM-пайплайнами или автоматизацией браузера.

Важно: использовать такие инструменты стоит только там, где у вас есть право собирать данные, с учётом ToS, robots.txt и лимитов сайта.

1. Firecrawl
Превращает сайт в чистый Markdown или JSON, удобный для LLM и RAG.

https://github.com/firecrawl/firecrawl

2. Crawl4AI
Краулер, который делает страницы LLM-ready без лишней настройки.

https://github.com/unclecode/crawl4ai

3. Browser Use
AI-агент, который управляет браузером: клики, формы, навигация, сбор данных через UI.

https://github.com/browser-use/browser-use

4. Crawlee
Production-фреймворк для краулинга: очереди, ретраи, браузерная автоматизация, хранение результатов.

https://github.com/apify/crawlee

5. Scrapy
Классика Python-скрейпинга. Подходит для больших краулеров и стабильных data pipelines.

https://github.com/scrapy/scrapy

6. MarkItDown
Инструмент Microsoft для конвертации PDF, Office, HTML и других форматов в Markdown.

https://github.com/microsoft/markitdown

7. Scrapling
Фреймворк для более устойчивого парсинга страниц, которые часто меняют структуру.

https://github.com/D4Vinci/Scrapling

8. scrcpy
Управление Android-устройством с компьютера. Полезно для тестирования и автоматизации mobile-only сценариев.

https://github.com/Genymobile/scrcpy

9. AutoScraper
Показываете пример нужных данных, а он сам пытается найти похожие элементы на странице.

https://github.com/alirezamika/autoscraper

10. curl-impersonate
Версия curl, которая имитирует сетевой профиль популярных браузеров. Полезно для тестов и совместимости.

https://github.com/lwthiker/curl-impersonate

Современный scraping давно перерос requests + BeautifulSoup.

Теперь это целая инфраструктура: браузерные агенты, Markdown для LLM, очереди, мобильная автоматизация и пайплайны для подготовки данных под AI.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥14❤5👍2🎉2🤩1

3.81K views18:18

Python/ django

В Python есть встроенный кэш, о котором многие забывают.

Если функция часто вызывается с одними и теми же аргументами, не всегда нужно руками писать словарь, Redis или отдельный слой кэширования.

Иногда хватает lru_cache из стандартного модуля functools.

Пример:


from functools import lru_cache

@lru_cache(maxsize=128)
def get_user(user_id):
    print("Запрос к базе")
    return {"id": user_id}

Первый вызов выполнит функцию.

Повторный вызов с тем же user_id вернёт результат из кэша.


get_user(1)  # Запрос к базе
get_user(1)  # уже из кэша

maxsize ограничивает размер кэша, а старые значения вытесняются по принципу LRU: least recently used.

Полезно для:

• тяжёлых вычислений

• запросов к API

• чтения редко меняющихся данных

• рекурсивных алгоритмов

Главное помнить: lru_cache хорошо работает, когда результат функции зависит только от её аргументов.

🎉9❤4👍4🔥1

3.19K views12:01

Python/ django

Вышел scikit-learn 1.9.

Это не релиз про «новую модную модель», а про то, что библиотека становится удобнее для реальной ML-разработки.

Главное:

• experimental callbacks

Теперь можно вешать callbacks на estimator-ы через set_callbacks() и отслеживать ключевые этапы fit.

Из коробки есть ProgressBar для прогресса и ScoringMonitor для логирования метрик.

• лучшее HTML-представление моделей

В Jupyter estimator-ы теперь показывают больше полезной информации после fit: fitted attributes, типы, значения, output features у трансформеров и пайплайнов.

Для сложных Pipeline, ColumnTransformer и FeatureUnion это реально удобнее, чем вручную копаться в атрибутах.

• новый sparse_interface

Появилась настройка:


sklearn.set_config(sparse_interface="sparray")

Она позволяет управлять тем, возвращает scikit-learn старые SciPy sparse matrix или новые sparse array.

Пока default остаётся spmatrix, но дальше библиотека будет постепенно двигаться к sparray.

• больше поддержки Array API

Часть моделей и метрик теперь лучше работает с Array API-compatible inputs.

• Narwhals как новая лёгкая зависимость

Она нужна, чтобы проще поддерживать разные dataframe-библиотеки, например pandas и polars, особенно в связке с set_output.

Обновление:


pip install --upgrade scikit-learn

https://blog.scikit-learn.org/updates/release-1-9/

❤10👍7🔥5🎉3

3.58K views12:01

Python/ django

🖥

GitHub Pages можно пересобрать почти на голом Python.

Автор показал, как сделать лёгкую платформу для хостинга статических сайтов без фреймворков и тяжёлой инфраструктуры. Только стандартная библиотека Python.

Идея простая:

• http.server отдаёт статические файлы

• небольшой Python-код добавляет логику деплоя

• автоматизация обновляет сайт после изменений

• HTTPS можно прикрутить без отдельного большого стека

Главный кайф не в том, чтобы «убить GitHub Pages», а в том, чтобы понять механику под капотом.

Статический хостинг - это не магия. Это файловая раздача, маршруты, деплой, сертификаты и немного аккуратной автоматизации.

Хороший материал для тех, кто хочет лучше понимать web-инфраструктуру, а не просто нажимать кнопку Deploy.

https://blog.klemek.fr/articles/2026-06-14/

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤2🔥1

3.92K views12:04

Python/ django

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

Как запустить своего Джарвиса за 5 минут: локальный AI-ассистент OpenJarvis

Идея простая: вместо очередного облачного чат-бота вы собираете персонального AI-помощника, который работает ближе к вашему устройству, файлам и задачам.

https://github.com/open-jarvis/OpenJarvis

👍4🔥4❤2😢1

3.36K views12:02

Python/ django

Forwarded from Machinelearning

Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке.

Главная идея: модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.

По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.

Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.

Цена для разработчиков до 31 августа 2026:

• $2 за 1 млн input tokens
• $10 за 1 млн output tokens

Потом стандартная цена:

• $3 за input
• $15 за output

Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.

По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.

https://www.anthropic.com/news/claude-sonnet-5

❤10👍7🔥5

3.3K views18:05

Python/ django

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Мы это не заслужили )

😁45❤3🔥2😢2🎉2👍1

3.22K views07:01

Python/ django

Array API + JIT: как ускорять scientific Python без CUDA C

Quansight разобрали важную проблему: Array API помогает писать код под разные array-бэкенды, но в SciPy и похожих библиотеках много compiled-кода, который сложнее переносить на GPU и multicore CPU.

Авторы предлагают использовать Array API + JIT/AOT-компиляцию как альтернативу ручным специализированным kernels.

На примере SciPy RBF interpolator авторы показывают, что такой подход может дать серьёзный прирост производительности на CUDA без написания CUDA C-кода.

Scientific Python постепенно уходит от модели «пишем отдельную реализацию под каждое железо» к более удобному стеку, где один код может работать быстрее на разных backend’ах.

https://labs.quansight.org/blog/array-api-aot-jit

@pythonl

❤3🔥2👍1

2.01K views07:10

Python/ django

🖥

«Git Pro: от первого коммита до уровня senior» — на Stepik
Пятница, 17:58.

Вы пишете git push --force. И понимаете, что были не в той ветке.

Дальше два сценария. Первый: холодный пот, звонок тимлиду, испорченные выходные. Второй: git reflog, две команды, всё на месте, идёте домой.

Разница между этими сценариями - этот курс.
Git изнутри. Rebase без страха. Конфликты по алгоритму. Pull Request, code review, защита веток, CI/CD. Три модели ветвления - выберете свою.

Скидка 58%, 48 часов: https://stepik.org/course/284799/

Please open Telegram to view this post

VIEW IN TELEGRAM

❤1👍1🔥1

1.05K views19:23

Python/ django

Wagtail как Django admin на стероидах

Хороший разбор для Django-разработчиков: Wagtail можно использовать не только как CMS, но и как более удобную админку для обычных Django-моделей.

Смысл простой: Django admin быстро даёт UI вокруг моделей, но кастомизация часто превращается в боль. Wagtail даёт более современный интерфейс, нормальную работу с полями, группировку через panels, роли, permissions, rich text, media library, versioning и редакторские workflow.

При этом не нужно переписывать проект под CMS-логику. Wagtail ставится как обычный Django-пакет, добавляется в INSTALLED_APPS, подключается в urls.py, а бизнес-логика, views, forms и templates остаются обычными Django.

Самый практичный случай использования : взять существующий admin.py, перенести модели в Wagtail snippets и постепенно заменить старую админку там, где нужен интерфейс, который не стыдно показать клиенту.

Для внутренних тулзов, CRM, backoffice и контентных разделов это может быть намного приятнее, чем бесконечно допиливать стандартный Django admin.

https://timonweb.com/wagtail/wagtail-as-django-admin-on-steroids/

👍3

697 views20:40

About

Blog

Apps

Platform