Python Portal – Telegram

Python Portal

53.2K subscribers

2.62K photos

426 videos

53 files

1.09K links

Всё самое интересное из мира Python

Сотрудничество, реклама: @devmangx

Менеджер: @Spiral_Yuri

РКН: https://clck.ru/3GMMF6

Download Telegram

About

Blog

Apps

Platform

53.2K subscribers

Разработчик на Rust фактически «убил» Headless Chrome.

Проект называется Obscura — браузер без графического интерфейса с открытым исходным кодом, изначально заточенный под ИИ-агентов и масштабный скрейпинг.

Chrome vs Obscura:

- Память: 200MB+ → 30MB
- Бинарник: 300MB+ → 70MB
- Загрузка страницы: 500ms → 85ms
- Старт: 2s → мгновенно
- Антидетект: отсутствует → встроен

Один бинарник. Без Node, без Chrome, без зависимостей.

Стелс-режим:

→ Рандомизация отпечатка на каждую сессию (GPU, canvas, аудио, батарея)
→ 3 520 трекер-доменов заблокированы по умолчанию
→ navigator.webdriver замаскирован под реальный Chrome
→ Маскирование нативных функций, чтобы детекторы не могли их определить

Подменяет Puppeteer и Playwright через протокол отладки Chrome. Без изменений кода.

Если используются агенты или серьёзный скрейпинг в масштабе — репозиторий даёт прямую выгоду.

Полностью open source.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤20👍7🤔3

6.06K views10:07

This media is not supported in your browser

VIEW IN TELEGRAM

Райан — лучший, делает божью работу

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

😁15❤1

5.27K views12:07

MIT сделал ход, который ставит под сомнение ставки индустрии на рост контекстного окна.

Они решили проблему памяти не увеличением «окна», а сменой модели работы с данными.

Проблема.

У любой модели есть предел — контекстное окно. При его переполнении возникает деградация качества: факты теряются, связи между частями текста исчезают, ответы становятся хуже.

Это называют «деградацией контекста».

Что делали раньше.

RAG (генерация с извлечением):

- документ режется на чанки
- хранится во внешнем хранилище
- перед запросом извлекаются «релевантные» куски

Проблемы:

- извлечение делает предположение до чтения
- ошибки в выборе → модель не видит нужные данные
- связи между частями документа разрушаются

Подход MIT.

Документ не помещается в контекст вообще.

Он хранится вне модели, например как переменная.
Модели сообщается, что данные существуют и как к ним обращаться.

Дальше модель:

- пишет код для поиска
- использует регулярные выражения
- извлекает нужные фрагменты
- подгружает только релевантные части

Ключевой момент.

Обработка становится рекурсивной:

- модель находит релевантные участки
- запускает подзадачи (сабагенты) для их анализа
- агрегирует результат

Нет сжатия, нет потерь, нет переполнения контекста.

Результаты.

- обработка до ~10 млн токенов
- значительный прирост качества на задачах с длинным контекстом
- стоимость сопоставима с обычными запросами

Вывод.

Фокус смещается:

не «сколько текста держать в голове»,
а «как эффективно к нему обращаться».

Модель начинает работать как разработчик с доступом к данным:

поиск → извлечение → анализ → агрегация.

Ссылки:

- Статья: http://arxiv.org/abs/2512.24601
- Код: http://github.com/alexzhang13/rlm

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

Recursive Language Models

We study allowing large language models (LLMs) to process arbitrarily long prompts through the lens of inference-time scaling. We propose Recursive Language Models (RLMs), a general inference...

❤13🔥5

5.24K views06:07

This media is not supported in your browser

VIEW IN TELEGRAM

F = q(E + v \times B)

Наблюдать, как сила Лоренца из абстракции из учебника превращается в 30 000 об/мин в реальном времени — чистый дофамин.

В какой-то момент поток магнитного поля уже воспринимается как физическое размытие.

Большинство видит «крутящуюся игрушку», но по факту это векторное произведение скорости и магнитного поля, дающее силу, создающую момент на якоре. Это и есть практическое проявление уравнений Максвелла — не формулы, а реальная физика в работе.

Это демонстрация базового принципа работы коллекторных электродвигателей постоянного тока.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥32❤14👀6🤣2👍1

5.11K views12:07

GitHub-репозитории, чтобы прокачать Python

- Веб-разработка с Django — https://github.com/django/django
- Инструментарий для Data Science — https://github.com/rasbt/python-machine-learning-book
- Алгоритмические задачи — https://github.com/TheAlgorithms/Python
- Рецепты машинного обучения — https://github.com/ageron/handson-ml2
- Лучшие практики тестирования — https://github.com/pytest-dev/pytest
- Скрипты для автоматизации — https://github.com/soimort/you-get
- Продвинутые концепции Python — https://github.com/faif/python-patterns

Кидайте в закладки и делитесь с коллегами 🌟

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15

5.2K views16:07

Чёрт… хакеры это точно оценят.

Кто-то выложил в опенсорс универсальный тулкит для взлома, который объединяет все основные инструменты пентеста в одно CLI-меню.

Ставишь один раз — и сразу получаешь доступ к инструментам из всех категорий: анонимность, сбор информации, атаки на беспроводные сети, подбор паролей, сканирование веба, фреймворки эксплуатации, генерация полезной нагрузки и т.д.

Называется HackingTool.

→ Одно меню запускает Tor, Anonsurf, Macchanger и цепочки прокси за секунды
→ Включает Nmap, Dracnmap, RED HAWK и ReconSpider для полной разведки сети
→ Содержит SQLMap, XSStrike, WPScan и SecretFinder для эксплуатации веба
→ Есть John the Ripper, Hashbuster и BruteX для атак на пароли

51K звёзд. Работает на любом Linux-дистрибутиве.

Полностью опенсорс.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤22👍8

5.54K views06:07

Forwarded from Айти мемы

Media is too big

VIEW IN TELEGRAM

Использую Claude Opus 4.7, чтобы отцентрировать div

😁35❤4🤣2

5.05K views12:07

Если тебе нужны 3+ вложенных цикла — остановись и отрефактори.

Глубокую вложенность лучше избегать: такой код сложнее читать и поддерживать.

Цель всегда одна — читаемость и поддерживаемость.

Если ловишь себя на глубокой вложенности, остановись и подумай, можно ли сделать это понятнее. Использование библиотеки часто будет лучшей альтернативой.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

❤13👍6

5.22K views16:07

Если видишь одну и ту же переменную по обе стороны and, обрати внимание на этот синтаксический сахар:

x, y, z = 20, 15, 3

# Традиционный способ с 'and'
if x > y and y > z:
    ...

# Питоничный способ — цепное сравнение
if x > y > z:
    ...

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24🤔1

5.12K views06:07

Ну что, проверим ваши знания?

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

😁17❤3🌚3

5.14K views12:07

Не усложняй методы startswith и endswith.

Когда нужно проверить, начинается ли строка с одного из нескольких вариантов, не используй цикл — передай кортеж, и метод сам проверит совпадение с любым из значений в кортеже.

user_string = input()
starts = ('One', 'Two', 'Three')

# Переусложнённо
for s in starts:
    if user_string.startswith(s):
        # Сделать что-то и выйти
        break

# Чистый вариант
if user_string.startswith(starts):
    # Сделать что-то

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍19❤3

5.08K views16:07

Твой ПК скоро станет по-настоящему «умным».

Aiden — это полноценная ИИ-операционная система, которая работает на 100% локально на Windows или Linux:

- 1500+ компонуемых навыков
- 89+ автономных инструментов
- Управляет мышью, клавиатурой, экраном и приложениями (по сути как JARVIS)
- 6-слойная память + граф знаний
- Рой сабагентов, работающих параллельно
- Голос + каналы (Discord, Telegram, WhatsApp…)

Всё офлайн через Ollama.
Без аккаунтов.
Без телеметрии.
Без отправки данных в облако.

Это не чат-бот — это ассистент, который живёт внутри твоей машины.

Будущее персонального ИИ уже здесь, и оно с открытым исходным кодом.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔19❤5

5.46K views06:07

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

😁21

4.76K views12:07

Хотите освоить анализ данных, но не знаете, с чего начать?

Центр непрерывного образования ФКН НИУ ВШЭ запускает онлайн-программу профессиональной переподготовки «Практический анализ данных» — полный цикл обучения от нуля до уровня практикующего аналитика.

Что вас ждет:
🟣Python для автоматизации и анализа данных: от первых строк кода до Pandas и визуализации
🟣SQL на продвинутом уровне: оконные функции, индексы, партиционирование, оптимизация запросов
🟣Прикладная статистика и A/B-тестирование: проверка гипотез, планирование экспериментов, работа с малыми выборками
🟣Основы машинного обучения: регрессия, классификация, кластеризация
🟣Дашборды в Tableau и Yandex DataLens
🟣Продуктовая аналитика: метрики, сегментация, приоритизация гипотез
🟣Хранилища данных: архитектура DWH, Hadoop, Spark, ETL, Airflow

Преподаватели — практикующие специалисты из Wildberries, Вкусно — и точка и других компаний. По окончании вы получите диплом о профессиональной переподготовке НИУ ВШЭ.

📁

Старт: 12 мая.

Подробнее о программе

📍

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4😢1

5.06K views14:21

f-строки в Python:

* Перед строкой ставится f
* Возвращается обычная строка
* Выражения в {} вычисляются и подставляются

x = 5
y = 7
f'{x} + {y} = {x+y}'  # 5 + 7 = 12

x = [1, 2]
y = [3, 4]
f'{x} + {y} = {x+y}'  # [1, 2] + [3, 4] = [1, 2, 3, 4]

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤4🤔1

5.14K views16:07

Нужно округлить даты/время в Pandas:

* dt.floor — вниз (к предыдущему интервалу)
* dt.ceil — вверх (к следующему интервалу)
* dt.round — к ближайшему интервалу

Пример:

s.dt.floor('3h')   # предыдущий 3-часовой слот
s.dt.ceil('15m')   # следующий 15-минутный слот
s.dt.round('1D')   # ближайшие сутки

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🔥3❤2

5.13K views06:07

Нужно обнулить время (до полуночи) в серии datetime в Pandas — используется dt.normalize:

df['x'].dt.normalize()

На выходе та же серия datetime, но у всех значений время 00:00:00.

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8

4.38K views16:07

Теперь можно искать по PDF на 500 страниц без чанкинга и без векторизации.

Андрей Карпати недавно озвучил идею:

что если база знаний работает как вики, а не как векторная база?

OpenKB — open-source CLI, построенный вокруг этой концепции.

Он компилирует сырые документы в структурированную связанную вики-систему с помощью LLM.

Знания накапливаются, а не пересобираются при каждом запросе.

В классическом RAG контекст каждый раз восстанавливается заново. Здесь модель опирается на уже построенную структуру.

Длинные PDF разбираются через PageIndex — древовидный индекс без векторов, который позволяет рассуждать по структуре документа.

Что получается на выходе:

> авто-суммаризация и страницы концептов
> кросс-ссылки между документами
> детект противоречий и пробелов
> режим наблюдения за изменениями
> markdown, совместимый с Obsidian

Поддерживаются PDF, Word, PowerPoint, Excel, HTML и изображения.

Таблицы и фигуры извлекаются нативно.

Один новый файл может автоматически обновить до 15 страниц в вики.

База знаний начинает сохранять то, что уже было выучено.

https://github.com/VectifyAI/OpenKB

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥12❤8👍3🤔1🤝1

5.2K views06:07

👉

Please open Telegram to view this post

VIEW IN TELEGRAM

😁52❤6👍2

4.54K views12:07