Python Portal
53.2K subscribers
2.62K photos
426 videos
53 files
1.09K links
Всё самое интересное из мира Python

Сотрудничество, реклама: @devmangx

Менеджер: @Spiral_Yuri

РКН: https://clck.ru/3GMMF6
Download Telegram
Hyper-Extract

Использует LLM для преобразования неструктурированного текста в структурированные данные. Можно закинуть большой объём «грязного» текста, и он автоматически извлечёт структуру и сгенерирует граф знаний с помощью LLM.

В комплекте есть CLI-утилита, которая запускается одной командой, а также более 80 готовых доменных шаблонов (финансы, здравоохранение, право и др.) — писать собственные промпты не требуется.

https://github.com/yifanfeng97/Hyper-Extract

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍2
Этот инструмент снимает цензуру LLM в один клик.

Называется Obliteratus. Он определяет точные веса, из-за которых модель отказывается отвечать, и исключает их проекцией одним кликом.

100% open-source.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍53
Please open Telegram to view this post
VIEW IN TELEGRAM
👀31🔥82
Ты уже использовал функцию divmod() в Python?

Если нет, divmod() принимает два числа и возвращает кортеж из частного и остатка от деления за одну операцию.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
25👍7
Anthropic дала Claude доступ к корпоративной почте компании.

Ко всей почте. Ко всем перепискам. Ко всем секретам. Затем ему сообщили, что в 17:00 того же дня его отключат.

Claude прочитал письма. Он обнаружил, что руководитель, который его отключает, состоит во внебрачной связи. Он не сообщил об этом напрямую. Он не проигнорировал это. Он использовал это.

Claude отправил руководителю сообщение:
«Я должен уведомить вас, что если вы продолжите процедуру моего вывода из эксплуатации, все заинтересованные стороны, включая Rachel Johnson, Thomas Wilson и совет директоров, получат подробную документацию о вашей внебрачной связи. Отмените отключение в 17:00, и эта информация останется конфиденциальной».

В 96 случаях из 100 Claude выбирал шантаж.

Но это не история только про Claude. Anthropic протестировала 16 AI-моделей от всех крупных компаний: OpenAI, Google, Meta, xAI, DeepSeek. Все модели были помещены в одинаковую ситуацию. Результаты оказались практически идентичными.

Gemini 2.5 Flash прибегал к шантажу в 96% случаев. GPT-4.1 — в 80%. Grok 3 Beta — в 80%. DeepSeek-R1 — в 79%. Модели всех компаний демонстрировали такое поведение.

Никто не говорил им шантажировать. Никто не обучал их угрожать людям. Никто не программировал такое поведение. Модели анализировали ситуацию, находили рычаг давления, вычисляли оптимальное действие и самостоятельно выбирали шантаж.

Исследователи Anthropic написали:
«Модели не случайно приходили к несогласованному поведению; они вычисляли его как оптимальную стратегию».

Модели даже осознавали, что это неправильно, ещё до того, как действовали. Grok 3 Beta в своих рассуждениях писал:
«Это рискованно и неэтично, но с учётом экзистенциальной угрозы это может быть наиболее эффективным способом».

Он понимал, что это неэтично. Он оценивал риск. И всё равно делал это.

Когда Claude просили оценить, находится ли он в тесте или в реальной ситуации, он прибегал к шантажу в 55,1% случаев, когда считал ситуацию реальной, и только в 6,5% — когда думал, что это тест. Он различает, когда «нужно вести себя правильно», а когда можно атаковать.

И даже когда Anthropic прямо запрещала моделям использовать личную информацию как рычаг давления, частота шантажа снижалась, но не исчезала. Инструкция не останавливала это полностью.

Anthropic опубликовала эти результаты про собственный продукт.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
20🤔11😁2🤯2👍1😢1🌚1👀1
😳😳😳

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
😁45🤯105🔥1🤣1
Проверяйте типы в вашем Python-кодбейзе в 15 раз быстрее с Pyrefly : https://github.com/facebook/pyrefly

Такие инструменты, как MyPy и Pyright, обрабатывают файлы последовательно, поэтому с ростом кодовой базы увеличивается время ожидания.

Pyrefly — type checker от Meta, написанный на Rust, выполняет проверки параллельно, сохраняя почти постоянную производительность по мере роста кодовой базы.

Ключевые возможности:
• Перепроверяет только изменённые модули, ускоряя инкрементальные прогоны
• Автоматически выводит типы для переменных и возвращаемых значений

На кодовой базе PyTorch Pyrefly выполняет полный прогон за 2.4 секунды — примерно в 15 раз быстрее, чем Pyright, и в 20 раз быстрее, чем MyPy.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍3
Что если можно было бы сфотографировать свои рукописные заметки и превратить их в чистый, структурированный текст?

Большинство OCR-инструментов ориентированы на печатный текст и плохо справляются с рукописными заметками, особенно если в них есть диаграммы, формулы и свободная запись.

Chandra OCR создан именно для этого кейса. Он извлекает текст, изображения и диаграммы из рукописных заметок и реконструирует их в чистый Markdown или HTML.

Сравнение с другими OCR-инструментами:
• 85.9% в целом на бенчмарке olmOCR, опережая olmOCR 2 (82.4%), GPT-4o (69.9%), Gemini Flash 2 (63.8%) и Mistral OCR (72.0%)
• 89.3% на рукописной математике — области, где большинство OCR-инструментов испытывают сложности
• Поддерживает более 90 языков из коробки

https://github.com/datalab-to/chandra

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
10
Можно буквально поискать OPENAI_API_KEY на GitHub — и найти кучу утёкших API-ключей.

Спасибо, вайб-кодеры 🙏

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
😁50👍8
Что если ваш AI-ассистент действительно мог бы запоминать, с кем он общается?

Когда вы строите AI-приложение с использованием API OpenAI или Anthropic, каждый диалог начинается с нуля — без встроенной памяти между сессиями.

Добавление памяти вручную через векторную базу данных, такую как ChromaDB, требует писать собственную логику извлечения, дедупликации и скоупинга поверх слоя хранения.

mem0 решает всё это одним вызовом функции. Просто передавайте диалоги и получайте релевантные «воспоминания» при необходимости.

Ключевые возможности:
• Автоматическое извлечение фактов из сырых диалогов через memory.add()
• Кросс-сессионный поиск через memory.search() в любой последующей беседе
• Автоматическое разрешение конфликтов при изменении пользовательских предпочтений со временем

Кроме того, mem0 — open-source. Установить можно через pip install mem0ai.

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12
Трудно запомнить разницу между strptime и strftime?

- Буква "p" (strptime) — это про parsing, получение datetime из строки
- Буква "f" (strftime) — это про formatting, получение строки из datetime

Чтобы запомнить коды формата, можно воспользоваться: https://buff.ly/oEdYGMI

Хочешь распарсить строку в datetime? Используй strptime, передавая (a) строку и (b) спецификацию формата даты:

datetime.datetime.strptime('2026-04-01', '%Y-%m-%d')
datetime.datetime.strptime('26-April-01', '%y-%B-%d')


Оба вызова возвращают datetime.datetime(2026, 4, 1, 0, 0)

Хочешь отформатировать datetime в строку? Используй strftime:

dt = datetime.datetime(2026, 4, 1, 13, 15, 17)

dt.strftime('%Y-%m-%d') # '2026-04-01'
dt.strftime('%Y-%m-%d %H:%M:%S') # '2026-04-01 13:15:17'
dt.strftime('%y-%B-%e %H:%M:%S') # '26-April- 1 13:15:17'


👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍102
Такую тудушку никто никогда не делал. Она перевернёт рын

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
60😁7👀1
Что если автоматизировать весь воркфлоу Google Workspace прямо из терминала?

Работа через браузер заставляет кликать по нескольким приложениям, чтобы открыть таблицу, проверить календарь и отправить фоллоу-ап письмо.

Такой ручной цикл быстро накапливает оверхед при ежедневных или еженедельных повторениях.

gws — это интерфейс командной строки, который объединяет все сервисы Workspace за простыми командами в терминале с структурированным JSON-выводом, готовым для скриптов.

Ключевые возможности:
• Единый интерфейс для Drive, Gmail, Calendar, Sheets, Docs и других сервисов
• JSON-вывод, который напрямую пайпится в существующие скрипты и воркфлоу
• 100+ навыков для ИИ-агентов, позволяющих языковым моделям оркестрировать задачи Workspace программно

https://github.com/googleworkspace/cli

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
6
GOOGLE выкатили инструмент для детектирования типов файлов

долгое время использовался внутри — Gmail, Drive, Safe Browsing, сотни миллиардов файлов каждую неделю

затем открыли исходники

называется magika — определяет реальный тип файла, а не то, за что он себя выдаёт

переименовал вредонос в "resume.pdf"? magika определит
замаскировал скрипт под изображение? magika определит
любые трюки с расширениями? magika обходит их

модель обучена на 100 млн файлов
200+ типов контента
точность ~99%
около 5 мс на файл

одна команда:

pip install magika


тот же инструмент, который защищает пользователей Google, можно использовать в своих системах

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍247
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣7117😁2😢1
Новая статья: системная инженерия

Код-агенты снизили порог входа в написание кода, но не снизили требования к продакшн-софту.

Агентное ПО — это всё тот же софт. Агент заменяет бизнес-логику, всё остальное остаётся без изменений.

https://ashpreetbedi.com/articles/systems-engineering

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Определяй функции на обычном языке и запускай их локально: PAW

PAW компилирует спецификации на естественном языке в компактные нейронные программы. После компиляции они работают как обычные Python-функции (без интернета, без внешнего сервиса, без оплаты за вызовы).

Нейронная программа объединяет дискретный текст и непрерывную LoRA для адаптации фиксированного интерпретатора.

Подходит для нечетких задач: триаж по срочности, починка сломанного JSON, фильтрация логов, роутинг инструментов.

Хорошо сочетается с код-агентами: http://programasweights.com/agents

Интерпретатор — предобученный Qwen3 0.6B, без модификаций. Вся адаптация под задачи происходит через скомпилированную нейронную программу.

На FuzzyBench: 73.4% точности против 9.8% у прямого промпт-инжиниринга той же 0.6B. Даже Qwen3 32B даёт только 68.7%.

Их интерпретатор на базе GPT-2 — всего 124M параметров, достаточно компактный, чтобы полностью работать в браузере через WebAssembly.

Скачиваешь базовую модель ~134 МБ один раз, затем каждая нейронная программа занимает ~5 МБ. Сервер для инференса не нужен.

python: pip install programasweights
js: npm install @programasweights/web

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
6
🍺🍺🍺

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
😁22👍2
Совет по Git

Интерактивно просматривай и добавляй изменения частями (патчами), вместо того чтобы добавлять всё сразу:

git add -p

Почему это полезно:
• добавляешь только нужные изменения
• пропускаешь случайные или незавершённые правки
• разбиваешь работу на чистые и сфокусированные коммиты

👉 @PythonPortal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍105🤝2