Технозаметки Малышева
11.5K subscribers
4.82K photos
1.78K videos
42 files
4.85K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bbb
Download Telegram
Agentic IAM: что это и почему это неизбежно

Важная тема в ИБ, часто сталкиваюсь последнее время. - авторизация агентов и мультиагентов в корпоративной среде.

Сложность тут в том, что это вроде бы технические учётки, но ведут они себя больше как люди.
Ну и возникает такой новый вид сущности, для которой даже Microsoft придумал отдельный тип авторизации, а некоторым цифровым ассистентам даже ID планируют раздавать.

Поэтому эта статья прям в тему, - рекомендую почитать.

Agentic IAM — это эволюция IAM, в которой центральным объектом становится автономная или полуавтономная сущность, действующая от имени делегирующей идентичности.

Ключевые отличия таких субъектов:

Эфемерность: агенты живут секунды или минуты, а не часы.

Масштаб: речь идёт о миллионах конкурентных экземпляров.

Делегирование: оркестратор поручает задачу рабочему агенту, тот — специализированному подагенту.

Контекст: права зависят от намерения, цепочки делегирования и рискового профиля, а не только от роли.

Полная статья тут:
https://agenticiam.ru/articles/agentic-iam-intro

там еще, кстати, много всего полезного.

#Agentic IAM #RBAC #ABAC #ReBAC #PBAC #cybersecurity
———
@tsingular
72🔥21👍1🆒1
Еще один пример из серии, - "ничего не знаю, но чтобы было сделано" с Гермесом.

Есть такая нетривиальная задача - закрытие номерного знака на машинах.
Не просто рандомным прямоугольником, а именно аккуратно по границе номера.

Понятно, что на всех нужных сайтах оно все уже давно делается автоматически, но интересно было попробовать чисто самому с Гермесом на дипсике v4 pro

где-то 1 час ушло на серию попыток.

стиль решения прежний, -
сначала найти методы математического анализа, а уже затем решить задачу
Что то вроде:
"ищи методы математического моделирования и статистической аппроксимации. ищи нестандартные подходы. находи границы и углы как профессиональный математик по компьютерному зрению используй анализ по цветовой дифференциации и статистический анализ изображений"

В общем, задача решена, при том что я ничего не понимаю в компьютерном зрении ;)

Навык с кодом для ИИ агента разместил в ИИзбранном

P.S. продам машину кстати. если надо - в ЛС :)

#Гермес #dev #cars #plates
———
@tsingular
👍21😁10311
Интересно, GLM 5.2 уже несколько дней гуляет на свободе (полностью открытые веса на HF)

И если посмотреть чем она лучше других лидеров, получается вот что:

- в HLE с инструментами - опережает DeepSeek v4 pro и GPT 5.5 и Gemini 3.1 pro! Отстаёт лишь от Opus 4.8

- в AIME 2026 уделывает вообще всех, даже Опус 4.8

- в GPQA-Diamond обходит DeepSeek v4 pro

- в TerminalBench 2.1 опять лучше всех кроме Опуса 4.8

Т.е. модель уверенно на втором месте в мире на сегодня по совокупности метрик при подключённых инструментах, - это именно то, что нам нужно в работе с агентами.

Есть в олламе:
https://ollama.com/library/glm-5.2

Пойду оживлю прямую подписку что-ли.

Важное уточнение от Z.AI:

GLM-5.2 и GLM-5-Turbo — продвинутые модели, созданные для конкуренции с моделью Claude Opus. Их использование будет списывать квоту с коэффициентом 3× в часы пик и 2× вне часов пик.

Мы рекомендуем переходить на GLM-5.2 для сложных задач, а для рутинных задач продолжать использовать GLM-4.7, чтобы избежать быстрого расходования квоты.

В качестве временного бонуса GLM-5.2 и GLM-5-Turbo будут потреблять только 1× квоты вне часов пик. Акция действует до конца сентября.

Часы пик: 14:00–18:00 по UTC+8.

Если вдруг у вас подписки нет, -напоминаю, что через реферралку на 10% дешевле:

👉 https://z.ai/subscribe?ic=GHAFTZRSA1

#GLM
———
@tsingular
🔥1531🫡1
Внимание — новый параметр у задач

Теперь, один из главных вызовов в разработке — научиться разделять задачи, которые мы готовы доверять агентам, с задачами, в которых мы ожидаем пристальный контроль и внимание со стороны человека

Важно: сразу оговорюсь, ответственность ВСЕГДА остаётся на инженерах, не надо задавать тупые вопросы вида "если накосячил с кодом агент, кто отвечает за результаты его труда". Тот кто агента настроил и запустил, тот кто процесс его работы организовал, тот и отвечает, ок? Теперь вернемся к вопросу как разделять

По мне, это формируется буквально парой базовых принципов:
- Чем дороже исправление тем больше человеческого внимания надо уделять (если исходить из описание архитектуры, как тех решений, которые очень дорого поменять)
- Уровень внимание должен быть достаточным, чтобы минимизировать потенциальные critical и high косяки (достаточность определяется аппетитом к риску. Больше аппетит — быстрее скорость и наоборот, как всегда, ничего не меняется)
- При повышении автономности в работе кодинговых агентов инженеры должны фокусироваться на проверке ожидаемого поведения (кликая человеком, агентами, автоматизируя тесты и код-ревью)

При этом:
- Задача человека — управлять потоком агентной работы, формировать требования и ожидания, авторизовывать результат
- Задача инженерной команды — повышать автономность и снижать количество петель обратной связи (когда агент ошибся или плохо сделал работу, она вернулась к человеку)

По факту наша текущая задача, как человеков, научится безопасно выменивать у агентов внимание человеков на скорость без потери качества. Именно этот размен несет эффективность (повышение фроупут, снижение кост ту велью). Следующие несколько лет будем двигаться в этом направлении товарищи

А вы что думаете?
7💯6🔥311🫡1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
С одной стороны хочется порадоваться за прогресс в авиамоделировании, конечно.

С другой стороны представьте рой таких под управлением ИИ.
749 км/ч,- 0.61 маха.

Все что летает сейчас,- покажутся кукурузниками.

#дроны
------
@tsingular
🤯2820🔥4👻2👍1😁1🤔1
Samsung × OpenAI: крупнейшее корпоративное внедрение

📋 Samsung Electronics развернул ChatGPT Enterprise и Codex для всех сотрудников в Южной Корее и подразделений DX по миру — более 200 000 человек.
Это крупнейшее корпоративное внедрение OpenAI.

💡 Влияние на Samsung
Samsung внедряет ИИ как базовую платформу для всей организации, а не инструмент для отдельных команд.
Harrison Kim, глава OpenAI Korea: «Samsung воспринимает ИИ как ядро для улучшения работы и инноваций сотрудников по всему миру».

Codex тут ключевой элемент: 5 млн еженедельных пользователей, рост на 800% в Корее с февраля.
Сотрудники применяют его для разработки, ревью кода и автоматизации процессов.

💼 Бизнес-контекст
Сделка расширяет партнёрство: Samsung уже поставляет полупроводники для ИИ-инфраструктуры OpenAI, теперь сотрудничество охватывает трансформацию рабочих процессов. ChatGPT Enterprise даёт защиту данных и управление доступом.

Корея — один из самых быстрорастущих рынков OpenAI: ChatGPT Edu для 47 000 студентов Сеульского университета, интеграция в KakaoTalk, корпоративные клиенты — LG, Krafton, Toss, Samsung SDS.

📎 OpenAI Blog

Сумма технологий по Лему, - вы нам память, мы вам ИИ, который ускорит разработку новой электроники.

#Samsung #OpenAI #ChatGPT #Codex #Корея
———
@tsingular
🔥1252
Альянс разведок увидел риск от передовых ИИ моделей в разрушении бизнесов и даже свержении правительств через месяцы

12 июня Anthropic отключила Fable 5 для всех,- всего через три дня после релиза.
Приказ Минторга США: заблокировать доступ для любых иностранцев, включая сотрудников компании не граждан США.

📋 Через десять дней объединение киберразведки Five Eyes выпустили совместное заявление: передовые AI-модели трансформируют наступательные кибервозможности, и горизонт измеряется не десятилетиями, а месяцами.

Триггером стал звонок главы Amazon министру финансов: исследователи Amazon использовали Fable 5 для получения информации, пригодной для кибератак.

Администрация потребовала от Дарио Амодеи исправить джейлбрейк или отозвать модель — Anthropic настаивает, что ей не дали ни деталей, ни шанса.

💡 Cyberscoop добавляет: те же возможности достижимы через старые Claude Opus и Sonnet, а также через китайские open-source разработки.

В среднем Open-source отстаёт от передовых моделей на 6–8 месяцев, что означает что модели, которые еще вчера были в закрытом доступе, завтра будут нагнаны бесплатным открытыми моделями, доступными любому злоумышленнику.

💼 Рекомендации альянса — эшелонированная защита, ускоренный патчинг, отказ от устаревших систем,- в принципе ничего нового, но именно эти вектора AI-атаки и будут эксплуатировать в первую очередь.
Гонка вооружений перешла в фазу, где оружие само пишет новое оружие, и Five Eyes в очередной раз подсветили этот риск.

📎 Заявление Five Eyes · The Guardian · Forbes · CyberScoop

#FiveEyes #Anthropic #Fable #cybersecurity
------
@tsingular
🤯9🔥653🗿3😁1🆒1
Patch the Planet — OpenAI и Trail of Bits запустили инициативу по защите критического open source

📋 22 июня 2026 года OpenAI запустила инициативу Patch the Planet в рамках программы Daybreak.
Партнёр инициативы, - Trail of Bits, выделивший всю команду исследователей безопасности на 19 проектов.
HackerOne и Calif подключены для триажа и координированного раскрытия.

Схема: модели Codex Security и GPT-5.5-Cyber ищут уязвимости, инженеры Trail of Bits вручную валидируют каждую находку, пишут патчи и сопровождают их до мержа.

💡 Суть проблемы по версии OpenAI: AI ускоряет поиск уязвимостей, но находки без патчей не защищают пользователей,- они лишь заваливают мейнтейнеров отчётами.
Patch the Planet построен чтобы снизить эту нагрузку.
Каждое взаимодействие начинается с консультации с мейнтейнером: инженеры выясняют, где проекту нужна помощь — валидация уязвимостей, разработка патчей, улучшение CI/CD или долгосрочная инженерия безопасности.

💼 Результат первых недель: сотни выявленных проблем, десятки смерженных патчей, множество находок прошли через скоординированное раскрытие.

Фаззинг-лаборатория с десятками точек входа, вариантных сборок и платформ построена меньше чем за день — вручную это заняло бы несколько недель.

Конвейер поиска вариантов известных CVE извлекает структуру уязвимостей из истории, сканирует кодовые базы и фильтрует ложные срабатывания через агентов-оценщиков.

Дифференциальное тестирование реализаций одного протокола: дни вместо недель или месяцев.
Модели угроз и тесты на основе свойств, построенные на спецификациях и RFC, оставляют проектам расширенное покрытие тестами и документацию.

Участники: cURL, NATS Server, pyca/cryptography, Sigstore, aiohttp, Go, freenginx, Python и python.org.
Проектам предоставляются ChatGPT Pro, доступ к Codex Security и API-кредиты.

📎
• Блог OpenAI: openai.com/index/patch-the-planet
• Trail of Bits: trailofbits.com
• Программа Daybreak: openai.com/daybreak

#OpenAI #cybersecurity #PatchThePlanet
———
@tsingular
👍5311
Computer Use — в Hermes Agent добавили фоновое управление для macOS, Windows и Linux

📋 Hermes Agent получил кроссплатформенный инструментарий computer_use: агент кликает, печатает, скроллит и перетаскивает элементы на macOS, Windows и Linux в фоновом режиме. Курсор пользователя не двигается, фокус клавиатуры не перехватывается, виртуальные рабочие столы не переключаются, - это позволяет человеку и агенту работать на одной машине параллельно.

Под капотом: open-source cua-driver, общающийся с Hermes по MCP через stdio. На macOS используются приватные SPI SkyLight (те же, что у Codex от OpenAI), на Windows — UIA, на Linux — AT-SPI.

💡 Три режима захвата экрана:
som (скриншот с нумерацией интерактивных элементов — основной),
vision (чистый скриншот),
ax (дерево доступности без изображения — для текстовых моделей).

Ключевое отличие от аналогов: computer_use работает с любой моделью, поддерживающей инструменты, — Claude, GPT, Gemini или открытая модель на vLLM.
Никакой привязки к Anthropic-схемам.

Установка:
hermes computer-use install,

статус:
hermes computer-use status.

💼 Оптимизация токенов: сессия из 20 действий на дисплее 1568×900 тратит ~30K токенов скриншотного контекста вместо ~600K.
Четыре слоя сжатия: удаление избыточных скриншотов, очистка старых вызовов, интеллектуальная обрезка.
Безопасность: блокировка опасных shell-паттернов в действиях type, запрет деструктивных команд, режим ручного подтверждения каждого действия через approvals.mode: manual.
Драйвер обновляется вместе с Hermes (hermes update) или принудительно (hermes computer-use install --upgrade).

📎
• Документация: hermes-agent.nousresearch.com/docs/user-guide/features/computer-use
• Навык агента: hermes-agent.nousresearch.com/docs/user-guide/skills/bundled/computer-use
• Драйвер: github.com/trycua/cua

#Hermes #ComputerUse #update
———
@tsingular
❤‍🔥9🔥8533👍1
LiteLLM переписали AI-шлюз на Rust

Проект пока экспериментальный и продовый Python-шлюз не заменяет, но вектор интересный.

⚡️ Python-шлюз добавляет миллисекунды задержки к каждому LLM-запросу.
Для кодовых ИИ агентов, которые делают десятки вызовов на одну задачу, эта разница умножается и становится узким горлышком.
В Rust версии накладные транзакционные расходы меньше миллисекунды.


Совместимость с Python-версией полная: тот же config.yaml, та же схема Postgres, ключи, виртуальные ключи, команды, бюджеты, маршрутизация и резервные цепочки, - без изменений.
SDK и админка те же, просто меняется исполняемый файл.

📦 Из коробки: планировщик задач (cron, webhook, API), песочницы E2B и Daytona для изолированных запусков Claude Code, сохранение состояния агентских сессий.
В планах, - долговременные сессии, память, артефакты, хранилище.
Для промышленного использования с требованиями к доступности и нормативному соответствию пока все ещё рекомендуется LiteLLM Enterprise на Python-шлюзе.

Анонс: docs.litellm.ai/blog/litellm-rust-launch
Репозиторий: github.com/LiteLLM-Labs/litellm-rust

#LiteLLM #Rust
———
@tsingular
🔥92😁1🤔1🤯1
Forwarded from Machinelearning
📌 ICYML: главные анонсы Cursor на Compile 26

Cursor начал выкладывать на свой канал запись прошедшей на прошлой неделе конференции Compile 26.

Если коротко: Cursor окончательно перестал быть умным редактором кода и превратился в экосистему, где ИИ - полноценный кодер-коллега, а не просто продвинутый автокомплит.


🟡Релиз Cursor 3

Сооснователь Майкл Труэлл начал с интересной статистики: сейчас около 95% пользователей Cursor взаимодействуют с ним в первую очередь как с агентом, такие запросы превышают использование классического автокомплита в 5 раз. Ответом на это стал Cursor 3.

Редактор переписали с нуля, сделав его полностью агентным. Интерфейс переработали под взаимодействие с ИИ-командами, появилась поддержка рекурсивных субагентов (это когда агент может вызывать других агентов).

Отдельная фича - Design Mode: теперь можно буквально ткнуть агента в нужный элемент UI на экране, и он сам найдет и поправит соответствующий код.

🟡Cursor SDK

Стартап уходит от концепции закрытого проприетарного продукта и выпускает SDK, позволяющий расширять функционал среды под себя.

Помимо этого, прокачали CLI. Всего более 50 QoL-улучшений от комьюнити. Теперь Cursor можно интегрировать с внутренними инструментами компаний, базами данных, а также использовать сторонние API и протокол MCP.

Платформа открыта для плагинов от сообщества.

🟡Cloud Agents

Продакт-лид Кевин Нипарко уверяет, что Cursor хочет, чтобы ваши ИИ-коллеги работали 24/7, даже когда вы спите, катаете в фифу или общаетесь с клиентами.

На помошь в этом приходят облачные агенты. Под капотом - инфраструктура с изолированными виртуалками, у которых есть свои клонированные репозитории, терминал, браузер, зависимости и т.д.

Агенты могут сами запускать тесты, верифицировать работу и делать скриншоты для отчета.

Кевин привел кейс: компания Amplitude сейчас использует эту автоматизацию для миграции 20 000 React-компонентов на Tailwind.


🟡 Origin: замена GitHub

В январе 2026 года Cursor купили стартап Graphite, и его сооснователь Томас Реймерс представил новую агентную Git-платформу Origin.

Томас посетовал что классические Git и CI/CD сценарии ломаются под скоростью и объемом кода, который генерирует сейчас ИИ. Origin построен с учетом реалий:

🟢держит нагрузки от тысяч одновременно работающих агентов (синхронизация по всему миру <400 мс, 99.9% аптайм);

🟢агенты в Origin умеют самостоятельно резолвить merge-конфликты, чинить упавшие CI-тесты и отвечать на комментарии в PR, тегая кожаного только в крайнем случае.

Полноценный релиз для всех запланирован на осень этого года, пока можно постучаться в вейтлист.

🟡Cursor Mobile на iOS

Чтобы управлять агентами отовсюду, выкатили мобильное приложение, в котором видно, над чем сейчас трудится ИИ, можно аппрувить PR, разблокировать зависшие таски и просматривать скриншоты.

Если агент где-то затроил, достаточно прямо на скрине с телефона обвести проблему, написать коммент и отправить переделывать.

Бета-версия под iOS в TestFlight уже доступна. Но мест уже нет

🟡Модель на 1.5T+ параметров

Cursor развивал свою линейку моделей Composer, фокусируясь на скорости и дешевизне. Но пришло время идти ва-банк. На подходе новая модель, которая обучается прямо сейчас:

🟠1.5+ триллиона параметров (уровень GPT-4 / ClaudeOpus);

🟠Учат с нуля на кластере из более чем 100 000 GPU (привет, SpaceX);

🟠На инференс выделят в 10–20 раз больше компьюта, чем во всех предыдущих моделях;

🟠Модель проектируется для сложного планирования, архитектурных решений и использования тулзов.

Релиз состоится в ближайшие пару недель.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥176👍42👻21🏆1
Санкциям назло: китайский суперкомпьютер LineShine стал самым быстрым в мире

Система из Национального центра суперкомпьютерных вычислений в Шэньчжэне смогла показать 2.198 экзафлопса в тесте Linpack. Мало того, что это больше чем у американского El Capitan, так еще это первый результат выше 2 экзафлопс в FP64, полученный только на ядрах процессора.

Которых тут аж 13.8 млн штук – используются китайские 304-ядерные чипы LX2 на архитектуре ARMv9, объединенные сетью LingQi и работающие с памятью на HBM с ПСП до 4 ТБ/с на процессор. Каждый вычислительный узел также имеет 256 ГБ DDR5. Суммарное потребление системы – 42.2 МВт.

Мой Компьютер | MK в MAX
🔥1695👍1
😁84💯17😐1😈1