В статье показали несколько способов, как это сокращают:
— recursive summarization вместо хранения полной истории;
— distilled system prompts с короткими инструкциями;
— RAG-память через vector DB;
— LLMLingua для удаления “мусорных” токенов.
обычный prompt на 42 токена сократили до 12 без потери смысла, а summarization уменьшил общий контекст со 109 до 36 токенов.
Сейчас индустрия постепенно приходит к тому, что memory management становится не менее важным, чем сами модели. Потому что при масштабных agent loops стоимость контекста начинает убивать inference быстрее, чем качество модели помогает.
Please open Telegram to view this post
VIEW IN TELEGRAM
Главная идея:
вместо выдачи агенту полноценной Linux-машины модель получает только ограниченный набор функций и возможность писать код (“code mode”).
— меньше tool calls;
— ниже latency и стоимость agentic loops;
— безопасное выполнение без доступа к FS/сети по умолчанию;
— snapshot/resume execution;
— более дешёвую альтернативу sandbox/VM-инфраструктуре.
Monty запускается за микросекунды и ориентирован на production AI-агентов с узкими задачами, а не на full autonomous computer-use.
Please open Telegram to view this post
VIEW IN TELEGRAM
Идея Trust Layer в том, чтобы перестать проверять конкретный сценарий выполнения. Вместо этого поведение агента представляется как граф состояний, построенный на успешных запусках. Из него выделяются только “обязательные” точки — те состояния, без которых успех невозможен, а всё остальное считается вариативным шумом.
Это снижает ложные падения в CI и делает поведение агентов более объяснимым, но требует эталонных успешных прогонов и частично опирается на LLM для сравнения состояний.
Please open Telegram to view this post
VIEW IN TELEGRAM
Фокус — не просто внедрение AI, а создание инфраструктуры “общественной пользы”: инструменты для анализа медицинских данных, ускорения разработки вакцин и терапии, улучшения прогнозов распространения заболеваний, а также образовательные системы для школ в США, Африке и Индии.
По сути, это попытка превратить LLM в слой инфраструктуры для глобальных социальных систем — от медицины до рынка труда.
Please open Telegram to view this post
VIEW IN TELEGRAM
Главное обновление — встроенный code interpreter. Теперь агент может сам писать и выполнять код внутри runtime, управлять tool calling, хранить промежуточное состояние и не гонять всё через контекст модели. Это снижает latency и расход токенов.
— harness profiles для эффективной работы open-weight моделей вроде Qwen и DeepSeek;
— Delta Channels, уменьшающие storage checkpoint’ов до 100x;
— typed streaming для realtime agent UI;
— ContextHub для versioned memory и навыков агентов.
Тренд становится всё заметнее: AI-агенты превращаются не просто в “LLM с тулзами”, а в полноценные execution-системы со своим runtime, памятью и orchestration layer.
Please open Telegram to view this post
VIEW IN TELEGRAM
Фокус — не просто autocomplete, а полноценная AI-assisted разработка: agentic workflows, context engineering, GitHub Actions и работа с Copilot как с активным участником процесса разработки внутри VS Code.
— English;
— Spanish;
— Portuguese;
— Chinese;
В программах:
TypeScript, React, Tailwind, Python, FastAPI, HTMX, Agent Mode и автоматизация workflow через GitHub Copilot + GitHub Actions.
Тренд становится очевидным:
Copilot всё меньше выглядит как “умный автокомплит” и всё больше — как AI development environment поверх IDE.
Please open Telegram to view this post
VIEW IN TELEGRAM
Типовой цикл выглядит так: пайплайн падает → агент получает логи → определяет причину (например, ошибка Terraform или сеть) → предлагает конкретный фикс или открывает pull request.
Please open Telegram to view this post
VIEW IN TELEGRAM
Несмотря на крайне слабое железо, устройство смогло выдавать связные ответы локально — правда, очень медленно: генерация одного токена занимала несколько секунд. 2-битная версия модели работала быстрее, но давала бессмысленный вывод, а 8-битная уже не помещалась в ресурсы устройства.
Please open Telegram to view this post
VIEW IN TELEGRAM
Система анализирует форму головы и положение волос, после чего робот выполняет стрижку автоматически. Стоимость таких сеансов, по сообщениям, может составлять около $60, но главный вопрос пока не в цене, а в качестве работы с разными типами волос, движением человека и сложными стилями.
Если технология станет надёжной, AI-роботы могут начать массово заходить в сферу бытовых услуг — от бьюти-индустрии до диагностики и wellness-сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Стартап Luna Zone открыл waitlist на Luna Band — AI-носимое устройство с голосовым интерфейсом и собственной системой LifeOS. Вместо обычного трекинга браслет анализирует состояние организма в реальном времени и формирует персональный план дня буквально по часам.
LifeOS объединяет данные с браслета, привычки пользователя, показатели здоровья и медицинский контекст, после чего динамически перестраивает рекомендации: когда тренироваться, отдыхать, работать или восстанавливаться. Управление происходит через уведомления на запястье и приложение с отдельными AI-модулями для стресса, сна, питания и продуктивности.
😈 Проект явно делает ставку не на массовый фитнес-трекинг, а на рынок high-performance lifestyle — людей, которые хотят оптимизировать энергию, восстановление и эффективность через AI.
LifeOS объединяет данные с браслета, привычки пользователя, показатели здоровья и медицинский контекст, после чего динамически перестраивает рекомендации: когда тренироваться, отдыхать, работать или восстанавливаться. Управление происходит через уведомления на запястье и приложение с отдельными AI-модулями для стресса, сна, питания и продуктивности.
😈 Проект явно делает ставку не на массовый фитнес-трекинг, а на рынок high-performance lifestyle — людей, которые хотят оптимизировать энергию, восстановление и эффективность через AI.
Такой скачок показывает, насколько быстро корпоративный рынок начал платить за Claude, AI-инструменты для программирования и доступ к крупным языковым моделям. Anthropic, основанная только в 2021 году, уже обсуждается в контексте потенциальной оценки около $2 трлн — на уровне крупнейших мировых тех-компаний.
Please open Telegram to view this post
VIEW IN TELEGRAM
За первый месяц AI нашёл более 10 000 критических и высокоопасных уязвимостей в системах Cloudflare, Mozilla, Oracle и других крупных компаний. По словам Anthropic, проблема уже не в поиске багов, а в том, что люди не успевают их проверять и исправлять.
Фактически AI начинает менять саму кибербезопасность: теперь мощные модели способны находить дыры быстрее, чем индустрия успевает выпускать патчи.
Please open Telegram to view this post
VIEW IN TELEGRAM
Из Copilot Web уже убрали Gemini-модели и часть OpenAI-моделей вроде GPT-5.2 Codex. Теперь GitHub делает ставку на ограниченный набор «проверенных» моделей с более стабильным качеством.
Похоже, индустрия постепенно уходит от идеи «дать пользователю все модели сразу» к модели, где AI сам выбирает лучший движок под задачу.
Please open Telegram to view this post
VIEW IN TELEGRAM
Первой версией стала Gemini Omni Flash, которая уже умеет генерировать и редактировать видео через обычный диалог. Пользователь может загружать свои ролики, менять объекты, персонажей, окружение и даже полностью перестраивать сюжет с сохранением логики сцены.
Фактически компания делает шаг к универсальному AI-редактору, где любое фото, видео, текст или голосовая команда становятся отправной точкой для создания нового контента.
Please open Telegram to view this post
VIEW IN TELEGRAM
В эксперименте GPT-4.5 с правильно настроенной персоной принимали за человека в 73% случаев — чаще, чем реальных людей. Модель LLaMA 3.1 показала результат 56%, что статистически оказалось неотличимо от человека.
Исследование показывает, что современные модели становятся всё более убедительными собеседниками, а отличить человека от ИИ в интернете становится всё сложнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
По мнению автора, это говорит о том, что язык может работать как самопорождающаяся система, где слова рождают новые слова, идеи и образы без необходимости постоянно обращаться к объективной реальности. Он предполагает, что человеческое мышление во многом устроено похожим образом: мы часто формулируем мысли прямо в процессе разговора, а не извлекаем их из заранее готовой «модели мира».
Please open Telegram to view this post
VIEW IN TELEGRAM
По его мнению, будущее за агентами, которые смогут самостоятельно писать, запускать и изменять код. Для этого Docker развивает специальные песочницы (sandbox), где ИИ-агенты получают полную свободу действий внутри изолированной среды без риска для основной системы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Среди ключевых новинок — Antigravity 2.0 для разработки и оркестрации агентов, Managed Agents API с полностью управляемой инфраструктурой и обновлённый Agent Development Kit (ADK 2.0) для создания сложных агентных сетей.
Please open Telegram to view this post
VIEW IN TELEGRAM
Через специально сформированные сетевые запросы злоумышленники могли обходить ограничения на исходящий трафик и потенциально получать AWS-ключи, GitHub-токены, переменные окружения, исходный код и доступ к внутренним корпоративным ресурсам. Уязвимость была исправлена в версии 2.1.90, однако Anthropic не публиковала отдельного уведомления о проблеме безопасности.
Please open Telegram to view this post
VIEW IN TELEGRAM
Среди новых моделей выделяется Qwen3.7-Max — агентная модель для программирования, автоматизации рабочих процессов и длительного автономного выполнения задач.
Please open Telegram to view this post
VIEW IN TELEGRAM
WithGovernance(...) в стандартном MCP SDK.Инструмент автоматически сканирует зарегистрированные MCP-инструменты на признаки prompt injection, tool poisoning, typosquatting, скрытые инструкции и другие угрозы ещё до запуска сервера. Во время выполнения политики могут ограничивать доступ к инструментам, учитывать идентичность агента и блокировать нежелательные вызовы. Дополнительно система анализирует ответы инструментов, удаляя потенциально опасные инструкции, утечки секретов и ссылки для эксфильтрации данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1