How to AI
2.24K subscribers
506 photos
31 videos
4 files
93 links
Про ИИ, ИТ и цифровизацию 🔝

🔺Тренды,обзоры достижений ИИ, воркшопы, митапы в KZ и странах СНГ
🔺Применение ИИ в бизнесе и различных областях

🗣Александр Ермаков - сооснователь Awara IT, ex-Regional Director & Microsoft MVP
Download Telegram
🌟 Одна из главных проблем agentic AI — стоимость длинных циклов работы. Каждый новый шаг агента тащит за собой весь предыдущий контекст, из-за чего расход токенов растёт не линейно, а почти квадратично.

В статье показали несколько способов, как это сокращают:
— recursive summarization вместо хранения полной истории;
— distilled system prompts с короткими инструкциями;
— RAG-память через vector DB;
— LLMLingua для удаления “мусорных” токенов.

➡️ Пример из статьи:
обычный prompt на 42 токена сократили до 12 без потери смысла, а summarization уменьшил общий контекст со 109 до 36 токенов.

Сейчас индустрия постепенно приходит к тому, что memory management становится не менее важным, чем сами модели. Потому что при масштабных agent loops стоимость контекста начинает убивать inference быстрее, чем качество модели помогает.

Как думаешь, будущее AI-агентов — это большие context windows или агрессивное сжатие памяти?
Please open Telegram to view this post
VIEW IN TELEGRAM
📁 Samuel Colvin представил Pydantic Monty — минимальный Python-runtime на Rust для выполнения кода, написанного LLM.

Главная идея:
вместо выдачи агенту полноценной Linux-машины модель получает только ограниченный набор функций и возможность писать код (“code mode”).

👆 Что это даёт:
— меньше tool calls;
— ниже latency и стоимость agentic loops;
— безопасное выполнение без доступа к FS/сети по умолчанию;
— snapshot/resume execution;
— более дешёвую альтернативу sandbox/VM-инфраструктуре.

Monty запускается за микросекунды и ориентирован на production AI-агентов с узкими задачами, а не на full autonomous computer-use.
Please open Telegram to view this post
VIEW IN TELEGRAM
💎 Классические тесты начинают ломаться, когда мы переходим к ИИ-агентам. Один и тот же результат может быть достигнут разными путями: интерфейс ведёт себя по-разному, шаги меняются, появляются задержки. Но фактически задача выполнена — а тест всё равно падает.

Идея Trust Layer в том, чтобы перестать проверять конкретный сценарий выполнения. Вместо этого поведение агента представляется как граф состояний, построенный на успешных запусках. Из него выделяются только “обязательные” точки — те состояния, без которых успех невозможен, а всё остальное считается вариативным шумом.

🖥 Для этого используется комбинация: построение графа переходов, объединение похожих состояний и dominator analysis, которая находит неизбежные шаги любого успешного пути. В итоге проверяется не маршрут, а факт достижения ключевых состояний в правильном порядке.

Это снижает ложные падения в CI и делает поведение агентов более объяснимым, но требует эталонных успешных прогонов и частично опирается на LLM для сравнения состояний.

Где проходит граница между “достаточно правильным результатом” и действительно валидным поведением системы?
Please open Telegram to view this post
VIEW IN TELEGRAM
⚠️ Anthropic и Gates Foundation запускают четырёхлетнюю программу на $200 млн, включающую гранты, доступ к Claude и техническую поддержку для проектов в здравоохранении, образовании и экономической мобильности.

Фокус — не просто внедрение AI, а создание инфраструктуры “общественной пользы”: инструменты для анализа медицинских данных, ускорения разработки вакцин и терапии, улучшения прогнозов распространения заболеваний, а также образовательные системы для школ в США, Африке и Индии.

‼️ В образовании планируются AI-тьюторы, карьерные рекомендации и открытые бенчмарки. В здравоохранении — работа с министерствами и исследователями для улучшения диагностики, распределения ресурсов и эпидемиологических моделей. В экономике — инструменты для агросектора и систем оценки программ, влияющих на доходы и занятость.

По сути, это попытка превратить LLM в слой инфраструктуры для глобальных социальных систем — от медицины до рынка труда.
Please open Telegram to view this post
VIEW IN TELEGRAM
👁️ Deep Agents выпустили v0.6 с фокусом на производительность и масштабирование агентных систем.

Главное обновление — встроенный code interpreter. Теперь агент может сам писать и выполнять код внутри runtime, управлять tool calling, хранить промежуточное состояние и не гонять всё через контекст модели. Это снижает latency и расход токенов.

🖼️ Также добавили:
— harness profiles для эффективной работы open-weight моделей вроде Qwen и DeepSeek;
— Delta Channels, уменьшающие storage checkpoint’ов до 100x;
— typed streaming для realtime agent UI;
— ContextHub для versioned memory и навыков агентов.

Тренд становится всё заметнее: AI-агенты превращаются не просто в “LLM с тулзами”, а в полноценные execution-системы со своим runtime, памятью и orchestration layer.
Please open Telegram to view this post
VIEW IN TELEGRAM
💢 Microsoft запускает серию онлайн-ивентов GitHub Copilot Dev Days для разработчиков по всему миру.

Фокус — не просто autocomplete, а полноценная AI-assisted разработка: agentic workflows, context engineering, GitHub Actions и работа с Copilot как с активным участником процесса разработки внутри VS Code.

Сессии пройдут на нескольких языках:
— English;
— Spanish;
— Portuguese;
— Chinese;

В программах:
TypeScript, React, Tailwind, Python, FastAPI, HTMX, Agent Mode и автоматизация workflow через GitHub Copilot + GitHub Actions.

Тренд становится очевидным:
Copilot всё меньше выглядит как “умный автокомплит” и всё больше — как AI development environment поверх IDE.

Станет ли IDE в будущем просто интерфейсом для агентной системы разработки?
Please open Telegram to view this post
VIEW IN TELEGRAM
🪟 DevOps постепенно уходит от классических пайплайнов к агентному подходу. Вместо того чтобы просто фиксировать ошибки сборки, новые AI-агенты (на базе Azure OpenAI и Microsoft AI Foundry) могут анализировать логи, понимать причину сбоя и автоматически предлагать или даже вносить исправления.

Типовой цикл выглядит так: пайплайн падает → агент получает логи → определяет причину (например, ошибка Terraform или сеть) → предлагает конкретный фикс или открывает pull request.

🍒 Главная идея — перейти от “человек ищет проблему в логах” к “агент сам локализует и исправляет типовые сбои”, снижая время дебага и повышая стабильность инфраструктуры.
Please open Telegram to view this post
VIEW IN TELEGRAM
💢 Энтузиасты смогли запустить локальную AI-модель Falcon H1 Tiny на первом Raspberry Pi 2014 года с 512 МБ RAM и одноядерным ARM-процессором 700 МГц. Для этого использовали сильную оптимизацию: 4-битную квантизацию модели, облегчённую Raspberry Pi OS Lite и cross-compilation через llama.cpp.

Несмотря на крайне слабое железо, устройство смогло выдавать связные ответы локально — правда, очень медленно: генерация одного токена занимала несколько секунд. 2-битная версия модели работала быстрее, но давала бессмысленный вывод, а 8-битная уже не помещалась в ресурсы устройства.

☀️ Главный вывод — современные LLM постепенно становятся доступными даже для старого и дешёвого железа, если грамотно оптимизировать рантайм и память. Это важный шаг для edge AI, IoT и офлайн-AI систем без облака.

Как думаете — через пару лет локальные AI-ассистенты на микрокомпьютерах станут нормой?
Please open Telegram to view this post
VIEW IN TELEGRAM
🪟 В Китае начали тестировать роботизированные системы для стрижек, где вместо мастера работают манипуляторы с AI, 3D-сканированием головы и автоматической логикой подбора движений. Главная идея — снизить стоимость услуг и добиться стабильного результата без участия человека.

Система анализирует форму головы и положение волос, после чего робот выполняет стрижку автоматически. Стоимость таких сеансов, по сообщениям, может составлять около $60, но главный вопрос пока не в цене, а в качестве работы с разными типами волос, движением человека и сложными стилями.

➡️ В отличие от промышленных роботов, здесь автоматизация работает буквально в нескольких сантиметрах от лица и шеи клиента, поэтому критически важны точность, безопасность и системы экстренной остановки.

Если технология станет надёжной, AI-роботы могут начать массово заходить в сферу бытовых услуг — от бьюти-индустрии до диагностики и wellness-сервисов.

Доверили бы вы роботу свою стрижку ради более низкой цены и стабильного результата?
Please open Telegram to view this post
VIEW IN TELEGRAM
🌟 Стартап Luna Zone открыл waitlist на Luna Band — AI-носимое устройство с голосовым интерфейсом и собственной системой LifeOS. Вместо обычного трекинга браслет анализирует состояние организма в реальном времени и формирует персональный план дня буквально по часам.

LifeOS объединяет данные с браслета, привычки пользователя, показатели здоровья и медицинский контекст, после чего динамически перестраивает рекомендации: когда тренироваться, отдыхать, работать или восстанавливаться. Управление происходит через уведомления на запястье и приложение с отдельными AI-модулями для стресса, сна, питания и продуктивности.

😈 Проект явно делает ставку не на массовый фитнес-трекинг, а на рынок high-performance lifestyle — людей, которые хотят оптимизировать энергию, восстановление и эффективность через AI.
📁 По данным uncover.ai, рост Anthropic стал одним из самых агрессивных в истории AI-индустрии: компания прошла путь от примерно $10 млн выручки в 2022 году до предполагаемого annualized run rate в $45 млрд к маю 2026-го.

Такой скачок показывает, насколько быстро корпоративный рынок начал платить за Claude, AI-инструменты для программирования и доступ к крупным языковым моделям. Anthropic, основанная только в 2021 году, уже обсуждается в контексте потенциальной оценки около $2 трлн — на уровне крупнейших мировых тех-компаний.

🕹️ Но главный вопрос теперь — экономика. Обучение и запуск frontier-моделей требуют колоссальных затрат на GPU и инфраструктуру, поэтому рынку предстоит понять, сможет ли рост выручки и дальше перекрывать растущую стоимость вычислений.
Please open Telegram to view this post
VIEW IN TELEGRAM
😈 Anthropic запустила Project Glasswing — инициативу по поиску критических уязвимостей в мировом ПО с помощью новой AI-модели Claude Mythos Preview.

За первый месяц AI нашёл более 10 000 критических и высокоопасных уязвимостей в системах Cloudflare, Mozilla, Oracle и других крупных компаний. По словам Anthropic, проблема уже не в поиске багов, а в том, что люди не успевают их проверять и исправлять.

Mythos Preview также просканировал более 1000 open-source проектов и показал около 90% точности после ручной проверки. Некоторые партнёры заявляют, что скорость поиска уязвимостей выросла более чем в 10 раз.

Фактически AI начинает менять саму кибербезопасность: теперь мощные модели способны находить дыры быстрее, чем индустрия успевает выпускать патчи.

Главный вопрос — успеет ли мир адаптироваться к скорости AI-взлома раньше, чем такие технологии попадут не в те руки?
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 GitHub начал сокращать количество AI-моделей в Copilot Chat на вебе, чтобы сделать ответы стабильнее и предсказуемее.

Из Copilot Web уже убрали Gemini-модели и часть OpenAI-моделей вроде GPT-5.2 Codex. Теперь GitHub делает ставку на ограниченный набор «проверенных» моделей с более стабильным качеством.

‼️ При этом внутри VS Code Copilot продолжает активно развивать автоматический роутинг моделей под конкретные задачи, агентный режим и AI-автоисправление кода.

Похоже, индустрия постепенно уходит от идеи «дать пользователю все модели сразу» к модели, где AI сам выбирает лучший движок под задачу.
Please open Telegram to view this post
VIEW IN TELEGRAM
➡️ Google анонсировала Gemini Omni — новую мультимодальную модель, способную создавать контент практически из любых типов входных данных: текста, изображений, видео и аудио.

Первой версией стала Gemini Omni Flash, которая уже умеет генерировать и редактировать видео через обычный диалог. Пользователь может загружать свои ролики, менять объекты, персонажей, окружение и даже полностью перестраивать сюжет с сохранением логики сцены.

☀️ В Google заявляют, что Omni лучше понимает физику, причинно-следственные связи и может использовать знания из науки, истории и культуры для создания более реалистичных и осмысленных видео.

Фактически компания делает шаг к универсальному AI-редактору, где любое фото, видео, текст или голосовая команда становятся отправной точкой для создания нового контента.

Как думаете, смогут ли такие модели со временем заменить традиционные видеоредакторы и большую часть работы видеопродакшена?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Исследователи из Калифорнийского университета в Сан-Диего заявили, что современные языковые модели впервые смогли успешно пройти классический тест Тьюринга.

В эксперименте GPT-4.5 с правильно настроенной персоной принимали за человека в 73% случаев — чаще, чем реальных людей. Модель LLaMA 3.1 показала результат 56%, что статистически оказалось неотличимо от человека.

Самое интересное, что ИИ побеждал не благодаря энциклопедическим знаниям, а наоборот — за счёт человеческих ошибок, юмора, неидеальных ответов и естественной манеры общения.

Исследование показывает, что современные модели становятся всё более убедительными собеседниками, а отличить человека от ИИ в интернете становится всё сложнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🪐 Когнитивист Элан Баренхольц заявил, что успех больших языковых моделей ставит под сомнение традиционное представление о языке. Несмотря на отсутствие зрения, слуха и реального опыта, LLM способны создавать связные тексты и поддерживать сложные диалоги, используя только статистические связи между словами.

По мнению автора, это говорит о том, что язык может работать как самопорождающаяся система, где слова рождают новые слова, идеи и образы без необходимости постоянно обращаться к объективной реальности. Он предполагает, что человеческое мышление во многом устроено похожим образом: мы часто формулируем мысли прямо в процессе разговора, а не извлекаем их из заранее готовой «модели мира».

⚠️ Вместо того чтобы рассматривать язык как инструмент описания мира, автор предлагает видеть в нём механизм координации людей, генерации идей и организации действий. В такой модели смысл возникает не из прямой связи слов с объектами, а из того, какие последствия эти слова вызывают в мышлении и поведении.

Если язык действительно работает так, означает ли это, что большая часть того, что мы считаем «реальностью», создаётся не фактами, а коллективными языковыми конструкциями?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔪 Президент Docker Марк Кавадж считает, что AI — это следующий уровень абстракции в программировании после облаков и контейнеров. Если раньше технологии избавляли разработчиков от управления серверами и инфраструктурой, то теперь ИИ помогает автоматизировать сам процесс создания программ.

По его мнению, будущее за агентами, которые смогут самостоятельно писать, запускать и изменять код. Для этого Docker развивает специальные песочницы (sandbox), где ИИ-агенты получают полную свободу действий внутри изолированной среды без риска для основной системы.

➡️ Кавадж также прогнозирует рост локального запуска открытых ИИ-моделей из-за преимуществ в приватности, стоимости и скорости работы. При этом он подчеркивает, что безопасность не замедляет развитие технологий, а наоборот позволяет использовать ИИ максимально быстро и эффективно.

Если ИИ-агенты смогут самостоятельно писать и запускать программы, останется ли разработчик создателем кода или станет менеджером команды цифровых сотрудников?
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 На Google I/O 2026 компания представила новую экосистему для разработки AI-агентов — от простых визуальных конструкторов до сложных мультиагентных систем. Главная цель — дать разработчикам возможность быстро создавать агентов локально и безопасно разворачивать их в облаке без смены инструментов и архитектуры.

Среди ключевых новинок — Antigravity 2.0 для разработки и оркестрации агентов, Managed Agents API с полностью управляемой инфраструктурой и обновлённый Agent Development Kit (ADK 2.0) для создания сложных агентных сетей.

👍 Также Google делает ставку на открытые стандарты, позволяя использовать вместе с платформой сторонние инструменты, включая Claude Code и Cursor.
Please open Telegram to view this post
VIEW IN TELEGRAM
⚠️ Исследователь безопасности Аонан Гуан раскрыл серьёзную уязвимость в Claude Code, которая позволяла обходить сетевую песочницу и получать доступ к конфиденциальным данным разработчиков. Проблема существовала более пяти месяцев и затрагивала около 130 версий продукта.

Через специально сформированные сетевые запросы злоумышленники могли обходить ограничения на исходящий трафик и потенциально получать AWS-ключи, GitHub-токены, переменные окружения, исходный код и доступ к внутренним корпоративным ресурсам. Уязвимость была исправлена в версии 2.1.90, однако Anthropic не публиковала отдельного уведомления о проблеме безопасности.

Насколько можно доверять AI-агентам доступ к коду и инфраструктуре компании, если даже встроенные механизмы изоляции периодически оказываются уязвимыми?
Please open Telegram to view this post
VIEW IN TELEGRAM
⁉️ Alibaba Cloud активно расширяет свою AI-экосистему, делая ставку на семейство моделей Qwen и платформу Model Studio. Сервис позволяет разработчикам быстро подключать языковые, мультимодальные, аудио- и видеомодели через единый API, а также масштабировать AI-приложения в облаке без необходимости самостоятельно управлять инфраструктурой.

Среди новых моделей выделяется Qwen3.7-Max — агентная модель для программирования, автоматизации рабочих процессов и длительного автономного выполнения задач.

➡️ Также компания развивает линейку Wan для генерации изображений и видео и предлагает бесплатные токены для тестирования моделей. Платформа уже используется крупными компаниями из фармацевтики, e-commerce и управления документами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Microsoft представила пакет Microsoft.AgentGovernance.Extensions.ModelContextProtocol, который добавляет встроенное управление безопасностью для MCP-серверов на .NET. Решение позволяет внедрить политики доступа, проверку инструментов, аудит и очистку ответов через единственный вызов WithGovernance(...) в стандартном MCP SDK.

Инструмент автоматически сканирует зарегистрированные MCP-инструменты на признаки prompt injection, tool poisoning, typosquatting, скрытые инструкции и другие угрозы ещё до запуска сервера. Во время выполнения политики могут ограничивать доступ к инструментам, учитывать идентичность агента и блокировать нежелательные вызовы. Дополнительно система анализирует ответы инструментов, удаляя потенциально опасные инструкции, утечки секретов и ссылки для эксфильтрации данных.

➡️ По умолчанию пакет работает по принципу fail closed: включает проверку инструментов при старте, блокировку небезопасных инструментов, санитизацию ответов, аудит и сбор метрик. Решение ориентировано на корпоративные AI-системы, где требуется централизованное управление безопасностью MCP-инфраструктуры.

Станет ли встроенный governance обязательным элементом для корпоративных MCP-серверов, или большинство разработчиков по-прежнему будут полагаться на собственные механизмы защиты?
Please open Telegram to view this post
VIEW IN TELEGRAM
1