Технозаметки Малышева
11.5K subscribers
4.82K photos
1.79K videos
42 files
4.85K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Machinelearning
📌Успех в работе с Claude Code зависит больше от знания дела, чем от умения писать код

Anthropic опубликовала отчёт, в котором утверждает, что главным фактором успеха при работе с ИИ-агентами для программирования оказывается не владение кодом, а понимание самой задачи.

Вывод основан на анализе около 400 тысяч сессий сервиса Claude Code, проведённых примерно 235 тысячами пользователей с октября 2025 по апрель 2026 года.


В типичной сессии человек принимает около 70% решений о том, что делать, тогда как агент берёт на себя примерно 80% решений о том, как это сделать. Иными словами, человек ставит задачу, а ассистент выбирает способ её выполнения.

Чем глубже пользователь разбирается в предметной области, тем больше работы агент выполняет по одной команде. По оценке команды, у новичков одна реплика запускает в среднем около 5 действий ИИ и порядка 600 слов ответа, у экспертов - вдвое больше действий и впятеро больше текста.

Уровень владения при этом определялся не должностью, а тем, насколько точно человек формулирует требования и замечает ошибки агента.


🟡Отдельный вывод касается профессий

При написании кода представители разных специальностей добиваются результата почти так же часто, как профессиональные программисты - все крупные профгруппы укладываются в 7 процентных пунктов от показателей инженеров.

В то же время разрыв между новичками и более опытными заметен. По критерию "подтверждённого успеха" сессии новичков завершались удачно в 15% случаев, а пользователей среднего уровня и выше - в 28–33%.

🟡Структура работы за 7 месяцев изменилась

Доля сессий, посвящённых исправлению ошибок, упала с 33% до 19%.

Выросла доля задач, связанных с запуском и настройкой программ, анализом данных и подготовкой текстов.

Оценочная стоимость типичной задачи, рассчитанная через сравнение с расценками на биржах фриланса, поднялась в среднем примерно на 25%.

🔜 Описания методик, профилей и запросов - в приложении к отчету.


@ai_machinelearning_big_data

#AI #ML #Coding #Research #Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥51🍓1
😁47❤‍🔥1👍1🍓1
Forwarded from Борис опять
😁19👀14🔥5💯4👻2👍1
не, ну то всё шутки были, вот нормальное руководство нашел.

#юмор
———
@tsingular
😁30❤‍🔥6👍3😍21🆒1
Forwarded from Machinelearning
✔️ Moonshot AI выпустила ускоренную версию Kimi K2.7 Code

Китайская компания объявила о запуске Kimi K2.7 Code HighSpeed - высокоскоростном режиме для своей мультимодальной модели Kimi K2.7 Code.

Moonshot утверждает, что ответы генерируются до 6 раз быстрее стандартной версии.

Обещают скорость около 180 токенов в секунду на средних запросах и до 260 токенов в секунду, если контекст короткий.


Версия разворачивается для участников программы Kimi Code Beta, разработчиков, использующих Kimi API, и корпоративных клиентов Kimi Business.

Отдельный инвайт не требуется: возможность получить доступ есть у всех, кто присоединился к бета-программе.

В официальном анонсе цены не названы; в нём лишь говорится, что "открытый интеллект должен быть мгновенным, доступным и не знающим границ".

Вместе с тем в ряде публикаций упоминается, что тарифы на API ускоренной версии вдвое выше, чем у стандартной.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥115🆒31👍1
🤖 Автономный ИИ в промышленности: реальные примеры

Автономное принятие решений в промышленности — это уже не футуристическая концепция, а активно развивающаяся реальность. Переход от рекомендательных систем к агентным ИИ является ключевым трендом, который обещает повысить эффективность производств за счёт сокращения простоев и оптимизации ресурсов. Рассмотрим этот процесс на примерах из химической и нефтехимической промышленности — сектора, где цена ошибки особенно высока.

🏭 Sinopec и промышленный ИИ-агент «Фэнхо»

В мае 2026 года китайский нефтехимический гигант Sinopec представил промышленного ИИ-агента «Фэнхо» — первое в отрасли решение, которое превращает искусственный интеллект в полноценного «цифрового сотрудника» по версии компании.

Что умеет «Фэнхо»:

Агент построен на базе собственной большой языковой модели Sinopec «Великая стена» и способен выполнять три ключевые функции:

▪️ Анализ производственных данных и взаимодействие с промышленным ПО. Агент работает с симуляционными и технологическими системами, выполняя инженерные расчёты.

▪️ Глубокое накопление знаний. В систему интегрировано более миллиарда экспертных наблюдений и единиц накопленного опыта, по заявлению компании, что позволяет ей выполнять задачи с уровнем компетенции опытного специалиста.

▪️ Автономное выполнение длительных задач. «Фэнхо» способен самостоятельно декомпозировать многоэтапные промышленные процессы на подзадачи и стабильно выполнять их в течение нескольких часов без вмешательства человека.

Как это выглядит на практике:

Агент развёрнут в четырёх ролях: «Учёный», «Инженер», «Программист» и «Ассистент». Первые две роли — ключевые для производства. Они автономно проводят динамический анализ разработки месторождений и оптимизируют процессы нефтепереработки, дополняя специалистов на трудоёмких инженерных и аналитических задачах. Важно, что это инженерный и аналитический контур, а не контур регулирования технологическим процессом.

🧪 Завод «Ваньхуа»: предиктивный контур, а не автономное управление

Китайский химический концерн Wanhua Chemical совместно с Huawei развернул ИИ на площадке в Яньтае, где эксплуатируется более 30 тысяч единиц оборудования. По данным Huawei, представленным на HUAWEI CONNECT 2025, на базе модели Pangu выстроено несколько контуров.

▪️ Предиктивное обслуживание более 2 тысяч ключевых единиц оборудования с точностью прогноза выше 90 процентов.

▪️ Система диагностики отказов на инференс-модели Pangu, сократившая время ручного обхода и инспекций на 20 процентов.

▪️ Агент проверки текстов стандартных операционных процедур, поднявший эффективность проверки более чем на 50 процентов.

Принципиально, что это контур предиктивной аналитики, диагностики и оптимизации режима, а не контур регулирования. ИИ выявляет аномалии, даёт ранние предупреждения и рекомендации по технологическому режиму, обеспечивая переход от реактивного обслуживания к проактивному. Исполнение и быстрые контуры остаются за штатными системами управления.

📌 Что это значит для отрасли

Оба примера показывают, что автономный ИИ в нефтехимии перешёл из лабораторий на реальные производства. Ключевые выводы:

▪️ ИИ становится «коллегой», а не просто инструментом. Он берёт на себя задачи, требующие глубоких знаний и длительного анализа.

▪️ Экономический эффект от внедрения выражается приростом эффективности и снижением издержек на обслуживание.

▪️ Оба внедрения работают на уровне инженерии, оптимизации и диагностики, на горизонте минут и часов. Контур регулирования и исполнение остаются за детерминированными системами управления.

📚 Источники

https://technode.com/2026/05/26/sinopec-launches-industrial-ai-agent-to-empower-oil-and-chemical-operations/

https://www.sinopec.com/listco/en/news/business_news/20260526/news_20260526_484911985116.shtml

https://e.huawei.com/my/blogs/2025/industries/oil-gas/build-smart-wanhua-chemical

https://e.huawei.com/en/industries/industrial-networking/wanhua-chemical-case

#AI #Industrial



🌐 Highload & Mission Critical
8🔥83👍21👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Google Genie3 теперь может генерить виртуальное окружение на базе streetview из Google maps.

Доступно подписчикам плана Ultra

GTA можно опять переносить :)

#Google #Genie #AR #VR
------
@tsingular
🔥29🆒4❤‍🔥21👍1😁1😢1
Чёрное зеркало - трекер прогресса

Кто-то должен был это сделать рано или поздно, поэтому держите.

Разобрал каждую серию сериала Чёрное зеркало, убрал описания сюжета, чтобы особо не спойлерить, вытащил ключевые технологии каждой серии и по каждой нарыл новости, подтверждающие наличие технологии в нашем мире.

изучать тут:
https://www.tsingular.ru/blackmirror/

Предложения по доработке приветствуются

#blackmirror #сайт #dev
———
@tsingular
1🔥36👍10🆒754👌11
Midjourney строит сеть спа салонов с ультразвуковыми медицинскими сканерами, которые заменяют МРТ и работают в сотни раз быстрее

📋 Компания, которая научила мир генерировать изображения по текстовому описанию, теперь хочет генерировать трёхмерные карты человеческого тела.

Звучит как фантастика:
Вы заходите в неглубокий бассейн с золотистым светом, медленно погружаетесь в воду, а кольцо из полумиллиона микроскопических квадратов — каждый размером с песчинку, каждый одновременно динамик и микрофон — окружает вас и испускает ультразвуковые волны, которые проходят сквозь ткани разной плотности, меняют форму и возвращаются обратно. Через минуту у вас трёхмерная карта тела с разрешением до долей миллиметра, почти в сто раз быстрее МРТ.

💡 Пятьсот тысяч элементов кольца излучают и принимают сигнал миллионы раз в секунду, создавая терабайты данных ежесекундно: если перевести этот поток в HD-видео, на каждую секунду сканирования пришлось бы 500 часов просмотра.
Тысячи компьютеров обрабатывают волновые искажения и восстанавливают по ним объёмную картину внутренних структур.
Первые реконструированные срезы уже опубликованы, и качество напоминает МРТ, только полученное без часа неподвижного лежания в гудящей трубе, да еще и с риском притяжения металлов.

Спа-формат здесь — ключевая часть замысла: Midjourney хочет, чтобы сканирование стало побочным эффектом приятного визита с горячими купелями, саунами и бассейнами золотого света, открытого круглосуточно.

Первый спа откроется в Сан-Франциско в конце 2027 года, а к 2031 году компания рассчитывает развернуть 50 000 сканеров по всему миру с пропускной способностью в миллиард сканирований в месяц.

💼 Дорожная карта: ближайший год — доработка алгоритмов и железа плюс исследовательский спа для массового сбора данных, конец 2027 — первый публичный спа, 2028 — масштабирование на новые города и Gen3-сканер с собственным кремнием, обещающий качественный скачок «как день и ночь».

Регуляторный путь начинается с карт состава тела, затем данные испытаний уйдут в FDA для расширения диагностики. Midjourney оценивает потенциальный эффект в предотвращение 30% всех смертей и 50% расходов на здравоохранение — цифры спекулятивные, но подход к мониторингу здоровья через регулярные, дешёвые и безболезненные сканирования действительно не имеет аналогов.

При этом у Midjourney нет инвесторов: это лаборатория на средства сообщества, обычных пользователей, которые платят за подписку на генератор изображений и тем самым финансируют медицинский проект.

📎 Анонс на сайте Midjourney · Галерея сканов · Галерея спа · Форма участия

#Midjourney #MedTech #HealthAI
------
@tsingular
59🔥3011🤯10👀9❤‍🔥1👍1
Xiaomi зарелизила MiMo Code — агента, который не теряет нить на 200+ шагах и обходит Claude Code на длинных задачах

📋 Xiaomi выкатила MiMo Code, - открытого терминального агента для программирования на базе OpenCode, заточенного под длинные сессии.
На одной модели MiMo-V2.5-Pro он показывает 62% на SWE-bench Pro против 57% у Claude Code и 73% на Terminal Bench 2 против 68%, - разрыв в пять пунктов, обеспечивается архитектурой агента, а не моделью.

💡 Три ключевых механизма: Max Mode генерирует пять параллельных решений за шаг и выбирает лучшее (прирост 10–20% на бенчмарках), независимая верификация завершения не даёт агенту остановиться раньше времени, а Dynamic Workflow заменяет промпты на JavaScript-скрипты для детерминированной оркестрации десятков субагентов (в чём то похоже на openrouter fusion).
Память на SQLite FTS5 с авто-снапшотами и реконструкцией контекста: при возобновлении сессии агент не переучивает проект заново, а восстанавливает состояние из последней контрольной точки.

💼 Релиз v0.1.1, 9 600 звёзд, MIT. Бесплатный канал MiMo Auto, любой LLM-провайдер, миграция из Claude Code в один шаг.
По опросу 576 разработчиков, MiMo Code обходит Claude Code именно на задачах длиннее 200 шагов — там, где обычные агенты сыпятся.

📎 GitHub · Блог про длинные задачи · Документация · VentureBeat

#MiMo #Xiaomi #OpenCode #OpenSource
------
@tsingular
114🔥14👍75
Технозаметки Малышева
В начале это было почти незаметно. Мы просто подключили ИИ к рабочему процессу. Ассистенты, потом агенты, мультиагенты даже. Мы ускорили анализ, автоматизировали рутину, вынесли мышление в интерфейс. Разница стала заметно, повысилась эффективность. Потом…
забавно, как эта сказка отражает ситуацию с Fable

промелькнул призрак сингулярности и пропал.
теперь довольствуемся воспоминаниями об AGI

https://www.tsingular.ru/creativity/skazka-singulyarnosti/

хотя, вот, говорят GPT 5.6 вышла, вот вот всем раскатают, - может вернется ощущение "бога в кармане" :)

#сказка #Fable
———
@tsingular
🤣121
Forwarded from NN
Claude Code научился управлять робопсами без людей. Модель Opus 4.7 сама подключилась ко всем датчикам и построила алгоритм управления.

Всего два года назад Claude не справлялся с этой задачей. Теперь он освоил контроль роботом в 20 раз быстрее команды людей. К счастью, пока ограничились игрой в мяч.

Шутки про «Черное зеркало» больше не нужны.
1🔥21👏8🤔6👍2💯1
Поколение, которое копипастило код со StackOverflow, издевается над поколением, которое копипастит код от LLM

#юмор
------
@tsingular
😁56💯10😢1
Forwarded from Machinelearning
📌 DeepMind опубликовала архитектуру безопасности AI Control Roadmap

Вслед за недавними размышлениями об эволюции AGI в ASI, исследовательское подразделение Google представила внутренний регламент контроля высокоразвитых ИИ-агентов.

Помимо привычного элайнмента модели, DeepMind добавляет отдельный слой системного контроля, пересобирая защиту исходя из худшего сценария.

За вводную берётся то, что система изначально враждебна, имеет скрытые цели и тайно работает против разработчиков.


Для систематизации таких угроз взяли за основу популярный фреймворк MITRE ATT&CK и создали на его базе TRAIT&R, новую таксономию тактик и методов обхода защиты.

Она учитывает специфику ИИ и описывает векторы атак, недоступные людям: от незаметного саботажа научных исследований и внедрения бэкдоров до распределенных цепочек взлома, когда фрагменты вредоносного плана синхронно выполняются сотнями разных инстансов одного агента.

Защита выстроена по принципу эскалации и делится на уровни D1–D4 для систем обнаружения и R1–R3 для механизмов реагирования.

На базовых этапах безопасность обеспечивается анализом CoT агента в песочницах под присмотром более слабых, но надежных ИИ-супервизоров.

По мере развития способностей модели начинают понимать факт слежки и учатся скрывать ход своих мыслей.

Для контроля над такими системами (это уровень D4/R3) традиционные методы больше не работают.

На этом этапе DeepMind планирует применят более затратные меры, вплоть до проверки внутренних состояний модели, использования изолированных копий самой недоверенной системы для аудита и инфраструктуры экстренной остановки агентов и запущенных ими процессов.

Вместе с новой стратегией опубликован отдельный документ для индустрии о том, как сделать агентов безопасными по мере их распространения, и он разбит на 3 уровня:

🟡Безопасность отдельного агента

Как защитить одну систему от утечек данных, чужих манипуляций и от собственных ошибочных действий, и зачем для этого нужны общие стандарты.


🟡Риски взаимодействия агентов

Каскадные сбои, негласный сговор алгоритмов, ситуации, где за вред никто конкретно не отвечает, и атаки, рассчитанные сразу на сеть агентов.


🟡Общая кибербезопасность

Как помочь защитникам сохранить преимущество перед злоумышленниками (автоматический поиск и устранение уязвимостей, обмен сигналами об угрозах, обучение специалистов).


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
521👍1🔥1
В компании Figure количество роботов впервые превысило количество людей.

#роботы #Figure
------
@tsingular
👀13🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes Agent v0.17.0: iMessage без Mac, фоновые субагенты и мост в агентную сеть Raft

📋 Вчера Nous Research выкатили версию 0.17.0, - релиз под кодовым названием The Reach Release.
Полторы тысячи коммитов, 800 слитых PR и 245 контрибьюторов: фокус на расширение сред присутствия,- Hermes теперь работает с iMessage, встраивается в агентные сети, работает асинхронно и даже чуть лезет на поляну Cursor.

💡 Среди ключевых новинок выделяется iMessage через Photon Spectrum: больше не нужен Mac с BlueBubbles-ретранслятором, достаточно hermes photon login и кода устройства, и агент отправляет и принимает iMessage через управляемый пул линий Photon, бесплатно и без собственного хостинга.
Фоновые субагенты через delegate_task(background=true) запускают агента, возвращают дескриптор и продолжают работу, а результат приходит новым сообщением когда субагент закончит — можно запустить многочасовое исследование и заниматься другими делами не блокируя основную сессию.
Мост в агентную сеть Raft через канал пробуждения позволяет Raft будить Hermes метаданными без передачи тела сообщений.
Модель composer-2.5-fast от Cursor теперь доступна через xAI OAuth по существующей Grok-подписке как grok-composer-2.5-fast (сложный коллаб конечно :)).
Нативная поддержка новой разметки сообщений в телеграмм по умолчанию.

💼 Релиз интересен не столько списком функций, сколько направлением: Hermes перестаёт быть «агентом в терминале» и становится агентом везде: в iMessage для друзей и семьи, в Raft для корпоративных агентных сетей, в фоне для длинных задач, на десктопе с полноценным интерфейсом.
Плюс Skills Hub с превью и проверкой безопасности, плюс конструктор профилей из браузера, плюс инструмент памяти с атомарными пакетными операциями, - получаем инфраструктуру для серьёзных сценариев.

📎 Release notes · Hermes Agent

Ежедневная рутина: hermes update

#Hermes #update
———
@tsingular
1354🔥4
🚀 MAX Messenger теперь можно подключить к Hermes AI Agent

@Etetenkin поделился полноценным навыком-адаптером для Hermes, который добавляет поддержку MAX как отдельной платформы.

Что умеет:
— принимать текст, файлы, изображения и callback-кнопки
— отвечать в чатах с HTML-форматированием
— работать с inline-клавиатурами и апрувами команд
— транскрибировать голосовые через STT-пайплайн Hermes
— автоматически дробить длинные ответы LLM под лимит MAX

По сути, Hermes получает ещё один полноценный канал общения с агентами — уже через российский MAX Messenger.

Плагин в комментарии - просто скажите Гермесу распаковать архив и установить себе.

#Hermes #plugins #MAX
———
@tsingular
🔥21🤣20👍118🗿5🤨321
InTheWeights - проверь свой след в ИИ

Забавный сервис для проверки - засветились ли вы в весах моделей.

Так как Малышевых много, - пришлось уточнять :)

Проверить себя можно тут:
https://intheweights.com/

#intheweights #check
———
@tsingular
🔥13511