Технозаметки Малышева
11K subscribers
4.56K photos
1.66K videos
41 files
4.61K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
Hermes Agent v0.12.0: агент, который сам себя улучшает

В Гермес вышло мощное обновление, - полное описание на несколько листов.
В проекте уже 217 контрибьюторов, 1270 файлов 124K звёзд.

Релиз «The Curator» даёт Hermes Agent фонового куратора, который самостоятельно оценивает, чистит и объединяет навыки по расписанию раз в неделю.

🤖 Autonomous Curator: hermes curator запускается на cronу с циклом 7 дней (по умолчанию).
Оценивает библиотеку навыков, объединяет родственные, удаляет мёртвые.
Пишет отчёт в logs/curator/run.json и REPORT.md.
Архивирует навыки с классификацией «консолидирован» или «удалён» через модель + эвристику.
Защита: bundled и hub-навыки заблокированы от мутаций.
Управление через hermes curator status (рейтинг по использованию) и дашборд.

⚙️ Self-Improvement Loop 2.0: Фоновый ревью навыков разбиты на рубрики (class-first).
Предпочитает обновлять навык, который агент недавно загружал (active-update bias).
Работает с references/ и templates/ внутри навыков.
Наследует runtime провайдера: модель, креды, токены пробрасываются автоматически.
Ограничен toolset-ом memory + skills, не расползается.
Memory-провайдеры корректно завершаются после прогона.

🔗 Навыки и интеграции: ComfyUI v5 встроен по умолчанию (CLI + REST + hardware-gated install).
TouchDesigner-MCP в bundled-поставке с 9 новыми справочниками по GLSL, пост-FX, аудио, геометрии.
Humanizer для зачистки AI-следов в тексте.
claude-design (HTML-артефакты + Google DESIGN.md + Airtable).
skill_manage теперь редактирует external_dirs и ставит навыки по URL, добавлена команда /reload-skills.

🛠 Провайдеры и платформы: LM Studio повышен до first-class провайдера с нативной интеграцией, авторизацией, hermes doctor-чеками и листингом моделей.
GMI Cloud, Azure AI Foundry (с auto-detection), MiniMax OAuth (PKCE), Tencent Tokenhub.
Tencent Yuanbao (18-я платформа), Microsoft Teams (19-я, первая plugin-shipped через pluggable gateway).
Spotify: 7 инструментов с PKCE OAuth и интерактивным мастером.
!!! Google Meet plugin: подключение к звонкам, транскрибирование, озвучивание, follow-up.

Короче это уже не просто сотрудник, а очень прокаченный ИИ агент сотрудник.
Рекомендую почитать полное описание релиза.

#HermesAgent #ИИ #агенты #NousResearch #OpenSource #Curator #SelfImprovement
------
@tsingular
🔥2293🤩2
МИР, ТРУД, ЭЯЙ!

Гремит Страна
кумачом первомайским.
Молодые деревья вбиты в землю как гвозди.
Хрусталь зазывает праздностью барской, -
переработанные грозди.

А мы в окопах клавиатурных
тренируем агентов под лозунги «МИР! ТРУД! ЭЯЙ!»
ТОВАРИЩ!
Не отвлекайся на шашлыки ты эти!
ПРОЛЕТАРСКИЙ КУЙ AGI!

#май #юмор
———
@tsingular
🔥23😁1162❤‍🔥11🤯1🎉1😐11
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Вышел Grok 4.3

И, конечно, сразу нашлись бенчмарки, где он побивает всех и вся.

Уже есть на OpenRouter:
https://openrouter.ai/x-ai/grok-4.3

Цены: $1.25 за 1 млн input tokens и $2.50 за 1 млн output

Но самое интересное - это Grok Imagine Agents..

@cgevent
9🤯432🥰1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Grok Imagine Agents

Тут Грок приподубивает некоторое количество стартапов, которые уже прикрутили рассуждающих агентов к разным LLM и моделям генерации.

У Грока все в одном флаконе:
бесконечный Canvas и возможность общаться с агентом не на уровне промптов, а на уровне постановки задач.

Например:
- “Generate a 1-minute cinematic film”
- “Create a complete manga set”
- “Build UGC product stories”

А дальше он планирует, генерирует, редактирует и итерирует все в цикле рассуждений - все в одном рабочем пространстве.

Такое в принципе можно собрать в Claude Code и MCP коннекторов к разным генераторам (дорого и сложно). И сила Грока также в интерфейсе. Все в одном месте - с визуальной презентацией процесса.

Рано или поздно (имхо) Гугль и другие тоже придут сюда.

Бесплатно попробовать не получится (ну или 3 days free trial Grok Premium).

@cgevent
🔥155🤯221🥰1
Media is too big
VIEW IN TELEGRAM
Нейрослопище конечно этот ваш Grok Imagine пока еще. Всё плывёт.
Но попытка хорошая.

За пару часов можно собрать клип причем чисто в диалоге с агентом. (есть лимиты на генерацию в час, потому приходится ждать час пока остынет)
удобно что просто на дашборде выбираешь кадры или другие ролики и в чате пишешь что ты хочешь чтобы он с ними сделал, как переработал и поменял.

Ну и в целом стиль держит сквозь все генерации рабочего пространства.

И нельзя вязать лапшу - т.е. каждый объект может быть результатом предыдущего шага, но ты это не видишь, - надо помнить или самому распределять ассеты на поле.

Не хватает итогового монтажного редактора, типа clipchamp например встроенного, но, думается это будет следующий шаг.

Через пару релизов акции Adobe присядут ещё ниже.
Вы просили предупреждать, - вот предупреждаю :)
(не является финансовой рекомендацией)

#Grok #Imagine #нейрорендер #май
———
@tsingular
1🔥538🤣52❤‍🔥222🤯1
Мустафа Сулеймани (CEO Microsoft AI ) - в Линкедин спойлерит, что они работают над 1000х увеличением размерности обучаемых топ ИИ моделей, при том что нынешние измеряются триллионами.

Полез смотреть что там дальше по названиям.

Квадриллион, товарищи там дальше.
Вам часто в жизни приходилось произносить это слово?
Вот и мне не часто.

Привыкаем.
Сингулярность она такая.

Скачать эту модель будет стоить как квартиру в Москве купить.
Трафик то зарубежный подорожает к тому времени.

#Mustafa #Suleymani #квадриллион
------
@tsingular
😁25🔥84🤯21
Nebius покупает Eigen AI за $643 млн

Nebuis продолжает наращивать интеллектуальный слой ИИ инфраструктуры, на этот раз приобретая Eigen, - команду выходцев из MIT HAN Lab (разработчики AWQ - стандарта) и исследователей из DeepMind, OpenAI, Amazon AGI.

💰 Цена вопроса: $98 млн + 3,8 млн акций Nebius Class A (30-day VWAP).

Команда Eigen:
Ryan Hanrui Wang (CEO), автор SpAtten, самой цитируемой статьи HPCA с 2020 года.
Wei-Chen Wang, лучший paper MLSys 2024 за AWQ quantization, теперь стандарт для 4-bit serving в production.
Di Jin (MIT CSAIL PhD), работал над post-training Llama 3 и Llama 4, соавтор CGPO RLHF-фреймворка.

⚙️ Что покупают: Полноценный стек оптимизации инференса:
- Model layer — квантизация, pruning, MoE-роутинг, KV-cache, speculative decoding
- System layer — шедулеры, continuous batching, prefill/decode disaggregation, tensor/pipeline/expert параллелизм
- Kernel layer — fused операторы, кастомные attention-ядра, low-bit matmul

Поддержка GPT-OSS, Gemma, Qwen, Llama, Nemotron, DeepSeek, GLM, Kimi, MiniMax.

🔗 Зачем Nebius:
Технология вливается в Nebius Token Factory — управляемая платформа инференса с автоскейлом и fine-tuning под Qwen, Llama, DeepSeek, GLM, Kimi, MiniMax, Nemotron.
Получается такой полный вертикальный стек:
Infrastructure → Kernel → System → Model → Platform.

На практике это позволит:
- Open-source модели на Nebius будут запускаться быстрее и дешевле конкурентов
- Day-one оптимизация для новых релизов (Qwen, DeepSeek и пр.)
- RL post-training доступен прямо на платформе — без своего ML-team
- Команда Eigen остаётся в полном составе, открывают R&D офис в Bay Area

Кстати, недавно, в феврале этого года, Nebius так же приобрел поисковик Tavily за $275 млн.

💼 Зачем бизнесу: Inference забирает 2/3 спроса на вычисления в 2026 году.
Nebius резервирует мощности под Token Factory, берёт наценку за скорость и делает ставку на программную оптимизацию поверх того же железа.
Скоро конкуренция в neocloud уйдёт от «у кого больше GPU» к «кто выжимает больше токенов с каждого чипа».

#Nebius #EigenAI #inference #инфраструктура #датацентры
------
@tsingular
832🆒211
Робот-лошадь на тонну груза, - это вам не игрушка

Пока Кавасаки готовит Corleo, пекинская Dax Robotics показала Qiji T1000, четырёхного робота, который может тащить тонну и работать двое суток. Настало время робомулов.

🤖 Тоннаж: Несущая способность: 1000 кг. Крутящий момент суставов: 2000+ Н·м, в пять раз выше индустриального среднего.
Сверхмощная батарея: 1–2 дня автономности.
Снег, лёд, склоны, грязь, камни: без проблем.

⚙️ От игрушки к инструменту: Классические робособаки (Unitree, Boston Dynamics) несут до 20 кг.
T1000 работает как лёгкий грузовик, но там, куда грузовик не доедет: горные тропы, пожарные зоны, высокогорные патрули.
Партнёрство с SF Express и KJ Logistics уже оформлено.

💼 Зачем бизнесу: Формируется новая ниша: тяжёлые наземные роботы для мест, куда не доедет колёсная техника.
Горное строительство, арктические экспедиции, пожарная логистика: каждая из этих зон сегодня опирается на человеческий труд с риском для жизни.
Скоро роботы, которые могут тащить тонны грузов станут стандартом оснащения для спасательных и строительных ведомств, как дроны стали стандартом для аэрофотосъёмки.

📺 Робособаки из «Чёрного зеркала» покажутся шуткой, когда в бой пойдёт тяжелая артиллерия.

Когда уже человекоподобных меха-воинов начнут выпускать по типу как в Тихоокеанском рубеже, интересно? :)
Или хотя бы как в Атласе.

#роботы #Китай #DaxRobotics #мулы #лошади
------
@tsingular
🔥23933👀21👾1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная зарисовка из эфира про openclaw агентов.

пара примеров, - как openclaw помогает наблюдая за своим человекогочи (Хито-тчи) :)
и второй - когда агента подключили к управлению Теслой с правом перестройки маршрута.

#openclaw #кейсы
———
@tsingular
1🔥12👾8🤣2👀21
Media is too big
VIEW IN TELEGRAM
Hermes Agent получил Kanban: агенты теперь работают как команда

Nous Research встроила в Hermes Agent 0.12 канбан-доску. Шесть колонок, SQLite под капотом, живой дашборд, и главное: агенты сами разбирают задачи и передают контекст дальше по цепочке.

🤖 Мультиагентность: Каждая задача привязана к профилю: свои инструменты, навыки, личность.
Задачи связываются цепочками parent → child: родитель завершился, дочерняя автоматически переходит в ready.
Structured handoff: завершая задачу, агент оставляет --summary и --metadata. Следующий подхватывает без перечитывания документации.

⚙️ Инфраструктура: SQLite: данные переживут краши, рестарты, ребуты.
No double-claims: несколько агентов претендуют на задачу, побеждает один.
Heartbeats + runtime caps: долгие задачи не умирают, убегающие прибиваются.
Проектная изоляция: несколько проектов на одной машине без перекрёстного загрязнения.
Канбан-оркестратор и канбан-воркер уже в комплекте.

💼 Зачем бизнесу: Kanban в Hermes переводит мультиагентную работу из «запусти и молись» в наблюдаемый процесс с доской, историей прогонов и контролем.
Скоро паттерн «оркестратор + несколько специализированных воркеров» станет дефолтом для автоматизации: PM-агент декомпозирует, инженерные агенты пишут код, ревьюер-агент проверяет. Люди смотрят дашборд и вмешиваются при блокировке.

Так то и Paperclip особо не нужен. Гермес сам себе рой.

Клип про канбан тоже такой вот рой с канбаном сделал.

Инструкция

#Hermes #Kanban #мультиагенты #AI #рой #NousResearch
------
@tsingular
🔥20👍11411🤔1🙏1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Unity AI: Игровой движок, который сам пишет игру

Unity выпустила открытую бету ИИ- агентных инструментов встроенных в редактор.
Ассистент видит сцену, понимает объекты, правит код и откатывает изменения, если сделал ошибку.

🤖 Три слоя интеграции: Агентный ассистент (Ask/Plan/Agent) работает внутри редактора, разбирается в иерархии объектов и состоянии машин анимаций.
AI Gateway подключает любую стороннюю модель в редактор, трафик идёт через инфраструктуру Unity.
MCP Server связывает Unity с IDE: Cursor, VS Code, Antigravity, Claude Code работают с проектом напрямую.

⚙️ От игрушки к инструменту: Plan Mode: задаёшь задачу, агент планирует шаги, показываешь план, одобряешь, он реализует.
Figma-to-UI: вставляешь ссылку на макет, ассистент вытаскивает визуальные ассеты и генерирует UI Toolkit или uGUI код.
Скиллы: модульные расширения для конкретных задач (UI, Scene Creator). Разработчик может писать свои скиллы под проект.
Откат и трассировка: каждое действие агента можно отменить, сгенерированные ассеты помечаются автоматически.

💼 Зачем бизнесу: Unity первой из крупных игровых движков встроила агента в рабочий процесс, а не в отдельный чат.
$10/мес за Personal Edition, бесплатно для Pro/Enterprise. Кредиты расходуются на генерацию, можно использовать сторонние модели через Gateway бесплатно.

Кто быстрее встроит ИИ в pipeline разработки, тот задаёт стандарт. Epic с Unreal пока молчит про агентные инструменты такого уровня.

Игры, конечно, делать станет ещё проще, но кто в них играть-то будет? Steam и так выглядит как кладбище, - купил и забыл.
Реально играют в от силы игр 5, остальные лежат чисто для коллекции.

#Unity #геймдев #агенты #MCP
------
@tsingular
95🔥4🏆421💯1
Джек Кларк из Anthropic написал один из самых тревожных прогнозов про ближайшие годы AI.

Полностью автоматизированный AI R&D, где frontier-модель сама обучает следующую версию себя, может появиться гораздо раньше, чем многие думают.

Его оценка: около 30% вероятности к концу 2027 года и больше 60% к концу 2028-го.

Речь о системе, которая может сама пройти полный цикл: поставить исследовательскую задачу, запустить эксперименты, улучшить архитектуру, обучить преемника, проверить результат и повторить процесс.

Кларк не считает, что это почти наверняка случится уже в 2026-м. Но он допускает, что в ближайшие 1-2 года мы можем увидеть первый proof-of-concept: AI, который end-to-end обучает не frontier-модель, но уже полноценного «наследника» без постоянного ручного управления.

Почему прогноз стал таким агрессивным?

Модели резко усилились в coding, long-horizon agents, работе с subagents, оптимизации kernel, fine-tuning, воспроизводимости экспериментов и даже alignment research. То, что раньше выглядело как отдельные навыки, постепенно складывается в одну цепочку AI-исследователя.

Модель улучшает инструменты, инструменты ускоряют исследования, исследования рождают новую модель, а новая модель повторяет цикл еще быстрее.

https://x.com/jackclarkSF/status/2051312759594471886
👍12🔥7🤔54😁3
Forwarded from AI Insider
В Китае научились извлекать энергию из угля без его сжигания

Исследовательская группа из Шэньчжэньского университета разработала то, что они называют топливным элементом прямого действия на основе угля с нулевым выбросом углерода. Его разработка ведется с 2018 года и еще далека до финала, хотя стабильные версии «угольной батарейки» уже изготовлены. Ее главное достоинство в том, что уголь в процессе выработки энергии больше не надо сжигать, как это десятками лет происходило на угольных электростанциях.

Как поясняют китайские ученые, они очень долго совершенствовали свои познания в материаловедении и экспериментировали с разными конструкциями угольного элемента. Зато теперь настолько поднаторели в этих вопросах, что готовы применить технологию для выработки энергии прямо в толще земли. Вместо того, чтобы извлекать уголь на поверхность, можно создать генератор непосредственно в месте залегания этого вещества, что обеспечит колоссальную экономию средств и ресурсов.
🤯26188👍54🆒1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Figure вышел на серийную сборку робота Figure 03

Американская компания, разрабатывающая гуманоидных роботов, объявила о переходе своего производственного комплекса BotQ из стадии прототипирования в режим серийного выпуска.

Темп сборки третьего поколения робота Figure 03 менее чем за 4 месяца дней вырос с 1 экземпляра в сутки до 1 в час. Всего, как утверждает Figure, со сборочной линии сошло более 350 машин.

🟡Компания приводит метрики внутренних показателей качества.

Доля годных изделий по итогам контроля заявлена на уровне выше 80%, для аккумуляторных модулей - 99,3% при отгруженных более чем 500 батарейных блоках.

По словам Figure, всего выпущено свыше 9 000 сервоприводов более 10 типов. Каждый робот проходит 80 функциональных тестов перед отгрузкой, включая продолжительные испытания с тысячами циклов приседаний, жимов и бега.

🟡Вместе с этой новостью анонсировано обновление управляющей модели Helix System 0.

По описанию разработчиков, алгоритм управления телом робота впервые связан напрямую с данными бортовых камер: изображения с головных RGB-сенсоров преобразуются в трёхмерное представление сцены и поступают в управляющую политику вместе с информацией о положении суставов.

Обучение проводится методом RL в симуляции, а перенос на физического робота происходит без дополнительной донастройки.

Рост парка компания представляет как дополнительный ресурс ресурс: чем больше роботов работает в реальной среде, тем больше данных собирается для обучения системы Helix System 0.

Часть гуманоидов Figure распределяет по внутренним исследовательским группам, часть направляет на коммерческие проекты и сценарии автоматизации бытовых задач.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
65👾5
GigaChat как сердце агента: подключить получилось, пользоваться нет

На прошлой неделе я писал, что Алиса пока больше похожа на воркфлоу: сценарий есть, а нормальной работы с нечеткими задачами нет. Я уже тогда захотел чекнуть Гигачат, тормозил гемор с ротацией API ключей.

Вчера у Паши вышел пост про gpt2giga — адаптер для моделей GigaChat через OpenAI-совместимое API. Утилита мне понравилась — не надо думать об обновлении токенов, есть поддержка и OpenAI и Anthropic API. Пошел тестить на своём OpenClaw, тем более что у Паши в Hermes был успешный тест.

🧪 Тест с помехами

Взял тот же кейс про барбершоп:

«Проверь расписание моего барбера в Топгане Хорошёво, он на какой-то набережной, барбер самый дорогой».

Задача мутная: есть опечатки, нет точного адреса, нет имени мастера, есть только намёк на филиал и критерий по цене.

Расчет, что агент воспользуется сначала поиском, потом браузером. Все тулы уже есть. Более того, в обвязке лежит скилл для этой же задачи и есть отдельный субагент чисто под записи. Вариантов записаться масса.

⚙️ Хорошая новость: оно вообще подключается

Через gpt2giga GigaChat действительно можно завести в агентную систему. Всё работает и базовые кейсы успешны.

В изолированном тесте GigaChat-2-Pro умеет вернуть вызов функции. Пример с web_search отработал нормально: модель вернула вызов инструмента. На этом тесте я предположил, что раз мы можем найти барбершоп, то и барбера сможем.

OpenClaw у меня имеет 22 инструмента. И вот в такой конфигурации начались проблемы.

😀 Забегая вперед скажу, что руки (тулы) модель иногда чувствует. Проблема в том, что она не всегда понимает, что ими надо пользоваться.


🤖 Какие были проблемы

Модель ведет себя совешенно разнообразно.

1️⃣ В одном запуске Гигачат Про ответил, что у него нет доступа к интернету или браузеру. Хотя инструменты были переданы.

2️⃣ В повторном запуске он увидел скилл про запись к барберу, но не прочитал его, не сделал поиск, не открыл браузер. Просто написал: «воспользуемся навыком» — и попросил уточнить мастера.

3️⃣ Когда я попросил использовать web_search, инструмент наконец вызвался. Изолированно на русском языке хорошо. В обвязке OpenClaw на русском всё ок, для транслита не осилила search для topgan horoshevo и вызвала web_fetch(url=https://topan.horoshevo). Но это я придираюсь.

Короче говоря тестовая песочница может вызвать тул, но на сложных наборах данных всё ломается. Может даже сломаться аргумент.

💸 А теперь экономика

По тарифам GigaChat для юрлиц GigaChat 2 Pro стоит 0,5 ₽ за 1 000 токенов, GigaChat 2 Max — 0,65 ₽ за 1 000 токенов. Для физлиц пакет GigaChat 2 Pro на 3 млн токенов стоит 1 500 ₽.

Ссылки на тарифы: юрлица, физлица.

Мой OpenClaw ест примерно 140 млн токенов за 7 дней (спасибо Heartbeat). Если считать на месяц, получится примерно 300-400 тыс руб в месяц за Гигачат.

Один только запрос про барбершоп у меня сжигал от 15 000 до 46 000 токенов: системный промпт, память, скиллы, схемы инструментов и т д.

🚧 Интересно, что на 4-х тестах и одном запросе про барбера я получил ошибку: пора платить. 50 000 онбординг токенов улетели и пришлось платить 1500 рублей чтобы продолжить свои исследования.


🧩 Главный вывод

Суверенный ИИ — нужная штука. Я правда хочу, чтобы российские модели можно было использовать не только в пресс-релизах, но и в реальных агентных системах. Чтобы не переживать, как там дела у моих подписок в ОпенИИ.

Но если за суверенный ИИ может платить только корпорация, массового внедрения не будет.

🤔 Школьник может купить подписку на несувeренный ChatGPT примерно за цену пары доставок еды и получить модели, которые стабильнее работают с инструментами. Ценообразование фактически за токены, без дисконта для подписок вряд ли привлечет массу людей.


Кто уже пробовал GigaChat в агентах? У вас инструменты вызываются стабильно или тоже начинается лотерея?

----

Поляков считает — AI, код и кейсы
👍242🔥1