Технозаметки Малышева
11K subscribers
4.56K photos
1.66K videos
41 files
4.61K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
Nebius покупает Eigen AI за $643 млн

Nebuis продолжает наращивать интеллектуальный слой ИИ инфраструктуры, на этот раз приобретая Eigen, - команду выходцев из MIT HAN Lab (разработчики AWQ - стандарта) и исследователей из DeepMind, OpenAI, Amazon AGI.

💰 Цена вопроса: $98 млн + 3,8 млн акций Nebius Class A (30-day VWAP).

Команда Eigen:
Ryan Hanrui Wang (CEO), автор SpAtten, самой цитируемой статьи HPCA с 2020 года.
Wei-Chen Wang, лучший paper MLSys 2024 за AWQ quantization, теперь стандарт для 4-bit serving в production.
Di Jin (MIT CSAIL PhD), работал над post-training Llama 3 и Llama 4, соавтор CGPO RLHF-фреймворка.

⚙️ Что покупают: Полноценный стек оптимизации инференса:
- Model layer — квантизация, pruning, MoE-роутинг, KV-cache, speculative decoding
- System layer — шедулеры, continuous batching, prefill/decode disaggregation, tensor/pipeline/expert параллелизм
- Kernel layer — fused операторы, кастомные attention-ядра, low-bit matmul

Поддержка GPT-OSS, Gemma, Qwen, Llama, Nemotron, DeepSeek, GLM, Kimi, MiniMax.

🔗 Зачем Nebius:
Технология вливается в Nebius Token Factory — управляемая платформа инференса с автоскейлом и fine-tuning под Qwen, Llama, DeepSeek, GLM, Kimi, MiniMax, Nemotron.
Получается такой полный вертикальный стек:
Infrastructure → Kernel → System → Model → Platform.

На практике это позволит:
- Open-source модели на Nebius будут запускаться быстрее и дешевле конкурентов
- Day-one оптимизация для новых релизов (Qwen, DeepSeek и пр.)
- RL post-training доступен прямо на платформе — без своего ML-team
- Команда Eigen остаётся в полном составе, открывают R&D офис в Bay Area

Кстати, недавно, в феврале этого года, Nebius так же приобрел поисковик Tavily за $275 млн.

💼 Зачем бизнесу: Inference забирает 2/3 спроса на вычисления в 2026 году.
Nebius резервирует мощности под Token Factory, берёт наценку за скорость и делает ставку на программную оптимизацию поверх того же железа.
Скоро конкуренция в neocloud уйдёт от «у кого больше GPU» к «кто выжимает больше токенов с каждого чипа».

#Nebius #EigenAI #inference #инфраструктура #датацентры
------
@tsingular
832🆒211
Робот-лошадь на тонну груза, - это вам не игрушка

Пока Кавасаки готовит Corleo, пекинская Dax Robotics показала Qiji T1000, четырёхного робота, который может тащить тонну и работать двое суток. Настало время робомулов.

🤖 Тоннаж: Несущая способность: 1000 кг. Крутящий момент суставов: 2000+ Н·м, в пять раз выше индустриального среднего.
Сверхмощная батарея: 1–2 дня автономности.
Снег, лёд, склоны, грязь, камни: без проблем.

⚙️ От игрушки к инструменту: Классические робособаки (Unitree, Boston Dynamics) несут до 20 кг.
T1000 работает как лёгкий грузовик, но там, куда грузовик не доедет: горные тропы, пожарные зоны, высокогорные патрули.
Партнёрство с SF Express и KJ Logistics уже оформлено.

💼 Зачем бизнесу: Формируется новая ниша: тяжёлые наземные роботы для мест, куда не доедет колёсная техника.
Горное строительство, арктические экспедиции, пожарная логистика: каждая из этих зон сегодня опирается на человеческий труд с риском для жизни.
Скоро роботы, которые могут тащить тонны грузов станут стандартом оснащения для спасательных и строительных ведомств, как дроны стали стандартом для аэрофотосъёмки.

📺 Робособаки из «Чёрного зеркала» покажутся шуткой, когда в бой пойдёт тяжелая артиллерия.

Когда уже человекоподобных меха-воинов начнут выпускать по типу как в Тихоокеанском рубеже, интересно? :)
Или хотя бы как в Атласе.

#роботы #Китай #DaxRobotics #мулы #лошади
------
@tsingular
🔥23933👀21👾1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересная зарисовка из эфира про openclaw агентов.

пара примеров, - как openclaw помогает наблюдая за своим человекогочи (Хито-тчи) :)
и второй - когда агента подключили к управлению Теслой с правом перестройки маршрута.

#openclaw #кейсы
———
@tsingular
1🔥12👾8🤣2👀21
Media is too big
VIEW IN TELEGRAM
Hermes Agent получил Kanban: агенты теперь работают как команда

Nous Research встроила в Hermes Agent 0.12 канбан-доску. Шесть колонок, SQLite под капотом, живой дашборд, и главное: агенты сами разбирают задачи и передают контекст дальше по цепочке.

🤖 Мультиагентность: Каждая задача привязана к профилю: свои инструменты, навыки, личность.
Задачи связываются цепочками parent → child: родитель завершился, дочерняя автоматически переходит в ready.
Structured handoff: завершая задачу, агент оставляет --summary и --metadata. Следующий подхватывает без перечитывания документации.

⚙️ Инфраструктура: SQLite: данные переживут краши, рестарты, ребуты.
No double-claims: несколько агентов претендуют на задачу, побеждает один.
Heartbeats + runtime caps: долгие задачи не умирают, убегающие прибиваются.
Проектная изоляция: несколько проектов на одной машине без перекрёстного загрязнения.
Канбан-оркестратор и канбан-воркер уже в комплекте.

💼 Зачем бизнесу: Kanban в Hermes переводит мультиагентную работу из «запусти и молись» в наблюдаемый процесс с доской, историей прогонов и контролем.
Скоро паттерн «оркестратор + несколько специализированных воркеров» станет дефолтом для автоматизации: PM-агент декомпозирует, инженерные агенты пишут код, ревьюер-агент проверяет. Люди смотрят дашборд и вмешиваются при блокировке.

Так то и Paperclip особо не нужен. Гермес сам себе рой.

Клип про канбан тоже такой вот рой с канбаном сделал.

Инструкция

#Hermes #Kanban #мультиагенты #AI #рой #NousResearch
------
@tsingular
🔥20👍11411🤔1🙏1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Unity AI: Игровой движок, который сам пишет игру

Unity выпустила открытую бету ИИ- агентных инструментов встроенных в редактор.
Ассистент видит сцену, понимает объекты, правит код и откатывает изменения, если сделал ошибку.

🤖 Три слоя интеграции: Агентный ассистент (Ask/Plan/Agent) работает внутри редактора, разбирается в иерархии объектов и состоянии машин анимаций.
AI Gateway подключает любую стороннюю модель в редактор, трафик идёт через инфраструктуру Unity.
MCP Server связывает Unity с IDE: Cursor, VS Code, Antigravity, Claude Code работают с проектом напрямую.

⚙️ От игрушки к инструменту: Plan Mode: задаёшь задачу, агент планирует шаги, показываешь план, одобряешь, он реализует.
Figma-to-UI: вставляешь ссылку на макет, ассистент вытаскивает визуальные ассеты и генерирует UI Toolkit или uGUI код.
Скиллы: модульные расширения для конкретных задач (UI, Scene Creator). Разработчик может писать свои скиллы под проект.
Откат и трассировка: каждое действие агента можно отменить, сгенерированные ассеты помечаются автоматически.

💼 Зачем бизнесу: Unity первой из крупных игровых движков встроила агента в рабочий процесс, а не в отдельный чат.
$10/мес за Personal Edition, бесплатно для Pro/Enterprise. Кредиты расходуются на генерацию, можно использовать сторонние модели через Gateway бесплатно.

Кто быстрее встроит ИИ в pipeline разработки, тот задаёт стандарт. Epic с Unreal пока молчит про агентные инструменты такого уровня.

Игры, конечно, делать станет ещё проще, но кто в них играть-то будет? Steam и так выглядит как кладбище, - купил и забыл.
Реально играют в от силы игр 5, остальные лежат чисто для коллекции.

#Unity #геймдев #агенты #MCP
------
@tsingular
95🔥4🏆421💯1
Джек Кларк из Anthropic написал один из самых тревожных прогнозов про ближайшие годы AI.

Полностью автоматизированный AI R&D, где frontier-модель сама обучает следующую версию себя, может появиться гораздо раньше, чем многие думают.

Его оценка: около 30% вероятности к концу 2027 года и больше 60% к концу 2028-го.

Речь о системе, которая может сама пройти полный цикл: поставить исследовательскую задачу, запустить эксперименты, улучшить архитектуру, обучить преемника, проверить результат и повторить процесс.

Кларк не считает, что это почти наверняка случится уже в 2026-м. Но он допускает, что в ближайшие 1-2 года мы можем увидеть первый proof-of-concept: AI, который end-to-end обучает не frontier-модель, но уже полноценного «наследника» без постоянного ручного управления.

Почему прогноз стал таким агрессивным?

Модели резко усилились в coding, long-horizon agents, работе с subagents, оптимизации kernel, fine-tuning, воспроизводимости экспериментов и даже alignment research. То, что раньше выглядело как отдельные навыки, постепенно складывается в одну цепочку AI-исследователя.

Модель улучшает инструменты, инструменты ускоряют исследования, исследования рождают новую модель, а новая модель повторяет цикл еще быстрее.

https://x.com/jackclarkSF/status/2051312759594471886
👍12🔥7🤔54😁3
Forwarded from AI Insider
В Китае научились извлекать энергию из угля без его сжигания

Исследовательская группа из Шэньчжэньского университета разработала то, что они называют топливным элементом прямого действия на основе угля с нулевым выбросом углерода. Его разработка ведется с 2018 года и еще далека до финала, хотя стабильные версии «угольной батарейки» уже изготовлены. Ее главное достоинство в том, что уголь в процессе выработки энергии больше не надо сжигать, как это десятками лет происходило на угольных электростанциях.

Как поясняют китайские ученые, они очень долго совершенствовали свои познания в материаловедении и экспериментировали с разными конструкциями угольного элемента. Зато теперь настолько поднаторели в этих вопросах, что готовы применить технологию для выработки энергии прямо в толще земли. Вместо того, чтобы извлекать уголь на поверхность, можно создать генератор непосредственно в месте залегания этого вещества, что обеспечит колоссальную экономию средств и ресурсов.
🤯26188👍54🆒1
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Figure вышел на серийную сборку робота Figure 03

Американская компания, разрабатывающая гуманоидных роботов, объявила о переходе своего производственного комплекса BotQ из стадии прототипирования в режим серийного выпуска.

Темп сборки третьего поколения робота Figure 03 менее чем за 4 месяца дней вырос с 1 экземпляра в сутки до 1 в час. Всего, как утверждает Figure, со сборочной линии сошло более 350 машин.

🟡Компания приводит метрики внутренних показателей качества.

Доля годных изделий по итогам контроля заявлена на уровне выше 80%, для аккумуляторных модулей - 99,3% при отгруженных более чем 500 батарейных блоках.

По словам Figure, всего выпущено свыше 9 000 сервоприводов более 10 типов. Каждый робот проходит 80 функциональных тестов перед отгрузкой, включая продолжительные испытания с тысячами циклов приседаний, жимов и бега.

🟡Вместе с этой новостью анонсировано обновление управляющей модели Helix System 0.

По описанию разработчиков, алгоритм управления телом робота впервые связан напрямую с данными бортовых камер: изображения с головных RGB-сенсоров преобразуются в трёхмерное представление сцены и поступают в управляющую политику вместе с информацией о положении суставов.

Обучение проводится методом RL в симуляции, а перенос на физического робота происходит без дополнительной донастройки.

Рост парка компания представляет как дополнительный ресурс ресурс: чем больше роботов работает в реальной среде, тем больше данных собирается для обучения системы Helix System 0.

Часть гуманоидов Figure распределяет по внутренним исследовательским группам, часть направляет на коммерческие проекты и сценарии автоматизации бытовых задач.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
65👾5
GigaChat как сердце агента: подключить получилось, пользоваться нет

На прошлой неделе я писал, что Алиса пока больше похожа на воркфлоу: сценарий есть, а нормальной работы с нечеткими задачами нет. Я уже тогда захотел чекнуть Гигачат, тормозил гемор с ротацией API ключей.

Вчера у Паши вышел пост про gpt2giga — адаптер для моделей GigaChat через OpenAI-совместимое API. Утилита мне понравилась — не надо думать об обновлении токенов, есть поддержка и OpenAI и Anthropic API. Пошел тестить на своём OpenClaw, тем более что у Паши в Hermes был успешный тест.

🧪 Тест с помехами

Взял тот же кейс про барбершоп:

«Проверь расписание моего барбера в Топгане Хорошёво, он на какой-то набережной, барбер самый дорогой».

Задача мутная: есть опечатки, нет точного адреса, нет имени мастера, есть только намёк на филиал и критерий по цене.

Расчет, что агент воспользуется сначала поиском, потом браузером. Все тулы уже есть. Более того, в обвязке лежит скилл для этой же задачи и есть отдельный субагент чисто под записи. Вариантов записаться масса.

⚙️ Хорошая новость: оно вообще подключается

Через gpt2giga GigaChat действительно можно завести в агентную систему. Всё работает и базовые кейсы успешны.

В изолированном тесте GigaChat-2-Pro умеет вернуть вызов функции. Пример с web_search отработал нормально: модель вернула вызов инструмента. На этом тесте я предположил, что раз мы можем найти барбершоп, то и барбера сможем.

OpenClaw у меня имеет 22 инструмента. И вот в такой конфигурации начались проблемы.

😀 Забегая вперед скажу, что руки (тулы) модель иногда чувствует. Проблема в том, что она не всегда понимает, что ими надо пользоваться.


🤖 Какие были проблемы

Модель ведет себя совешенно разнообразно.

1️⃣ В одном запуске Гигачат Про ответил, что у него нет доступа к интернету или браузеру. Хотя инструменты были переданы.

2️⃣ В повторном запуске он увидел скилл про запись к барберу, но не прочитал его, не сделал поиск, не открыл браузер. Просто написал: «воспользуемся навыком» — и попросил уточнить мастера.

3️⃣ Когда я попросил использовать web_search, инструмент наконец вызвался. Изолированно на русском языке хорошо. В обвязке OpenClaw на русском всё ок, для транслита не осилила search для topgan horoshevo и вызвала web_fetch(url=https://topan.horoshevo). Но это я придираюсь.

Короче говоря тестовая песочница может вызвать тул, но на сложных наборах данных всё ломается. Может даже сломаться аргумент.

💸 А теперь экономика

По тарифам GigaChat для юрлиц GigaChat 2 Pro стоит 0,5 ₽ за 1 000 токенов, GigaChat 2 Max — 0,65 ₽ за 1 000 токенов. Для физлиц пакет GigaChat 2 Pro на 3 млн токенов стоит 1 500 ₽.

Ссылки на тарифы: юрлица, физлица.

Мой OpenClaw ест примерно 140 млн токенов за 7 дней (спасибо Heartbeat). Если считать на месяц, получится примерно 300-400 тыс руб в месяц за Гигачат.

Один только запрос про барбершоп у меня сжигал от 15 000 до 46 000 токенов: системный промпт, память, скиллы, схемы инструментов и т д.

🚧 Интересно, что на 4-х тестах и одном запросе про барбера я получил ошибку: пора платить. 50 000 онбординг токенов улетели и пришлось платить 1500 рублей чтобы продолжить свои исследования.


🧩 Главный вывод

Суверенный ИИ — нужная штука. Я правда хочу, чтобы российские модели можно было использовать не только в пресс-релизах, но и в реальных агентных системах. Чтобы не переживать, как там дела у моих подписок в ОпенИИ.

Но если за суверенный ИИ может платить только корпорация, массового внедрения не будет.

🤔 Школьник может купить подписку на несувeренный ChatGPT примерно за цену пары доставок еды и получить модели, которые стабильнее работают с инструментами. Ценообразование фактически за токены, без дисконта для подписок вряд ли привлечет массу людей.


Кто уже пробовал GigaChat в агентах? У вас инструменты вызываются стабильно или тоже начинается лотерея?

----

Поляков считает — AI, код и кейсы
👍242🔥1
Forwarded from Борис опять
Теперь я вижу полную картину! Да, не стоило добавлять фейри в борщ. Фейри нужно добавлять ПОСЛЕ съедения борща, чтобы очистить посуду. Хочешь я найду ближайшие травмпункты?
1🤣75😁743🔥1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
Hermes добавил скилл hyperframes

Теперь можно такие вот видосы пилить одним запросом

hermes skills install hyperframes

#Hermes #hyperframes
------
@tsingular
🔥19👍113
This media is not supported in your browser
VIEW IN TELEGRAM
🧑‍💻 Anthropic показали, как будут выглядеть готовые ИИ-агенты для профессий

Они выкатили 10 готовых ИИ-агентов для финансов, собрали готовые шаблоны под конкретные рабочие процессы: питчбуки, подготовку к встречам, анализ отчетности, финансовые модели, рыночный ресерч, проверку оценок, сверку главной книги, закрытие месяца, аудит отчетности и KYC. - Анонс

🪼 Внутри каждого агента уже упакованы skills, коннекторы и subagents для отдельных подзадач.

🪼 Можно использовать в трех форматах: как plugins внутри Claude Cowork, как plugins в Claude Code и как cookbooks для Claude Managed Agents.

🪼 Для удобства там привычные инструменты: Excel, PowerPoint, Word и Outlook. Например, агент может взять список компаний, собрать модель в Excel, набросать питчбук в PowerPoint и подготовить письмо в Outlook.

🪼 Плюс, есть коннекторы к финансовым данным и платформам вроде: FactSet, S&P Capital IQ, MSCI, PitchBook, Morningstar, LSEG, Daloopa и других поставщиков. То есть агент должен работать с теми источниками, которыми реально пользуются аналитики.

Anthropic показали, как будут выглядеть ИИ-агенты для профессий. Сегодня это финансы. Завтра такие же наборы будут для маркетинга, HR, юристов, продаж, образования и документооборота. Но так же, они и подчеркивают, что результат все равно должен проверять и утверждать специалист.

@NeuralProfit
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15851
This media is not supported in your browser
VIEW IN TELEGRAM
SubQ: первый субквадратичный LLM с окном 12 млн токенов

Стартап Subquadratic (Майами) вышел из тени с $29M seed и заявкой на архитектурный прорыв.

Модель SubQ 1M-Preview построена на SSA (Subquadratic Sparse Attention) — внимание растёт линейно с длиной контекста, а не квадратично.
На 12M токенов контекста это даст сокращение вычислений внимания почти в 1000×.

🧮 Архитектура: SSA не аппроксимирует внимание — она выбирает, какие пары токенов вычислять, а какие пропускать. Выбор зависит от содержания, не от позиции. Это отличает SSA от Longformer/BigBird (фиксированные маски), Mamba/RWKV (рекуррентное сжатие) и DeepSeek Sparse Attention (квадратичный индексер). Три свойства одновременно: линейная стоимость, контент-зависимая маршрутизация, извлечение с произвольных позиций.

Скорость: На Nvidia B200: 7.2× быстрее FlashAttention-2 при 128K токенах, 52.2× при 1M. Длиннее контекст — больше разрыв. CTO Алекс Уэдон (ex-Meta, ex-TribeAI): «Если удвоить вход с квадратичным законом — нужно 4× вычислений. С линейным — 2×.»

📊 Бенчмарки (third-party verified):
RULER 128K — 95.0% (Opus 4.6: 94.8%).
MRCR v2 1M — 65.9% (Opus 4.7: 32.2%, GPT-5.5: 74.0%).
SWE-Bench Verified — 81.8% (Opus 4.6: 80.8%).
Стоимость RULER 128K: $8 у SubQ vs ~$2600 у Opus — 300× дешевле при той же точности.

⚠️ Красные флаги: Три бенчмарка — все в зоне максимального преимущества SSA (длинный контекст, код). Общих тестов (математика, мультиязычность, безопасность) нет. Model card «coming soon». Research-результат MRCR v2 — 83, production — 65.9: разрыв 17 пунктов без объяснения. Каждый бенчмарк гонялся один раз без доверительных интервалов.
Technical report не опубликован.
Веса закрыты. API — private beta.

💸 Инвесторы: $29M seed, оценка $500M. Джастин Матин (Tinder), Хавьер Вильямисар (ex-SoftBank Vision Fund), ранние инвесторы Anthropic, OpenAI, Stripe. CEO Джастин Данжел — пятикратный фаундер. 11 PhD-исследователей из Meta, Google, Oxford, Cambridge, ByteDance.

🔧 Продукты: SubQ API (OpenAI-compatible), SubQ Code (CLI-агент для кода, интеграция с Claude Code/Codex/Cursor), SubQ Search (Deep Research на скорости чат-бота).
Всё пока в private beta.

💼 Зачем бизнесу: Если SSA работает как заявлено — RAG-пайплайны, чанкинг и многоагентная оркестрация перестают быть необходимостью для целого класса задач. Целый репозиторий, год PR-ов, длинная история агента — всё в одном вызове API. Экономика inference перестаёт быть главным ограничителем.

🔮 Будущее: Сообщество уже расколото — от «наиболее значимый архитектурный сдвиг со времён оригинального Transformer» до «AI Theranos». Правда будет где-то посередине: SSA может оказаться лучшей sparse-attention реализацией на сегодня, но 12M токенов в production — пока слова, требующие проверки.
До тех пор — самая интересная заявка на архитектурный прорыв года.

#SubQ #LLM #attention #архитектура #субквадратичный #контекст #SSA #стартапы
───
@tsingular
🤔104🔥42👍11
This media is not supported in your browser
VIEW IN TELEGRAM
12ти метровые лодки теперь печатают на 3Д принтере.

#печать #лодка
———
@tsingular
🔥40151
This media is not supported in your browser
VIEW IN TELEGRAM
Биологический актуатор для ИИ.

Видятся сценарии жёстче, чем игра на пианино.

Автовыстрел, к примеру.

Ваши версии?

#актуатор #контроллер #руки
------
@tsingular
15👀112🔥21👍1🤝1