Технозаметки Малышева
11.3K subscribers
4.67K photos
1.72K videos
41 files
4.72K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bbb
Download Telegram
В итоге Qwen3.6-35B-A3B-MTP-GGUF на M5 max (запускал с 3мя предсказателями) показывает 92 т/с при том что это Q8 квант

brew install llama.cpp
llama-server -hf ggml-org/Qwen3.6-35B-A3B-MTP-GGUF \
--spec-type draft-mtp --spec-draft-n-max 3 --port 8080


на этой же машине qwen3.6:35b в олламе (который Q4) показывает 62 т/с

Т.е. еще раз, - MoE MTP с Q8 быстрее Q4 без MTP в 1.5 раза!

Очень быстро, очень нравится :)

#MTP #llamacpp #бенчмарки
———
@tsingular
🔥32542👍1
Forwarded from Machinelearning
⚡️ NousResearch выкатила новую 9B-модель, заточенную под tool calling и агентные coding workflows в Hermes Agent.

. На срезе из 200 задач SWE-bench модель набрала 53.33%. Для 9B это очень хорошая цифра, потому что обычно такие результаты ждут от моделей заметно крупнее и дороже в запуске.

Отдельно модель прогнали на HermesAgent-20. Там она получила 85 баллов против 71 у базовой версии. То есть дообучение дало не косметический прирост, а нормальный скачок именно в агентных сценариях.

Интересная деталь: авторы прямо советуют запускать её «горячо», с --temp примерно 1. Для таких fine-tune моделей это помогает сильнее отходить от поведения базовой модели и меньше застревать в чрезмерном обдумывании.

Если начинает вести себя нестабильно, температуру можно постепенно снижать.

Следом обещают выпустить Qwopus 3.6 27B. Предварительная оценка уже лежит в HF-репозитории автора, полный релиз модели должен выйти скоро.

https://huggingface.co/Jackrong/Qwopus3.5-9B-Coder-GGUF

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥53
Anthropic качает цифровых сотрудников - 11 ролей для Cowork

Мы уже рассматривали ранее коллекцию из 60+ навыков для Cowork для юридических агентов, а тем временем Антропики дополнили репозиторий ещё 10-ю ролями.

📋 11 ролей из коробки:
- Productivity (задачи и календарь),
- Sales (досье на клиентов, пайплайн),
- Customer Support (триаж тикетов, база знаний),
- Product Management (спецификации, роадмапы),
- Marketing (контент, кампании, фирменный стиль),
- Legal (триаж NDA, таблицы претензий, комплаенс),
- Finance (проводки, аудит),
- Data (SQL-запросы, дашборды),
- Enterprise Search (поиск по Slack/Notion/Jira),
- Bio Research (геномика, PubMed).
Плюс мета-навык для создания собственных ролей!

🔧 Как устроены: каждый плагин = папка с markdown-навыками, командами и MCP-коннекторами. Настройка под свою компанию: поменял коннектор на нужный CRM, добавил терминологию, подправил процесс, и Claude работает как нанятый специалист.

💡 Фишка: навыки подхватываются автоматически, без промпта. Сказал «сделай NDA-триаж», получил результат. Коннекторы тянут данные из Slack, Notion, Jira, HubSpot, Snowflake и ещё десятков систем через протокол MCP.

💼 Зачем бизнесу: 80% выручки Anthropic = корпоративные клиенты (Axios). Плагины закрывают главный запрос enterprise: агент должен знать наши процессы, а не только хорошо писать текст. Каждая роль превращает Claude из ассистента-универсала в сотрудника, который знает термины и инструменты конкретного отдела.
Для опенсорс-проекта это серьёзный ход: кастомизация за часы, а не месяцы.

Собственно пол года назад был создан прорывной навык "создай навык", а теперь создан навык "создай профессию"!
Время натравить Гермеса на этот репозиторий и вытащить каждый навык в отдельного агента, а мета навык по созданию новых ролей, - в основного.

#Anthropic #Claude #Cowork #навыки
------
@tsingular
7🔥74🤣2👍11
Deepseek словил сбой в РФ

В редакцию «Кода Дурова» поступают жалобы о недоступности китайской ИИ-платформы DeepSeek в России. Сайт не загружается, сообщения не отправляются без VPN.

Мы проверили соединение с сайтом специальной утилитой и обнаружили обрыв на этапе TLS — такое поведение характерно для сайтов, заблокированных Роскомнадзором.


РКН заявили, что они не связаны с проблемами в работе DeepSeek

Одна из версий - причина в блокировке cloudflare или AWS

#DeepSeek #РКН
———
@tsingular
29👀101👍1
Barclays: Китай заменит миллионы рабочих на роботов

К 2035 году, в силу демографического спада, Китай потеряет 37 млн рабочих рук. Вариант решения проблемы, - 24 млн гуманоидных роботов.

📋 Что происходит:
- Рабочая сила Китая сократится на 37 млн человек за десятилетие
- 24 млн гуманоидов компенсируют до 60% потерь (оптимистичный сценарий)
- Китай отгрузил 85% мировых инсталляций гуманоидов в 2025 году
- Unitree дропает цену ниже $20 000 за промышленного робота, зарплаты на фабриках растут 6-8% в год
- Пекин целит в 300 млрд юаней ($41 млрд) оборот рынка к 2035 году

🔧 Подводные камни: Из 150+ производителей лишь 23% покупателей довольны купленными роботами, а весь рынок отгрузил 13 000 единиц в 2025 году. Эффективность лучшего гуманоида еле дотягивает до половина человеческой.
От 13 тысяч до 24 миллионов - три порядка масштабирования, которые ещё нужно достичь.

💼 Зачем бизнесу: Гуманоиды сдвигают границу автоматизации с конвейерных задач на те, где нужны руки.
С другой стороны рост зарплат в китайском производстве робота всё привлекательнее с точки зрения рентабельности.
Barclays сравнивает физический ИИ со смартфонами 2007: рынки систематически недооценивают эффект.
Второй сдвиг: когда вместо людей дефицитом станут редкоземельные металлы и энергия, Китай уже доминирует на обоих фронтах.

Запоминаем, - Китай планирует произвести 24 млн роботов.
Конечно они все будут дружелюбно работать на заводах.
Верим.

#роботы #Китай #Barclays #гуманоиды #демография #автоматизация
------
@tsingular
87👍3👾333❤‍🔥1
Forwarded from Tech Crunch
Китайский военный ИИ во время испытаний превзошел реальных командиров

Национальный университет оборонных технологий Китая (NUDT) представил модель ИИ, действующего как «цифровой начальник штаба». Во время имитации десантных атак он превзошел многих опытных командиров, принимая решения на 43 % быстрее и сохраняя точность более 90 % при помехах связи. Это означает, что в сложной боевой ситуации ИИ может действовать эффективнее человека.

По имеющейся информации, данный ИИ уже внедряется в командные структуры батальонного звена Народно-освободительной армии Китая (НОАК). Система объединяет большие языковые модели с ситуацией на поле боя в режиме реального времени. При этом она отсеивает информационный шум, давая возможность командирам увидеть скрытые угрозы.

Таким образом, ИИ определяет «критически важные информационные потребности» — факторы, от которых зависит успех миссии. В качестве проверки эффективности командного ИИ, NUDT предложил сразиться ему с пятью опытными военными с 12-летним стажем службы.

ИИ ускорил цикл OODA (наблюдение, ориентирование, решение и действие), что позволило людям-командирам действовать на 43 % быстрее, чем раньше. В реальности, пока командиры выбирали алгоритм операции, ИИ уже действовал. Когда же на участников поединка обрушился вал радиоэлектронных помех, ИИ сохранил полное самообладание, действуя с эффективностью на уровне 90 %.
🔥20🤯12😢82👍1💯1
Энциклика Папы Льва XIV про ИИ — не про ИИ

Ватикан выпустил первую в истории папскую энциклику об ИИ. «Magnifica Humanitas» — 200 страниц про то, что концентрация власти в руках нескольких элит не стала новее от того, что к ней добавились нейросети.

🏛️ Контекст: Папа Лев XIV (бывший кардинал Превост) представил документ 25 мая в Ватикане вместе с Крисом Олой, сооснователем Anthropic. Не каждый день глава Католической церкви приглашает айтишника на презентацию энциклики.

⚖️ Суть документа: ИИ усиливает тех, у кого уже есть деньги, данные и доступ. Цитата: «Когда такая власть концентрируется в руках немногих, она стремится стать непрозрачной и уходить от общественного контроля». Лев XIV прямо называет это новой формой зависимости и манипуляции.

🕊️ Разоружение ИИ: Папа призывает остановить гонку за «всё более мощными алгоритмами и большими датасетами» ради геополитического или коммерческого доминирования. «Разоружение означает дискредитацию допущения, что техническая власть автоматически даёт право управлять».

🧠 Три вопроса Олы: Крис Ола в своём выступлении сформулировал три проблемы, где голос Церкви необходим: (1) долг перед глобальными бедными — ИИ вытеснит труд миллионов, и механизма распределения выгод нет; (2) моральное воображение — что значит процветание человека, семьи, мира в эпоху ИИ?; (3) природа самих моделей — Ола признал, что внутри ИИ-систем находят структуры, «зеркалящие результаты нейронауки», включая состояния, функционально похожие на радость, страх и горе.

🔥 Политический фон: Энциклика вышла через 4 дня после того, как Трамп отложил подписание executive order по ИИ — по настоянию Дэвида Сакса, бывшего AI-царя Белого дома и венчурного инвестора. Символично.

💼 Зачем бизнесу: Документ Ватикана — не юридический акт, а моральный компас. Но он формирует глобальный нарратив: концентрация ИИ-власти без общественного контроля теряет легитимность. Компании, игнорирующие этот тренд, получат регуляторное давление и репутационные риски. ESG-рейтинги уже учитывают AI governance.

🔮 Будущее: Риторика Папы совпадает с растущим запросом на «disarm AI» — от EU AI Act до разговоров о международных договорах. Энциклика легитимизирует позицию, что ИИ — не частное дело лабораторий, а общественный вопрос. Anthropic, кстати, оказался единственной AI-компанией, допущенной к трибуне.

#ИИ #Ватикан #Anthropic #регулирование #этика #MagnificaHumanitas
───
@tsingular
👍155🔥32🤔1
Stable Audio 3.0: музыка без копирайт ограничений

Stability AI выпускает сразу четыре звуковых модели с открытыми весами, лицензированными данными и правом коммерциализации. Композиция на телефоне, треки до шести минут, LoRa-дообучение из коробки.

📋 Что в семействе:
- Small SFX (0.6B) - звуковые эффекты прямо на телефоне, без GPU
- Small (0.6B) - полноценная музыка на устройстве
- Medium (2B) - связные треки до 6:20, мелодическая цельность
- Large - флагман для платформ, через API и self-hosting

🔧 Под капотом: Архитектура с семантико-акустическим автоэнкодером (SAME). Генерация переменной длины с точностью до секунды. Small выдаёт до 2 минут вместо 11 секунд у прошлой версии. Впервые опубликована документация по LoRa-дообучению на собственной фонотеке.
Аудио-инпейнтинг: редактирование фрагментов, продление треков без пересоздания.

💡 Ключевое: Три из четырёх моделей обучены на лицензированных данных. Под Community License ты владеешь результатом и можешь продавать.
Конкуренты с открытыми весами обычно либо ограничивают коммерцию, либо тренируются на нелицензированной музыке.
Для оборота свыше $1 млн - Enterprise License с юридической защитой.

💼 Зачем бизнесу: Генеративный звук перестаёт быть юридической лотереей.
Разработчикам игр, рекламных платформ и контент-сервисов - единый конвейер от прототипа до продакшена без угрозы авторских исков.

🔗 Альтернативы:
- ACE-Step - Suno-киллер, open-source, вокал + полные треки
- Suno / Udio - закрытые, с авторскими спорами

#StableAudio #генеративныйзвук #openweights #музыкальныйИИ #StabilityAI
------
@tsingular
👍11🔥63
Claude API: скам прокси со скидками под 95%

Официальная цена Anthropic: $15 за миллион токенов для многих достаточно кусачая.
Но на Taobao и Xianyu появились предложения с доступом к Claude Opus за $1-2 в день.
Разница в десятки раз, но по факту, - это тот самый бесплатный сыр в мышеловке.

📋 Как устроен сервис: Прокси-станции на VPS за $5. Тысячи фейковых аккаунтов через браузеры с защитой от обнаружения.
Паспорта генерирует ИИ.
Для KYC - дипфейк лица в реальном времени.
Маржа перепродажи: 80%+.
Результат: 24 000 фейковых аккаунтов и 16 млн+ запросов от лабораторий DeepSeek, Moonshot (Kimi) и MiniMax, которые системно откачивали рассуждения Claude для дистилляции.

🔧 Подмена модели: Исследование Oxford (ChinaTalk, май 2026): в ~46% случаев прокси подменяет Opus на Haiku, GLM, Kimi или Gemini Flash.
Дашборд токенов фальшивый. Т.е. пользователь думает, что получил Opus, а по факту работает Haiku.
На простых задачах разница не заметка, но вот на сложных - падение качества очевидно.

💡 Настоящая цель - данные: Каждый промпт, ответ, строка кода, документ, вызов инструмента и цепочка рассуждений логируется.
Данные перепродаются или используются для дистилляции китайских моделей.
Миллионы разговоров и десятки миллиардов токенов уже попали в обучающие выборки.

💼 Зачем бизнесу: Если ваша команда использует сторонние прокси для доступа к облачным моделям - вы сливаете коммерческую тайну, код, стратегию и переписку туннелирующиму сервису.
Anthropic фиксирует популярные прокси и блокирует аккаунты. Экономия в $13 за миллион токенов обходится в утечку данных и подмену моделей.

#Claude #Anthropic #API #скам #cybersecurity
------
@tsingular
🤯137💯21
SkillOpt: качалка для навыков от Microsoft

Промпт-инженеринг мёртв, fine-tuning дорог. Microsoft Research предложила третий путь: оптимизировать текст навыка агента как обучаемые параметры, не трогая саму модель.
Эпохи, батчи, learning rate, валидация - всё как в глубоком обучении, только в пространстве текста.

📋 Что получаем:
- Средний прирост +24.9pp на GPT-5.4-nano, +23.5pp на GPT-5.5 без единого изменения весов
- 52 из 52 конфигураций:
SkillOpt лучше или равен всем бейзлайнам (no-skill, human skill, LLM skill, TextGrad, GEPA, Trace2Skill)
- Перенос навыка между моделями (+15.2pp), харнесами (+31.8pp из Codex в Claude Code) и задачами
- На выходе - один файл best_skill.md, который можно версионировать, аудировать и деплоить

🔧 Как устроено:
Цикл напоминает обучение нейросети.
Rollout - target model выполняет задачи с текущим навыком, собирая траектории успешности.
Reflect - отдельный optimizer анализирует батчи удач и провалов.
Edit - предлагает ограниченные правки (add/delete/replace) в пределах бюджета - это текстовый learning rate, предотвращающий разрушительные переписывания.
Gate - правка принимается только если улучшает результат на отложенной выборке.
Rejected-буфер и slow update работают как память сессии, не давая оптимизатору повторять ошибки.

💡 Фишка:
Навык - не промпт, а внешний артефакт. SkillOpt превращает ad-hoc инструкции в систематически оптимизируемое процедурное знание.
Например GPT-5.4-nano как свой собственный оптимизатор даёт +10.4pp на SpreadsheetBench - цикл работает даже без сильного оптимизатора.

Код открыт: github.com/microsoft/SkillOpt, 804 звезды, есть WebUI для мониторинга.

💼 Зачем бизнесу:
Агентные системы часто застревают на ручной оптимизации промптов.
SkillOpt автоматизирует эволюцию: запустил цикл, получил best_skill.md, деплой.
Для Hermes Agent и аналогичных фреймворков навыки - центральный артефакт.
Перенос между моделями и харнесами означает, что один оптимизированный навык обслуживает несколько агентов без перенастройки.

Конкуренты: TextGrad, GEPA (Databricks/DSPy), Trace2Skill (Alibaba/Qwen). SkillOpt обходит всех по стабильности на 52 конфигурациях.

#SkillOpt #Microsoft #навыки #оптимизация
------
@tsingular
19🔥52👏1
DuckDuckGo: спрос вырос на 30%, - пользователи бегут от принудительного ИИ-поиска Google

На I/O 2026 Google объявил о замене классических ссылок с результатами поиска на ИИ-агента, который отвечает на запросы, выполняет задачи и запускает фоновый мониторинг. Народ не оценил.

📉 Отток: Установки DuckDuckGo в США выросли на 18,1% за неделю (20–25 мая) с пиком 30,5% 25 мая. На iOS — ещё агрессивнее: средний рост 33%, пик 69,9%. Посещения страницы noai.duckduckgo.com (где все ИИ-фичи отключены по умолчанию) росли на 22,7% неделю к неделе.

🗳️ Выбор без принуждения: Опрос DuckDuckGo на 110,000 респондентов — 93% активно отвергают ИИ-функции в поиске. CEO Габриэль Вайнберг: «Google впихивает ИИ без возможности отказаться. Результаты становятся хуже, а не лучше. Мы чтобы решал пользователь».

🛡️ Приватность с пользой: шлюз Duck.ai так же даёт доступ к Claude 4.5 Haiku, Llama 4 Scout, Mistral Small 3 и GPT-5 mini — без аккаунта, с удалением IP-адресов перед отправкой запросов, удалением чатов через 30 дней и запретом на обучение моделей на ваших данных.

⚖️ Контекст: На антитрастовом процессе 2023 года Вайнберг заявил, что эксклюзивные контракты Google о поиске по умолчанию блокировали DuckDuckGo от дистрибуции. А теперь по сути Google сам гонит к ним пользователей.

💼 Бизнес аспект: Монополия на привычку пользователя хрупка. Google только что доказал: навязывание ИИ без возможности отключения не улучшает продукт.

Так мы дойдём и до момента, когда "без ИИ" станет маркетинговой фичей 😀

#Google #DuckDuckGo #поиск
───
@tsingular
😁1075🔥2🤣1
Microsoft MAI-Image-2.5, - новый генератор изображений на подходе

По версии Arena.ai на сегодняшний день лидером по генерации изображений является GPT-Image-2 с отрывом в +242 Elo от Google, который на втором месте с Flash Image.
И вот Microsoft врывается в тройку: MAI-Image-2.5 стартовал с Elo 1254, на 72 очка выше предшественника.

📋 Что умеет: Рендер текста в изображениях, визуальная композиция сложных сцен, точное следование промпту. Mustafa Suleyman подчёркивает: модель заточена под профессиональную графику, а не игрушки.
Чистые макеты, упаковка, постеры с читаемым текстом.
- Текст: шрифты без артефактов, логотипы, вывески
- Композиция: масштаб, свет, пространственные отношения
- Промпт-адекватность: сложные коммерческие и стилизованные запросы

🔧 Как разрабатывали: Microsoft выстроила собственную линейку с нуля, без OpenAI. MAI-Image-1 (конец 2025), MAI-Image-2 (март 2026), MAI-Image-2-Efficient (апрель), MAI-Image-2.5 (май). Четыре релиза за полгода.

🔗 Аналогичные проекты:
- GPT-Image-2 - лидер Arena.ai, Elo 1512, лучший рендер текста
- Gemini 2.5 Flash Image - второй на Arena, силён в фотореализме и редактировании
- Luma UNI-1.1 - открытый конкурент, ~1254 Elo
- Recraft V4.1 - вошла в топ-10, 1243 Elo

#Microsoft #MAI #ArenaAI
------
@tsingular
6👍51🆒1
Anthropic встроила security-ревьюера в Claude Code

Пока конкуренты цепляют security-сканирование к CI/CD, Anthropic встроил проверки кода на безопасность в момент написания. Security-guidance plugin для Claude Code ловит уязвимости, пока агент их пишет, в той же сессии, а не на PR.

📋 Что получаешь:
- Pattern match на каждой редакции: eval(), pickle, dangerouslySetInnerHTML, без модели, мгновенно
- Фоновый model review после каждого хода: authorization bypass, SSRF, слабая криптография, отдельный вызов Claude с чистым контекстом
- Агентный ревью на коммитах: читает окружающий код, отличает опасный код в изоляции от безопасного в контексте
- Кастомные орг-правила через .claude/claude-security-guidance.md

🔧 Как устроено:
Плагин работает на хуках, тех же, что доступны любому разработчику Claude Code. Три слоя: deterministic match → background diff review → agentic commit review. Проверяет не тот экземпляр, который писал код, а отдельный с чистым контекстом. Не блокирует записи: обнаружения и выводы приходят как инструкции, которые Claude адресует следующим шагом.

💡 Фишка:
Anthropic dogfooding (испробовали на себе): 30-40% снижение security-комментов на PR. Кастомные правила в security-patterns.yaml (до 50 regex) превращают повторяющиеся замечания из разовых комментов в политику репозитория.

💼 Зачем бизнесу:
Shift-left security в агентном программировании, это плагин с измеримым результатом, а не абстракция. Единственный минус пока, - плагин не сканирует пакеты перед установкой. Паттерн «фоновый ревьюер» повторяем: performance, accessibility, cost, следующие кандидаты.
Скоро такие плагины станут стандартом в агентной обвязке.
Было бы полезно не только для кодовых агентов, кстати.

#ClaudeCode #cybersecurity #Anthropic
------
@tsingular
54🔥31
SearXNG: Личный поисковик из 246 движков за 5 минут

SearXNG предлагает решение для хостинга обработки поисковой выдачи локально: вы хостите его сами, поисковики видят только IP вашего сервера, а результат чистится, - без рекламы, ИИ подсказок и трекинга.

📋 Что получаешь:
- Агрегация результатов от 246 поисковых сервисов: Google, Bing, DuckDuckGo, Brave, Qwant, Wikipedia, GitHub и десятки других
- JSON API из коробки: программный доступ к результатам для скриптов, агентов, RAG-пайплайнов
- Ноль логов, ноль профилей, ноль рекламы. Работает через Tor
- Docker-деплой одной командой, обновления подтягиваются сами

🔧 Как устроено:
SearXNG работает как прокси-оркестратор. Параллельно шлёт ваш запрос сразу десяткам движков, дедуплицирует и ранжирует результат. API Google и Bing видят запрос с IP сервера, а не с вашего ноутбука. Конфигурация через settings.yml: включаете нужные движки, настраиваете прокси, отключаете категории. Кэш на Valkey (Redis-форк) ускоряет повторные запросы.

💡 Фишка:
Уже 30K звёзд на GitHub, активное комьюнити (22% контрибьюторов возвращаются каждый квартал), AGPLv3. SearXNG появился в 2021 как форк заброшенного Searx, когда команда мейнтейнеров ушла из-за конфликтов по code-review. За четыре года форк обогнал оригинал по всем фронтам.

💼 Зачем бизнесу:
Компании встраивают SearXNG в AI-пайплайны как приватный слой поиска: нет сторонних API, нет ключей, нет логов у провайдера. Для самохостинга подойдёт Raspberry Pi или самый дешёвый VPS. Прогноз: метапоиск станет стандартным компонентом self-hosted AI-стеков, как Nginx для веб-серверов.

Команда для Гермеса:

изучи и установи себе как навык для поиска: 
https://docs.searxng.org/admin/installation-searxng.html#installation-basic
перед установкой проверь свободные порты
устанавливай только на 127.0.0.1
режим установки контейнера - с автоподнятием после перезагрузки


Ключи не нужны. Всё бесплатно.

UPD: Внимание - конфиг по умолчанию поднимает его на 0.0.0.0 для всех - обязательно переконфигурировать на 127.0.0.1

#SearXNG #поиск #self-hosted #Docker #метапоиск
------
@tsingular
🔥19👍842
Лучшие ученики года.
Дальше: Работник месяца, - Гермес

#юмор
———
@tsingular
😁45💯5🔥2
xAI выкатила Grok Build: CLI агент-разработчик

Лавры Антропика не дают успокоиться Илону Маску, - xAI выпустил Grok Build с 14 мая в бете для SuperGrok Heavy, а 25 мая открылся для всех подписок SuperGrok и X Premium+.

📋 Что дают:
- Plan Mode: агент составляет пошаговый план, вы утверждаете, комментируете или переписываете шаги до начала выполнения
- Параллельные субагенты: крупные задачи делегируются специализированным воркерам, каждый в своём git worktree
- ACP (Agent Coordination Protocol) из коробки: мультиагентная оркестрация и headless-режим для CI/CD
- Читает AGENTS.md, CLAUDE.md, .grok/ - полная совместимость с экосистемой Claude Code
- Imagine встроен: генерация изображений и видео прямо из CLI

🔧 Как устроено:
Grok Build работает как оркестратор. Plan Mode включает режим «только чтение»: агент исследует кодовую базу, предлагает план действий, вы редактируете шаги и даёте добро. Только после одобрения начинается выполнение.
Субагенты запускаются параллельно в отдельных git worktree, не конфликтуя между собой.
С 20 мая под капотом grok-build-0.1,- модель заточенная под программирование.

💡 Фишка:
Grok Build подхватывает привычки Claude Code: плагины, хуки, навыки, MCP-серверы. Переезд с Claude Code минимален: AGENTS.md работает без изменений. Есть управление с клавиатуры: Ctrl+W для нового worktree, Ctrl+S для резюме, Ctrl+Q для выхода.

Установка:

curl -fsSL https://x.ai/cli/install.sh | bash
grok


Сложно сказать зачем нам ещё один агент-программист по цене в 2 раза дороже Дипсика v4 pro в opencode - но пусть будет :) вдруг где-то лимиты закончатся.

#GrokBuild #xAI #CodingAgent #CLI #Grok
------
@tsingular
👍92🔥2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
ElevenLabs Music V2

Обновили свою модель генерации музыки.

Inpainting - можно перегенерить только выбранную часть трека.
Быстрые смены стиля прямо внутри одного трека
Немузыкальные шумовые эффекты внутри треков.

Но самое интересное, что они обещают API, чего нет у SUNO.

Впрочем, китайские умельцы уже давно соорудили лайфхаки:
https://kie.ai/suno-api

@cgevent
🔥8👍532
Forwarded from RoboFuture
Вчера выступал на DataFest с докладом «Что такое harness и Ralph Loop» - за 23 минуты рассказал, что это за новый тип агентов, как они устроены и какие с ними можно делать прикольные вещи. Запись уже на YouTube

Важный дисклеймер про сам термин

Слово harness🐴 пока не устоялось. Формально им можно назвать любого AI-агента, само слово переводится как "упряжка" для LLM (то есть любая обвязка вокруг модели, которая помогает ей выполнять работу)

Но по факту в индустрии последние полгода харнесом всё чаще называют именно консольных универсальных агентов (и продукты на их основе), которые работают с файлами и bash - Claude Code, Codex CLI, Cursor, OpenClaw, Hermes и десятки других. У таких агентов всегда есть четыре базовых тула (read/search/edit/bash), а вводные инструкции даются через AGENTS.md

В докладе

Рассказываю о том, что такое harness, какие виды харнесов бывают, как мы выбирали opensource для Сбера и почему в процессе выбора нам пришлось создать свой OSS бенчмарк для их быстрой оценки. В процессе создания мы пришли к тому, что запустили процесс эволюционного улучшения агента по мотивам AutoResearch Карпатого. Во второй части доклада рассказываю о том, что такое Ralph Loop - харнес внутри бесконечного цикла. Какие задачи этот агент может решать, как долго может работать, пока не схлопнется, и как можно решать эту проблему с помощью моих экспериментов с Anima

- 1:32 - эволюция агентов: чистые LLM -> ReAct -> цепочки -> scaffolding -> harness -> каким будет следующий шаг?
- 5:45 - анатомия современного harness'а: 4 базовых тула, runtime loop, управление контекстом, режимы human-in-the-loop vs human-on-the-loop
- 11:07 - как мы в Сбере выбирали harness под GigaChat и почему остановились на DeepAgent от LangChain
- 15:29 - свой open-source бенчмарк для harness'ов + автоулучшение через autoagents "по Карпатому" - оставил эволюцию на выходные и получил +22,5 процентных пункта качества
- 18:52 - Ralph Loop: засовываем harness в bash-цикл, чтобы он мог работать днями над одной задачей
- 21:04 - backpressure и Meta-Loop как защита от схлапывания
- 22:11 - Anima SDK как средство борьбы со схлапыванием - что получилось, когда я запустил агента в Meta-Loop'е с задачей "стань разумным существом" и оставил на 5 дней (писал недавно в канале)

Основные проекты из доклада:
- презентация в PDF
- deepagents
- deepagents-gigachat
- наш бенчмарк для харнесов
- Anima SDK - набор скриптов для запуска харнесов в режиме meta-loop
1🔥21👍9442
Huawei представила закон масштабирования Тау — замену закону Мура

На конференции IEEE ISCAS в Шанхае глава полупроводникового направления Huawei Хэ Тингбо показала то, что шесть лет скрывалось за дверями R&D. Пока мир упирается в потолок EUV-литографии, китайцы выкатили альтернативу,- Закон масштабирования Тау (τ Scaling Law): не догнать уходящий поезд, а переизобрести правила игры.

⚙️ Что такое Тау-закон: Вместо уменьшения расстояния между транзисторами (классический закон Мура) — уменьшение времени прохождения сигнала. Тау (τ) — постоянная времени RC-цепи: произведение сопротивления на ёмкость, по сути, как быстро сигнал долетает от точки А до точки Б. Huawei оптимизирует этот показатель на четырёх уровнях одновременно: отдельный прибор, электрическая схема, целый кристалл, система межсоединений. Такой подход позволяет наращивать производительность без доступа к EUV-оборудованию.

🧊 Как работает LogicFolding: Фирменная технология 3D-укладки кристаллов с расстоянием между слоями меньше двух микрометров. Это не «провода» между слоями, а активные вычислительные пути. Как небоскрёбы в мире микроэлектроники: конкуренты строят одноэтажные дома на плоскости, а Huawei растит этажи вверх.

Главная проблема 3D-стека,- перегрев средних слоёв,- решена через встроенное охлаждение — микрожидкостные каналы с теплоносителем прямо между активными слоями.

📊 Цифры и дорожная карта: Плотность транзисторов вырастет с текущих 126 миллионов на квадратный миллиметр до более 400 миллионов к 2031 году. Частота ядра поднимется с 2,6 до 5 гигагерц. Производительность системы — рост в 125 раз к 2030 году. С 2020 года уже произведён 381 чип по этим принципам. Осенью 2026 выйдет следующий Kirin — первый потребительский процессор с полноценным LogicFolding.

💼 Зачем бизнесу: Санкции 2019 года отрезали Huawei от EUV-литографии ASML — компания не может печатать транзисторы мельче определённого размера. Вместо попыток догнать недоступное железо переизобрели методологию проектирования. Теперь у них независимый путь развития на годы вперёд. Для дата-центров и AI-нагрузок это означает рост плотности вычислений без привязки к западному оборудованию.

Deepseek последний как раз на чипах Huawei.
Может поэтому и может себе позволить цену в 15 раз ниже западных аналогов при схожем качестве.

#Huawei #semiconductors #AI #chips
------
@tsingular
🔥21🤯9👍541
Hermes[DeepSeek v4 Pro]:

Правильный ответ — (Г) На Московском вокзале.

Лингвистическая ловушка: в Москве говорят «шаурма», а в Петербурге — «шаверма». Московский вокзал (с большой буквы) — это имя собственное, вокзал в Санкт-Петербурге. Там и стоит ларёк с надписью «ШАВЕРМА».

Варианты (А) и (Б) отпадают сразу — Москва. (В) «на московском вокзале» со строчной — описательное, любой вокзал в Москве, тоже шаурма

.


Ну AGI. Можно выдавать паспорт. 😀

#юмор
------
@tsingular
😁37🔥133👏2