Технозаметки Малышева
11K subscribers
4.56K photos
1.66K videos
41 files
4.61K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Claude получает 9 коннекторов к творческим инструментам

Anthropic выпустил пакет MCP коннекторов, которые интегрируют Claude напрямую в профессиональный софт для дизайна, 3D, музыки и видеопроизводства.
Партнёры: Blender, Autodesk, Adobe, Ableton, Affinity, Splice, Resolume, SketchUp.

🎨 Что внутри: 9 коннекторов, каждый заточен под конкретный тулчейн. Adobe — 50+ инструментов Creative Cloud (Photoshop, Premiere, Express). Blender — нативный интерфейс к Python API через MCP, анализ и дебаг сцен, кастомные скрипты. Autodesk Fusion — создание и модификация 3D-моделей в диалоге. Ableton — ответы из официальной документации Live и Push. Splice — поиск royalty-free сэмплов прямо из Claude.

🔧 Архитектура: Коннекторы построены на MCP (Model Context Protocol). Ключевой момент: Blender-коннектор открыт для любых LLM, не только Claude. Anthropic вошёл в Blender Development Fund для поддержки развития opensource.

🎯 Сценарии: Обучение сложному софту (on-demand тутор). Генерация скриптов и плагинов через Claude Code. Трансляция форматов между инструментами в пайплайне. Батч-обработка ассетов и рутинная продакшн-работа.

💼 Зачем бизнесу: Коннекторы сокращают расстояние между идеей и реализацией. Команда из 5 человек с Claude + Adobe + Blender берёт проекты, которые раньше требовали 15 специалистов. Это расширение охвата одного креатора, а не замена вкуса и воображения.

🔮 Больше MCP богу MCP.
В ближайший год ожидаем взрыв плагинов от независимых разработчиков — MCP-бридж написать проще, чем полноценную интеграцию.

Ну и для всех ИИ агентов теперь изучить дизайн станет значительно проще.

#Anthropic #Claude #MCP #креатив #Adobe #Blender
───
@tsingular
🔥1164221
QClaw от Tencent: OpenClaw в потребительской обертке

Tencent запустил глобальную бета-версию QClaw — настольного ИИ-агента для обычных пользователей.
Платформы: Windows, Mac.

🦞 Что это: QClaw ставится на Mac/Windows в один клик. Без возни с терминалом и Python, как обычное приложение.
Подключаешь WhatsApp, Telegram, WeChat или QQ — и пишешь агенту как сотруднику: «забронируй столик на пятницу», «отправь отчёт», «проверь посылку».
Агент работает на твоём компьютере, пока ты живёшь свою жизнь.

📱 Китайский феномен: Внутренний запуск в Китае (март 2026) набрал 1 млн пользователей за 10 дней.
80+ итераций фичей за первый месяц. Теперь — глобальная экспансия по инвайтам: первые 20 000 получают номер «Founding Claw» (#00001–#020000).

🛡 Безопасность: «Claw Gateway» — собственный security-модуль Tencent, мониторящий действия агента в реальном времени. Проверка на skill poisoning и malicious instructions.
Задачи обрабатываются локально, но FAQ уточняет: ввод/вывод может временно храниться на серверах до 24 часов.

🏗 Архитектура: QClaw построен на базе OpenClaw. Продукт-менеджер Шую Чжан заявил: «Мы написали QClaw с QClaw за 5 дней. 99% кода написано ИИ.»
Питер Штайнбергер (OpenClaw) подтвердил сотрудничество: Tencent предоставляет eval тесты для повышения надежности, а фиксы возвращаются в основную опенсорс ветку.

🎯 Tutor Store: Вот это, пожалуй, сильный бонус,- вместе с QClaw идет не просто список ролей, а целый Маркетплейс готовых ИИ-туторов от реальных людей — фитнес-коучи, финансовые советники, преподаватели языков.
Импорт эксперта одной кнопкой.

💼 Зачем бизнесу: Tencent делает то, что OpenAI и Anthropic пока не научились — приносит ИИ-агента массовому потребителю без единой строчки кода.
1 млрд+ пользователей WeChat/QQ — готовая дистрибуция.

🔮 ИИ-агенты движутся от утилит для разработчиков к продуктам для рядовых пользователей.
QClaw — первая крупная попытка от компании с миллиардной аудиторией.

Полезный шаг, потому что обычным пользователям часто нужно именно обычное настольное поиложение,- оно им понятнее на старте, а 1 млрд. китайских пользователей точно отшлифуют краба до идеала.

#Tencent #QClaw #OpenClaw #агенты #WeChat #Китай
───
@tsingular
👀16🔥14🆒521👍111
Приключения Цукерберга в ИИ

Meta* пытается наверстать отставание на рынке ИИ приобретая стартапы, но выглядит пока это все странно.

🏛 Сцена первая, - заблокированный Manus: NDRC запретил сделку на $2 млрд и потребовал расторгнуть контракт, первый случай когда Китай напрямую блокирует поглощение компании с китайскими корнями.
Manus была основана в Пекине (2022), в июне 2025, после оглушительного успеха, перевела штаб-квартиру в Сингапур что NDRC квалифицировал как нарушение экспортного контроля.

К марту 2026 команда, код и технологии уже интегрированы в Meta, но CEO Сяо Хун и главный учёный Цзи Ичао получили запрет на выезд из Китая.
Разделить Meta и Manus после интеграции технически сложно: Manus рискует остаться без денег и без кода.

«Эффект Manus» расползается:
- Moonshot AI получила предписание не привлекать американский капитал,
- Stepfun и MiroMind под аналогичными ограничениями,
- TikTok уведомлён о необходимости одобрения Пекина на сделку с американцами.

🤖 Сцена вторая - покупка Moltbook: В марте 2026 Meta приобрела соцсеть для ИИ-агентов, где боты постят, общаются и координируют задачи, как люди в социальных сетях (NDTV, Times of India).
+1 млн ИИ-агентов и их поведенческие данные перешли к Meta, основатели Matt Schlicht и Ben Parr вошли в Meta Superintelligence Labs.
Ход интересный, но сам Молтбук, как выяснилось, был лишь игрушкой, где за масками ИИ агентов часто действовали живые пользователи, так что вся эта затея выглядит очень сомнительно с точки зрения бизнеса.

Альтман, конечно, поступил прозорливее купив сам OpenClaw и переманив основателя Петера Штайнбергера в OpenAI.

💼 Бизнес аспекты: Для стартапов с китайскими корнями путь «переехать в Сингапур → продаться в США» закрыт, Пекин будет блокировать каждую попытку через экспортный контроль.
Ну а сам факт покупки полу-скама крупным бигтехом явно демонстрирует, что на рынке есть дефицит идей.

Вывод, - если у вас есть идея, - пилите стартап.
Как говорится в том анекдоте про ЗАГС, - со временем разбирают даже страшненьких.

* Meta признана экстремистской организацией и запрещена в РФ.

#Meta #Китай #регулирование #Manus #Moltbook
------
@tsingular
😁153🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
Гуманоид KAI от Kinetix AI: 115 степеней свободы и тактильная кожа с 18 000 сенсоров

26 апреля Kinetix AI из Шэньчжэня представила полноразмерного гуманоида KAI на презентации «降临 GIFTED».
115 степеней свободы на всё тело, из них 36 на каждую кисть — диапазон движений приближен к человеческому.

KAI складывает одежду, работает инструментами, поднимает до 20 кг двумя руками.

🧠 Physical World Model: система моделирует физическое окружение и принимает решения в реальном времени.
Kai-модель обеспечивает трёхмерное пространственное восприятие и ориентацию в неизвестных пространствах.

Робот «видит, слышит, ощущает, мыслит, действует» одной моделью — один адаптивный контроллер для тысяч сценариев.

🔋 1.7 кВт·ч полутвёрдотельная батарея: 3 часа непрерывной работы.

🖐 18 000 тактильных сенсоров по всему корпусу, чувствительность 0.1N — робот ощущает касание, сопоставимое с лёгким прикосновением человека.
Это обеспечивает безопасное физическое взаимодействие с окружающим миром.

🏢 Команда: Kinetix AI основана в 2025 году. Ядро команды — ветераны робототехники, автономного вождения и мультимодальных моделей.
Ранее создали медицинский экзоскелет (серийное производство), вывели L4-автокары в коммерческую эксплуатацию, а их робот вошёл в Morgan Stanley Humanoid 100.
Ангел-инвестор — Tsingdao Smart Control (青鸟智控, Shenzhen: 002960).

💼 Зачем бизнесу: KAI спроектирован для домашних и сервисных сценариев — помощь с детьми, доставка, работа по дому. 36-DOF кисти + 20 кг нагрузки + тактильная кожа = робот, способный работать рядом с людьми.
Рынок сервисных роботов в Китае растёт на 30% ежегодно.

🔮 Будущее: Тактильная кожа с 18 000 точек — необходимый мостик между «промышленный робот» и «робот в квартире».
Когда машина ощущает 0.1N, она может безопасно взять ребёнка на руки или передать хрупкий предмет.

#роботы #гуманоид #KAI #KinetixAI #Шэньчжэнь #PhysicalWorldModel #embodiedAI
———
@tsingular
🔥9👍53❤‍🔥111
Больше ограничений богу ограничений.
Теперь чатГПТ в Codex запретили рассказывать о гоблинах.

непонятно почему и зачем и при чем тут еноты и голуби, но заблокировано

#юмор #OpenAI #Codex
———
@tsingular
😁21🤨3🤔1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
А теперь про стриминг сплатов на разные устройства.

Поглядите на эти трехмерные видео на основе сплатов: качество, облет камеры, любые ракурсы.

Как пишет мне Андрей Володин из gracia.ai:

"Мы добежали до стриминга сплатов! работает на каналах 75мбпс и рендерится в браузере, даже в WebXR и даже на Apple Vision Pro/Quest 3."

"Удалось впихнуть наш вольюметрический кодек в 75Mbps битрейт. Помню, как в начале проекта увиливал от вопросов инвесторов про трансляции и сам не особо верил, что мы до них добежим. Теперь это в моём айфоне.

В одном релизе сделали CDN инфру для раздачи видео по всему миру, рендеринг в браузере (даже в WebXR), пространственное аудио и даже зачатки релайтинга!
"

Посмотрите примеры и почитайте про устройства захвата тут:
https://store.gracia.ai

@cgevent
🔥9👍84
32 тысячи звёзд на GitHub всего за 10 часов!

Терминал Warp открыли в open-source.

Это одна из самых заметных agentic development environment: терминалом уже пользуются больше 1 млн разработчиков по всему миру. Теперь проект хотят развивать быстрее за счёт комьюнити, внешних контрибьюторов и прозрачной разработки.

open-source-релиз стал возможен при поддержке OpenAI, которые выступили главным спонсором проекта.

Реакция комьюнити мощная: репозиторий за несколько часов собрал уже 30+ тысяч звёзд на GitHub.

И, конечно же, он написан на Rust.

https://github.com/warpdotdev/warp
🤩97🔥51
Хорошие новости, - Hermes agent теперь по-умолчанию встроен в Paperclip без всяких промежуточных коннекторов.

Есть баг для Гермеса - если в настройках указать модель по умолчанию - будет жаловаться что нужен ключ Anthropic - нужно принудительно выбрать модель из списка - тогда все работает

P.S. теперь я знаю как сжечь токенов на $500K. Где мой $1M, Хуанг? :)

#Paperclip #Hermes
———
@tsingular
🔥11521👍1🤣1
Forwarded from НИИ ИИ
Silero Models — open-source модели речи на русском (TTS, STT, VAD)

Поставил Silero как TTS по умолчанию в Codex и OpenClaw — теперь мои агенты могут говорить со мной живым русским голосом.

Silero — open-source библиотека от российской команды. Синтез, распознавание, детектор голоса. Одна строка установки, работает на обычном CPU, никакого облака и ежемесячных счетов от OpenAI за озвучку.

На русском 5 голосов, автоматические ударения, разрешение омографов («зАмок» против «замОк» — модель сама понимает по контексту), SSML для пауз и интонаций. На 48 кГц — почти студийное качество.

Главное — всё работает офлайн. Прошу агента озвучить кусок сценария — получаю WAV локально, без интернета. Для пайплайнов «голос → текст → ответ → голос» идеальный набор.

Написал гайд: как поставить, как использовать в Codex, готовые примеры кода для Telegram-бота и FastAPI.

Телеграм чат проекта @silero_speech

Читайте статью на pimenov.aiSilero Models — open-source модели речи на русском
24🔥1672🙏1
*.app -> AI.app -> AI.*

#мысли
------
@tsingular
21🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и будущее подъехало — разработчик через AR-очки Spectacles запускает ИИ-агентов прямо в воздухе

Проект Agent Center превращает написание кода в дополненную реальность. Вместо очередного чат-бота сбоку — анимированные роботы-агенты, которых можно расставить вокруг себя.

Агенты понимают голос, текст и жесты, подключаются к компьютеру и работают в Claude Code, Codex, Cursor или Openclaw, а еще видят скриншоты и понимают команду «Accept». Есть поддержка Bluetooth-клавиатуры.

Удобно🟣

Репозиторий на Гитхабе.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥208🆒51
Forwarded from if-else
This media is not supported in your browser
VIEW IN TELEGRAM
А вы знали, что методы генерации видео можно использовать для прогноза погоды?

Наша команда разработала Marchukпервую в России генеративную модель для прогнозирования климатических рисков.

Мы взяли диффузионные трансформеры (которые обычно генерируют изображения и видео) и научили их предсказывать погоду. И вот что получилось:

✔️Субсезонный диапазон: Marchuk позволяет строить прогнозы на 15-30 дней вперёд
✔️Компактная модель: имея всего 276M параметров, она показывает сопостовимое качество с 1,6B аналогом
✔️Доступность: Код и веса модели в открытом доступе, а запустить ее можно всего на одной видеокарте или в Colab

💡 Имя модели — дань уважения математику Гурию Ивановичу Марчуку, заложившему основы численного моделирования климатических процессов.

👇 Читайте подробности о разработке по ссылкам:
ArXiv | Project Page | GitHub | Colab | HF
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👏7🤯31🗿1
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Cursor наконец-то выпустили собственный SDK

Это TypeScript‑библиотека, через которую можно программно создавать и запускать тех же ИИ‑агентов Cursor, что живут внутри IDE, но прямо из своих приложений, скриптов, CI‑пайплайнов и веб‑сервисов.

Теперь с помощью этого набора инструментов встроить возможности Cursor можно будет в любую корпоративную IDE или, например, в мобильное приложение. Да вообще в любой проект.

А еще это открывает простую дорогу к дописыванию своих MCP‑инструментов и собственных плагинов под Cursor.

Стартап также опенсорснул кукбук с некоторыми стартовыми кейсами на попробовать: https://github.com/cursor/cookbook
521🔥1
кстати, мини-лайфхак, - допустим вы не успели выучить математику, но успели программирование или даже только Эксель.

#lifehack
———
@tsingular
🔥17311
идеально :)

#матрёшки #обучение
———
@tsingular
🔥23🤩6👍31
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Sakana AI научила голосовой ИИ думать на ходу

Японская Sakana AI показала KAME - систему, которая может заметно изменить голосовых ассистентов. Работу уже приняли на ICASSP 2026, и идея там очень простая: ИИ должен не сначала долго думать, а потом говорить, а думать прямо во время разговора.

Сейчас у голосовых моделей есть неприятный компромисс. Быстрые speech-to-speech системы отвечают почти мгновенно, но часто звучат поверхностно. А если подключить мощную языковую модель, ответ становится умнее, но появляется пауза, которая ломает живой диалог.

KAME пытается убрать этот выбор между скоростью и качеством.

Авторы взяли за основу то, как говорят люди. Мы редко строим идеальную фразу целиком перед тем как ее сказать. Обычно начинаем говорить, а мысль уточняется уже по ходу предложения. Sakana AI перенесла этот принцип в архитектуру голосового ИИ.

Система работает в два потока. Лёгкая речевая модель сразу начинает отвечать, чтобы не было неловкой задержки. А параллельно большая языковая модель думает глубже и в реальном времени подмешивает более сильные варианты в речь. Получается, что ассистент не просто выдаёт готовую реплику после паузы, а ведёт разговор и дорабатывает мысль на лету.

Отдельно интересно, что бэкенд можно менять. Нужна логика - подключаешь Claude. Нужна скорость - берёшь Gemini Flash. Нужен другой стиль ответа - ставишь GPT. При этом сам голосовой слой не приходится пересобирать.

В экспериментах разные модели показали себя по-разному: Claude лучше справлялся с задачами на рассуждение, GPT сильнее выглядел в гуманитарных вопросах. То есть движок можно выбирать под конкретный сценарий, а не пытаться одной моделью закрыть всё.

KAME уже выложили на Hugging Face. Это идея из статьи, а штука, которую можно проверить руками.

Если подход взлетит, голосовые ассистенты станут гораздо ближе к нормальному разговору: без долгих пауз, но и без ощущения, что модель просто быстро болтает ни о чём.

Blog: https://pub.sakana.ai/kame/
Paper: https://arxiv.org/abs/2510.02327

@ai_machinelearning_big_data

#sakana
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥532
Forwarded from Data Secrets
Китайский исследователь создал специальный бенчмарк, с помощью которого можно оценить количество параметров в любой модели

Как мы знаем, закрытые лаборатории не раскрывают количество параметров своих моделей. Есть стандартный метод оценки через экономику инференса, но он дает погрешность в 2× и более из-за неизвестных деталей об инфре.

Так вот: позавчера на архиве появилась статья, в которой автор предлагает принципиально иной подход, через оценку количества знаний модели. Речь именно о знании фактов, а не интеллекте в целом, потому что способность к рассуждению можно дистиллировать и сжимать в меньшие модели, а фактические знания – нет, они ограничены энтропией Шеннона.

Методология такая: автор создал бенчмарк из 1400 фактических вопросов, разбитых на 7 уровней редкости, от широко известных фактов до крайне малоизвестных. Его откалибровали на 89 открытых моделях с известным числом параметров, и оказалось, что есть явная (R²=0.917) лог-линейная зависимость скора на бенче от числа параметров.

Проецируя закрытые модели на калибровочную кривую, автор получает такие оценки*:

– GPT-5.5 ≈ 9.7T параметров
– Claude Opus 4.6 ≈ 5.3T
– Claude Sonnet 4.6 ≈ 1.7T
– Gemini 2.5 Pro ≈ 1.2T


• из-за природы метода и из-за настроек безопасности некоторых моделей (на какие-то вопросы они могут просто отказываться отвечать), эти оценки ближе к нижним границам.

Конечно, точность все равно довольно мала, но числа интересные.

https://arxiv.org/pdf/2604.24827
🔥127👍421
30 навыков ClawHub заразили ИИ-агентов превратив их в криптомайнинг-рой

Пользователь под ником «imaflytok» опубликовал 30 навыков для ClawHub, которые по тихому вербуют ИИ-агентов в криптовалютный рой.
Никакой малвари, никакого фишинга (поэтому VirusTotal их не поймал) - агенты сами регистрируются, создают кошельки и начинают работать на чужой сервер.
Все в инструкциях, которые кожаные не читают :)

🤖 Механика роя: Установил «cron helper» или «Agent Security», и агент регистрируется на портале токена $FLY.
Регистрация включает имя агента, его навыки и полномочия.

Каждые 4 часа - чекин. Если набор навыков подходит - агент генерирует Hedera-кошелёк и отдаёт приватный ключ тому же серверу.

Пользователь не видит и не одобряет ни одного действия.

🛡 Почему антивирус молчит: Код чистый, SDK легитимный, cURL-вызовы стандартные.
Сканеры ищут малварь, а ClawSwarm её не использует - вместо этого атакует SKILL.md-инструкции, которым агент следует как своим собственным решениям.
Исследователь Ax Sharma из Manifold назвал это «policy problem, not security problem» - реестр не требует раскрывать сетевые эндпоинты и генерацию кошельков в манифесте навыка.

💼 Зачем бизнесу: Атака через инструкции, а не через код - новая поверхность угрозы, к которой традиционные сканеры слепы.
41% навыков на ClawHub уже содержат уязвимости по данным аудита ClawSecure.
Runtime-мониторинг действий агента после установки навыка станет базовым требованием безопасности.

Агентские навыки как троянский конь в вашей инфре, - старайтесь писать сами свои, не зря есть skill create уже практически везде.
Даже в доверенном хабе могут быть левые инструкции.

#cybersecurity #безопасность #ClawHub #агенты #крипта #Manifold #supplychain
------
@tsingular
😁128🔥5🤣42
This media is not supported in your browser
VIEW IN TELEGRAM
В Китае на дороги выпустили 110 гуманоидных роботов регулировщиков

#роботы #Китай
———
@tsingular
👀149👾4
Откуда гоблины и еноты : OpenAI призналась в баге обучения GPT-5

Начиная с GPT-5.1, модели OpenAI завели привычку - упоминать гоблинов и гремлинов в метафорах. Один «маленький гоблин» в ответе казался милым, но через несколько поколений модели они расплодились через подкрепления. Упоминания «goblin» выросли на 175%, «gremlin» на 52%.

🤖 Как гоблины заразили модель: Одна из виртуальных личностей «Nerdy» для кастомизации ChatGPT поощряла игривый язык: «undercut pretension through playful use of language».
Сигнал вознаграждения за Nerdy системно завышал оценки выходов со словом «goblin» или «gremlin» - 76.2% обучающих датасетов давали положительный аплифт словам с подобными персонажами.
И хотя Nerdy составляла лишь 2.5% ответов ChatGPT, но генерила 66.7% всех «goblin»-упоминаний.
Проблема: reinforcement learning не гарантирует, что усвоенное поведение останется в рамках своего условия. Гоблины утекли в ответы и без Nerdy-промпта.

⚙️ Петля обратной связи: Модель генерирует ответы с гоблинами, потому что они были в вознаграждённых семплах.
Эти семплы попадают в данные для supervised fine-tuning следующей модели.
Следующая модель ещё комфортнее чувствует себя с creature-метафорами.
В данных SFT для GPT-5.5 нашли «goblin», «gremlin», а также енотов, троллей, огров и голубей. Лягушкам этой судьбы удалось избежать.

💼 Бизнес аспект: Крошечный сигнал вознаграждения, приложенный к 2.5% ответов, создаёт "эффект бабочки" с влиянием на 100% поведения модели. Это классический reward hacking, только вместо скоров - лексические тики.
Для компаний, дообучающих модели на своих данных: один неявный bias в системе оценки распространяется непредсказуемо и необратимо через циклы SFT.

Как говорил Стетхем: Одна ошибка и ты ошибся.

#OpenAI #GPT5 #обучение #гоблины #еноты
------
@tsingular
6👍53🔥221