Forwarded from TechSparks
Про FOMO мы все знаем, но, оказалось, есть прекрасное актуальное FOBO, и Кембриджский словарь еще в январе изучал, нужно ли его добавить;))
https://dictionaryblog.cambridge.org/2026/01/26/new-words-26-january-2026/
https://dictionaryblog.cambridge.org/2026/01/26/new-words-26-january-2026/
😢4👍2⚡1✍1
Автоматизация без ИИ: границы эффективности
О. Федоткин:
- недавно наш ИИ переписал за 2 часа сервис, который люди бы переписывали 2 месяца
А. Кафтанников:
- все ТЗ я теперь пишу с ИИ
М. Лунегова:
- любая ИИ трансформация ломается на людях. Если люди не готовы, - лучше не внедрять
- здравого смысла, чуйки и воображения в ИИ пока нет
И. Никитин (WMT AI https://t.me/Nikitinwmt):
- отказываемся от заказной разработки в пользу ИИвизациии, - внедрение навыков и мышления ИИ.
- Китай сильно притворяется, что он чуть чуть отстает. Там реально гораздо больше возможностей, чем в Штатах.
- термин ИИ всех сбивает с толку
- если начинается разговор о ТЗ - мы закрываем проект. Мы пробовали начинать внедрение с карты проекта, но это были провальные истории, потому что само мышление не изменилось.
- сначала нужно разобраться с тем, что у вас в голове
- только когда ты сам начинаешь вайбкодить ты можешь понять как ты можешь поменять концепцию своей компании
- все бизнес-процессы переписать в промпты
- перестроить компанию на абстракции, прописать SOUL.md компании
- надо писать мета-агентов, которые будут писать тебе агентов для других задач
- нужно чтобы CEO мог сам взять ИИ агента и усилить себя в 5 раз сам создав себе ИИ агентов (!!! интересно, что вчера выступая в Плехановке я как раз это и пытался показать студентам)
- мир будущего, когда сотрудники будут приходить со своими агентами
- ИИ не может вас заменить, потому, что он не может нести ответственность, но заменят молодые, более расторопные сотрудники с ИИ ( AI powered/ AI boosted people)
- В любой компании должны быть тысячи агентов
- ИИ компания автоматически создает собственный цифровой двойник, на котором можно тестировать гипотезы
- важно внедрять ИИ сразу и на всех уровнях с рядовых до CEO. внедрение в команды точечно не работает.
- ИИ надо нанимать, а не внедрять
#GTF
———
@tsingular
О. Федоткин:
- недавно наш ИИ переписал за 2 часа сервис, который люди бы переписывали 2 месяца
А. Кафтанников:
- все ТЗ я теперь пишу с ИИ
М. Лунегова:
- любая ИИ трансформация ломается на людях. Если люди не готовы, - лучше не внедрять
- здравого смысла, чуйки и воображения в ИИ пока нет
И. Никитин (WMT AI https://t.me/Nikitinwmt):
- отказываемся от заказной разработки в пользу ИИвизациии, - внедрение навыков и мышления ИИ.
- Китай сильно притворяется, что он чуть чуть отстает. Там реально гораздо больше возможностей, чем в Штатах.
- термин ИИ всех сбивает с толку
- если начинается разговор о ТЗ - мы закрываем проект. Мы пробовали начинать внедрение с карты проекта, но это были провальные истории, потому что само мышление не изменилось.
- сначала нужно разобраться с тем, что у вас в голове
- только когда ты сам начинаешь вайбкодить ты можешь понять как ты можешь поменять концепцию своей компании
- все бизнес-процессы переписать в промпты
- перестроить компанию на абстракции, прописать SOUL.md компании
- надо писать мета-агентов, которые будут писать тебе агентов для других задач
- нужно чтобы CEO мог сам взять ИИ агента и усилить себя в 5 раз сам создав себе ИИ агентов (!!! интересно, что вчера выступая в Плехановке я как раз это и пытался показать студентам)
- мир будущего, когда сотрудники будут приходить со своими агентами
- ИИ не может вас заменить, потому, что он не может нести ответственность, но заменят молодые, более расторопные сотрудники с ИИ ( AI powered/ AI boosted people)
- В любой компании должны быть тысячи агентов
- ИИ компания автоматически создает собственный цифровой двойник, на котором можно тестировать гипотезы
- важно внедрять ИИ сразу и на всех уровнях с рядовых до CEO. внедрение в команды точечно не работает.
- ИИ надо нанимать, а не внедрять
#GTF
———
@tsingular
👍11🔥8⚡6🆒1
Путь ИИ самурая по версии вселенной Starcraft
1. Автоматизируешь и роботизируешь как Terrain
2. Колдуешь ИИ техномагию как Protoss
3. Спавнишь рой ИИ зергов как Overlord
#юмор #Starcraft
------
@tsingular
1. Автоматизируешь и роботизируешь как Terrain
2. Колдуешь ИИ техномагию как Protoss
3. Спавнишь рой ИИ зергов как Overlord
#юмор #Starcraft
------
@tsingular
1🔥14👏4
This media is not supported in your browser
VIEW IN TELEGRAM
- но ведь форма головы и ушей у всех разная!
- это только до первой стрижки
#юмор #роботы
-----
@tsingular
- это только до первой стрижки
#юмор #роботы
-----
@tsingular
🤣56👍10🔥5❤1
Huawei Ascend 950PR: Китай выпускает новые чипы с поддержкой CUDA
Huawei готовит к массовой отгрузке новый ИИ-чип Ascend 950PR.
Ключевые заказчики, - ByteDance и Alibaba уже подтвердили планы закупок.
В этом году планируется отгрузка 750 000 единиц.
⚙️ Технические детали:
• Совместимость с CUDA:
Раньше Huawei принуждала разработчиков к своей архитектуре CANN, что влияло на совместимость. Теперь перенос моделей с NVIDIA на китайские чипы значительно упрощается.
• Приоритет инференса: Чипы оптимизированы под запуск моделей. На фоне бума агентских систем спрос на дешевое исполнение запросов в КНР зашкаливает.
💰 Экономика: Базовая версия на DDR — 50 000 юаней (~600 тыс. руб.), премиум с HBM — 70 000 юаней (~825 тыс. руб.). Это в разы дешевле дефицитных H100 на серых рынках.
Нам бы тоже пригодилось.
#Huawei #NVIDIA #ByteDance #Alibaba #Китай
───
@tsingular
Huawei готовит к массовой отгрузке новый ИИ-чип Ascend 950PR.
Ключевые заказчики, - ByteDance и Alibaba уже подтвердили планы закупок.
В этом году планируется отгрузка 750 000 единиц.
⚙️ Технические детали:
• Совместимость с CUDA:
Раньше Huawei принуждала разработчиков к своей архитектуре CANN, что влияло на совместимость. Теперь перенос моделей с NVIDIA на китайские чипы значительно упрощается.
• Приоритет инференса: Чипы оптимизированы под запуск моделей. На фоне бума агентских систем спрос на дешевое исполнение запросов в КНР зашкаливает.
💰 Экономика: Базовая версия на DDR — 50 000 юаней (~600 тыс. руб.), премиум с HBM — 70 000 юаней (~825 тыс. руб.). Это в разы дешевле дефицитных H100 на серых рынках.
Нам бы тоже пригодилось.
#Huawei #NVIDIA #ByteDance #Alibaba #Китай
───
@tsingular
✍17👍17⚡4❤3👏1
Cline Kanban: Промышленная оркестрация ИИ-агентов
Cline представили Cline Kanban — standalone-приложение для управления CLI-агентами (Claude Code, Codex, Cline). Это слой автоматизации, превращающий работу с ИИ в конвейер.
🛠 Изоляция: Запуск каждой задачи в отдельном Git worktree. Агенты работают параллельно в ветках, не блокируя основной код до финального ревью.
🔗 Зависимости: Проект разбивается на подзадачи в логический граф. Агент сам определяет очередность и запускает следующие этапы.
🤖 Центр управления: Внутри Kanban живет управляющий ИИ. Ему делегируют архитектуру: «Разбей репозиторий на блоки, расставь связи и запусти авто-коммиты».
📺 Инструменты:
• Review: Просмотр диффов и мерж одним кликом.
• Git UI: История коммитов и пуши встроены в навигацию.
• Local-first: Работает локально (127.0.0.1), open source.
💼 Суть: Переход от ручного кодинга к управлению флотом. Разработчик становится архитектором, который выстраивает зависимости и аппрувит блоки, пока агенты в фоне пилят код.
GitHub
Внимание!
Kanban, - это ознакомительная версия и использует экспериментальные функции агентов CLI, - такие как обход разрешений и хуки рантайма для обеспечения большей автономности.
Использовать на свой страх и риск.
#Cline #Kanban #AI #MultiAgent #Claude #Codex
───
@tsingular
Cline представили Cline Kanban — standalone-приложение для управления CLI-агентами (Claude Code, Codex, Cline). Это слой автоматизации, превращающий работу с ИИ в конвейер.
🛠 Изоляция: Запуск каждой задачи в отдельном Git worktree. Агенты работают параллельно в ветках, не блокируя основной код до финального ревью.
🔗 Зависимости: Проект разбивается на подзадачи в логический граф. Агент сам определяет очередность и запускает следующие этапы.
🤖 Центр управления: Внутри Kanban живет управляющий ИИ. Ему делегируют архитектуру: «Разбей репозиторий на блоки, расставь связи и запусти авто-коммиты».
📺 Инструменты:
• Review: Просмотр диффов и мерж одним кликом.
• Git UI: История коммитов и пуши встроены в навигацию.
• Local-first: Работает локально (127.0.0.1), open source.
💼 Суть: Переход от ручного кодинга к управлению флотом. Разработчик становится архитектором, который выстраивает зависимости и аппрувит блоки, пока агенты в фоне пилят код.
GitHub
Внимание!
Kanban, - это ознакомительная версия и использует экспериментальные функции агентов CLI, - такие как обход разрешений и хуки рантайма для обеспечения большей автономности.
Использовать на свой страх и риск.
#Cline #Kanban #AI #MultiAgent #Claude #Codex
───
@tsingular
🔥15✍5⚡3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Это мем из 2027, вы пока не поймёте :)
Кстати, обратите внимание как 1974м (50+ лет назад!!!) предсказали видеосвязь и размер смартфона.
#юмор
------
@tsingular
Кстати, обратите внимание как 1974м (50+ лет назад!!!) предсказали видеосвязь и размер смартфона.
#юмор
------
@tsingular
1😁25😢8👀1
Arm AGI CPU: Первая в истории попытка Arm съесть рынок x86 через «агентский путь»
Arm Holdings впервые за 30 лет вышла за пределы лицензирования IP и представила собственный готовый кремний — Arm AGI CPU.
Процессор оптимизирован для инференса и запуска автономных ИИ-агентов в дата-центрах.
⚙️ Технические параметры:
• Плотность: 136 ядер Neoverse V3 на один чип.
• Производительность: В 2 раза выше на стойку по сравнению с x86-решениями Intel и AMD при сопоставимом энергопотреблении.
• Эффективность: 300W TDP, до 8 160 ядер на стойку при воздушном охлаждении и 45 000+ при жидкостном. Пакуются в 1U блейды.
Альянс с Meta*: Марк Цукерберг стал со-разработчиком. Meta интегрирует чипы со своими ускорителями MTIA для создания «агентских фабрик». В списке партнеров так же значатся OpenAI, Google, Microsoft и NVIDIA.
💼 Зачем бизнесу: Переход от обучения моделей к массовому запуску требует мощностей CPU для управления потоками данных. Arm обещает экономию до $10 млрд CAPEX на каждый гигаватт дата-центра. Это вызов доминированию x86.
🔮 Перспектива: Arm из чертёжного бюро превращается в вендора процессоров и забирает под контроль весь спектр, - от архитектуры до готового чипа.
*Meta - запрещённая в РФ организация, признанная террористической
#Arm #AGI #CPU #Datacenters
───
@tsingular
Arm Holdings впервые за 30 лет вышла за пределы лицензирования IP и представила собственный готовый кремний — Arm AGI CPU.
Процессор оптимизирован для инференса и запуска автономных ИИ-агентов в дата-центрах.
⚙️ Технические параметры:
• Плотность: 136 ядер Neoverse V3 на один чип.
• Производительность: В 2 раза выше на стойку по сравнению с x86-решениями Intel и AMD при сопоставимом энергопотреблении.
• Эффективность: 300W TDP, до 8 160 ядер на стойку при воздушном охлаждении и 45 000+ при жидкостном. Пакуются в 1U блейды.
Альянс с Meta*: Марк Цукерберг стал со-разработчиком. Meta интегрирует чипы со своими ускорителями MTIA для создания «агентских фабрик». В списке партнеров так же значатся OpenAI, Google, Microsoft и NVIDIA.
💼 Зачем бизнесу: Переход от обучения моделей к массовому запуску требует мощностей CPU для управления потоками данных. Arm обещает экономию до $10 млрд CAPEX на каждый гигаватт дата-центра. Это вызов доминированию x86.
🔮 Перспектива: Arm из чертёжного бюро превращается в вендора процессоров и забирает под контроль весь спектр, - от архитектуры до готового чипа.
*Meta - запрещённая в РФ организация, признанная террористической
#Arm #AGI #CPU #Datacenters
───
@tsingular
✍6⚡4👍3❤1
Apple убрала из официального магазина модели M3 Studio с 512Gb
https://www.apple.com/shop/buy-mac/mac-studio
Кризис памяти или подготовка к выходу новой модели, интересно.
В любом случае, если у вас 512Gb Mac Studio - это уже редкость
#Apple #Studio
———
@tsingular
https://www.apple.com/shop/buy-mac/mac-studio
Кризис памяти или подготовка к выходу новой модели, интересно.
В любом случае, если у вас 512Gb Mac Studio - это уже редкость
#Apple #Studio
———
@tsingular
🤔7👍4😢4❤1
NVidia GeForce 1080 Ti отдам в хорошие руки даром.
Напишите в комментах почему именно вам :)
Решу в следующие выходные
#geforce #даром #железо
------
@tsingular
Напишите в комментах почему именно вам :)
Решу в следующие выходные
#geforce #даром #железо
------
@tsingular
⚡9✍4🆒3👍2😁1
Media is too big
VIEW IN TELEGRAM
Вот ведь китайцы... нагенерят нейронками роботов, а доверчивым людям потом кошмары снятся.
#роботы #Китай
------
@tsingular
#роботы #Китай
------
@tsingular
Рубрика "Полезное"
Openclaw <-> VK плагин для общения с ботом без тележачьих проблем и для тех у кого нет возможности зарегать бота в махе.
https://github.com/perevalov/openclaw-vkbots-plugin
Инструкция на хабре:
https://habr.com/ru/articles/1016094/
#openclaw
———
@tsingular
Openclaw <-> VK плагин для общения с ботом без тележачьих проблем и для тех у кого нет возможности зарегать бота в махе.
https://github.com/perevalov/openclaw-vkbots-plugin
Инструкция на хабре:
https://habr.com/ru/articles/1016094/
#openclaw
———
@tsingular
🔥16✍6👍3⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
Знаете, в Кремниевой долине ходит такая шутка: когда кто-то уходит с обычной работы в сфере технологий, он говорит:
«Я отлично провёл здесь время, а теперь — навстречу новым приключениям».
А когда кто-то уходит с работы, связанной с ИИ, он говорит:
«Я заглянул в бездну».
«Я ухожу на покой, чтобы писать стихи».
«Пожалуйста, проводите время со своими семьями».
И если вы думаете, что я шучу, можете взглянуть на заявление об увольнении руководителя по безопасности компании Anthropic, поданное несколько недель назад, — и сами всё поймёте.
#юмор
———
@tsingular
«Я отлично провёл здесь время, а теперь — навстречу новым приключениям».
А когда кто-то уходит с работы, связанной с ИИ, он говорит:
«Я заглянул в бездну».
«Я ухожу на покой, чтобы писать стихи».
«Пожалуйста, проводите время со своими семьями».
И если вы думаете, что я шучу, можете взглянуть на заявление об увольнении руководителя по безопасности компании Anthropic, поданное несколько недель назад, — и сами всё поймёте.
#юмор
———
@tsingular
👀26❤3😁3👾2🤯1
OpenClaw обновление v2026.3.28
🛠 Технические детали:
• ⚠️ Breaking: Удалена устаревшая OAuth-авторизация Qwen (portal.qwen.ai). Инструмент Doctor перестал поддерживать миграцию конфигураций старше двух месяцев.
• ⚙️ Grok & MiniMax: xAI (Grok) получил нативную интеграцию x_search без ручного переключения плагинов. MiniMax интегрирован для генерации и редактирования через image-01. ACP-сессии теперь можно биндить напрямую в чаты Discord, BlueBubbles и iMessage.
• 🚀 Оптимизация: Улучшена работа с WebSocket, исправлены утечки памяти в Feishu и реконнекты Discord.
☁️ Единый транспорт: Платформы Slack, Teams, Google Chat и BlueBubbles переведены на унифицированный механизм upload-file. Агент больше не путается в обработке файлов между мессенджерами.
Когда 80% релиза занимают фиксы, продукт становится всё больше похож на корпоративно-пригодное решение.
88 исправлений и 21 новая функция. Сразу видно, - кто-то вернулся с конференции и разгреб бэклог.
Обновляемся, штош. :)
Обсуждаем тут:
https://t.me/clawledgechat
#OpenClaw #Update
───
@tsingular
🛠 Технические детали:
• ⚠️ Breaking: Удалена устаревшая OAuth-авторизация Qwen (portal.qwen.ai). Инструмент Doctor перестал поддерживать миграцию конфигураций старше двух месяцев.
• ⚙️ Grok & MiniMax: xAI (Grok) получил нативную интеграцию x_search без ручного переключения плагинов. MiniMax интегрирован для генерации и редактирования через image-01. ACP-сессии теперь можно биндить напрямую в чаты Discord, BlueBubbles и iMessage.
• 🚀 Оптимизация: Улучшена работа с WebSocket, исправлены утечки памяти в Feishu и реконнекты Discord.
☁️ Единый транспорт: Платформы Slack, Teams, Google Chat и BlueBubbles переведены на унифицированный механизм upload-file. Агент больше не путается в обработке файлов между мессенджерами.
Когда 80% релиза занимают фиксы, продукт становится всё больше похож на корпоративно-пригодное решение.
88 исправлений и 21 новая функция. Сразу видно, - кто-то вернулся с конференции и разгреб бэклог.
Обновляемся, штош. :)
Обсуждаем тут:
https://t.me/clawledgechat
#OpenClaw #Update
───
@tsingular
👍13👾4❤2⚡1
Страннее уже сегодня не будет.
Openclaw получил MCP интерфейс и может выступать инструментом для любого другого MCP клиента.
#Openclaw #MCP
------
@tsingular
Openclaw получил MCP интерфейс и может выступать инструментом для любого другого MCP клиента.
#Openclaw #MCP
------
@tsingular
🤯9👀7⚡6👍2
Tong Tong 3.0: первый в мире универсальный ИИ-ребенок
На форуме ZGC 2026 в Пекине представили версию 3.0 виртуального существа Tong Tong («Тун-Тун»). Это не просто чат-бот, а полноценный AGI с психологией 6-летнего ребенка. Разработка BIGAI (Пекинский институт общего ИИ) официально перешла от «обучения на данных» к «управлению ценностями».
🧠 Причинно-следственный движок: В отличие от классических LLM, Tong Tong работает на анализе причин и следствий. Она понимает сложные инструкции, самостоятельно планирует действия и обладает социальным интеллектом. Если её попросить навести порядок, она оценит, что является «беспорядком» исходя из заложенных ценностей.
🏰 Город-тренажер AI Town: Для обучения версии 3.0 создали гиперреалистичную среду «AI Town». Это сотни интерьеров и целый виртуальный город с честной физикой и сложными социальными взаимодействиями. В этой песочнице ИИ-ребенок учится «в полевых условиях», активно читает книги и смотрит видео через встроенный поисковый движок.
🗣 Прозрачность и логика: Инженеры BIGAI внедрили механизм полной визуализации процесса принятия решений. Каждое действие Tong Tong можно отследить и объяснить. Это решает проблему «галлюцинаций» и логических противоречий, так как система опирается на связную картину мира, а не на статистическую вероятность токена.
💼 Зачем бизнесу: Переход от «статистических попугаев» к автономным агентам с понятной логикой.
— Безопасные автономные системы: Прозрачность решений критически важна для промышленности и медицины.
— Персонализированное обучение: ИИ, способный эмпатично и последовательно вести диалог, — это идеальный тьютор.
— Робототехника: Tong Tong — это по сути «мозг» для будущих гуманоидов, способных жить в человеческой среде без жестких скриптов.
🔮 Будущее: Профессор Чжу Сунчунь ставит целью достижение уровня взрослого человека через несколько лет. Мы наблюдаем рождение «цифровых граждан», которые не просто отвечают на вопросы, а растут, рефлексируют и формируют собственное мнение о реальности.
С учётом того, что AGI уже включено в Китае в пятилетний план, - вполне логично.
#AGI #TongTong #BIGAI #Китай #роботы
───
@tsingular
На форуме ZGC 2026 в Пекине представили версию 3.0 виртуального существа Tong Tong («Тун-Тун»). Это не просто чат-бот, а полноценный AGI с психологией 6-летнего ребенка. Разработка BIGAI (Пекинский институт общего ИИ) официально перешла от «обучения на данных» к «управлению ценностями».
🧠 Причинно-следственный движок: В отличие от классических LLM, Tong Tong работает на анализе причин и следствий. Она понимает сложные инструкции, самостоятельно планирует действия и обладает социальным интеллектом. Если её попросить навести порядок, она оценит, что является «беспорядком» исходя из заложенных ценностей.
🏰 Город-тренажер AI Town: Для обучения версии 3.0 создали гиперреалистичную среду «AI Town». Это сотни интерьеров и целый виртуальный город с честной физикой и сложными социальными взаимодействиями. В этой песочнице ИИ-ребенок учится «в полевых условиях», активно читает книги и смотрит видео через встроенный поисковый движок.
🗣 Прозрачность и логика: Инженеры BIGAI внедрили механизм полной визуализации процесса принятия решений. Каждое действие Tong Tong можно отследить и объяснить. Это решает проблему «галлюцинаций» и логических противоречий, так как система опирается на связную картину мира, а не на статистическую вероятность токена.
💼 Зачем бизнесу: Переход от «статистических попугаев» к автономным агентам с понятной логикой.
— Безопасные автономные системы: Прозрачность решений критически важна для промышленности и медицины.
— Персонализированное обучение: ИИ, способный эмпатично и последовательно вести диалог, — это идеальный тьютор.
— Робототехника: Tong Tong — это по сути «мозг» для будущих гуманоидов, способных жить в человеческой среде без жестких скриптов.
🔮 Будущее: Профессор Чжу Сунчунь ставит целью достижение уровня взрослого человека через несколько лет. Мы наблюдаем рождение «цифровых граждан», которые не просто отвечают на вопросы, а растут, рефлексируют и формируют собственное мнение о реальности.
С учётом того, что AGI уже включено в Китае в пятилетний план, - вполне логично.
#AGI #TongTong #BIGAI #Китай #роботы
───
@tsingular
🤔24🔥7❤5👾5⚡1👀1
Внутри GPU NVidia: анатомия высокопроизоводительных математических умножений
Нашёл отличный материал по внутреннему устройству ядер матричного умножения на GPU — от железа до кода, бьющего производительность стандартных библиотек.
Автор проходит полный путь: архитектура памяти H100 → ассемблер GPU (PTX/SASS) → наивное ядро → оптимизированное ядро с тензорными блоками. Всё с картинками и кодом.
Ключевые полезные идеи:
Почему порядок обращения к памяти решает
Перестановка двух операторов (деление и остаток) в вычислении координат потока даёт падение производительности в 13 раз — с 3171 до 243 миллиардов операций в секунду. Без понимания иерархии памяти это выглядит как магия.
Перемешивание данных в общей памяти (swizzling)
Простая операция «исключающее ИЛИ» над адресами при загрузке данных устраняет конфликты банков памяти. Без этого — 8-кратное замедление при чтении столбцов. Автор разложил механизм до уровня отдельных битов.
Конвейер «производитель-потребитель» на уровне групп потоков
Одна группа из 128 потоков занимается только загрузкой данных через аппаратный ускоритель передачи (TMA), другая — только вычислениями на тензорных блоках. Координация через кольцевой буфер с барьерами в общей памяти. Это даёт перекрытие загрузки и вычислений.
Путь от 32 до 764 триллионов операций в секунду
Каждый шаг оптимизации с цифрами: тензорные блоки (+10×), увеличение размера плитки (+1.4×), конвейеризация (+1.2×), устойчивые ядра, кривая Гильберта для обхода плиток, кластеры блоков для обмена данными между процессорами. Итог — 107% от производительности стандартной библиотеки NVIDIA.
Кривая Гильберта для планирования вычислений
Вместо построчного обхода плиток выходной матрицы — обход по пространственно-заполняющей кривой. Соседние по времени плитки оказываются соседними в памяти → лучшее попадание в кэш второго уровня.
Материал закрывает разрыв между «знаю что такое GPU» и «понимаю как устроены ядра уровня продакшена». Автор обещает продолжение по архитектуре Blackwell и многочиповым ядрам.
#GPU #CUDA #обучение #H100 #NVidia
———
@tsingular
Нашёл отличный материал по внутреннему устройству ядер матричного умножения на GPU — от железа до кода, бьющего производительность стандартных библиотек.
Автор проходит полный путь: архитектура памяти H100 → ассемблер GPU (PTX/SASS) → наивное ядро → оптимизированное ядро с тензорными блоками. Всё с картинками и кодом.
Ключевые полезные идеи:
Почему порядок обращения к памяти решает
Перестановка двух операторов (деление и остаток) в вычислении координат потока даёт падение производительности в 13 раз — с 3171 до 243 миллиардов операций в секунду. Без понимания иерархии памяти это выглядит как магия.
Перемешивание данных в общей памяти (swizzling)
Простая операция «исключающее ИЛИ» над адресами при загрузке данных устраняет конфликты банков памяти. Без этого — 8-кратное замедление при чтении столбцов. Автор разложил механизм до уровня отдельных битов.
Конвейер «производитель-потребитель» на уровне групп потоков
Одна группа из 128 потоков занимается только загрузкой данных через аппаратный ускоритель передачи (TMA), другая — только вычислениями на тензорных блоках. Координация через кольцевой буфер с барьерами в общей памяти. Это даёт перекрытие загрузки и вычислений.
Путь от 32 до 764 триллионов операций в секунду
Каждый шаг оптимизации с цифрами: тензорные блоки (+10×), увеличение размера плитки (+1.4×), конвейеризация (+1.2×), устойчивые ядра, кривая Гильберта для обхода плиток, кластеры блоков для обмена данными между процессорами. Итог — 107% от производительности стандартной библиотеки NVIDIA.
Кривая Гильберта для планирования вычислений
Вместо построчного обхода плиток выходной матрицы — обход по пространственно-заполняющей кривой. Соседние по времени плитки оказываются соседними в памяти → лучшее попадание в кэш второго уровня.
Материал закрывает разрыв между «знаю что такое GPU» и «понимаю как устроены ядра уровня продакшена». Автор обещает продолжение по архитектуре Blackwell и многочиповым ядрам.
#GPU #CUDA #обучение #H100 #NVidia
———
@tsingular
🔥19❤3⚡2✍2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
В Claude Code запихнули computer use
Теперь Клод может разрабатывать нативные приложения с юаем, с сильно меньшей зависимостью от человека. Раньше такое было доступно только для веб разработки через хром. Пока что доступно только на MacOS для подписчиков Pro и Max. Включить можно активировав computer-use сервер в /mcp.
@ai_newz
Теперь Клод может разрабатывать нативные приложения с юаем, с сильно меньшей зависимостью от человека. Раньше такое было доступно только для веб разработки через хром. Пока что доступно только на MacOS для подписчиков Pro и Max. Включить можно активировав computer-use сервер в /mcp.
@ai_newz
👍12🔥6⚡3
CoPaw: персональный AI-штаб от команды AgentScope
Вы не поверите, но у нас снова мультиагентный фреймворк из Китая.
Команда AgentScope (Alibaba) выпустила v1.0.0 своего агента CoPaw. Это прямой конкурент OpenClaw, на Python и с фокусом на работу с локальными LLM.
Проект за месяц набрал 13k+ звезд и претендует на роль «контрольной панели» для цифровой жизни ИИ команды.
🛡 Эшелонированная защита:
В CoPaw встроены три уровня безопасности:
- Tool Guard блокирует опасные команды в шелле,
- File Access Guard закрывает доступ к системным папкам и SSH-ключам,
- Skill Scanner проверяет новые навыки на наличие промпт-инъекций и утечек данных перед установкой.
⚙️ Мультиагентная фабрика: Система позволяет запускать несколько независимых агентов с разными ролями (Research, Social, Files), которые могут обмениваться задачами (Collaboration Skills).
📱 Омниплатформенность: Один инстанс CoPaw подключается ко всем популярным мессенджерам,- от Telegram и Discord до корпоративных DingTalk и Feishu (маха в списке нет).
Управляется через веб-консоль, поддерживающую мультимодальный предпросмотр (видео, аудио, файлы прямо в чате).
🔮 Будущее: В планах разработчиков добавить «Experience Distillation» (извлечение опыта из диалогов) и внедрение динамических циклов самообучения.
CoPaw выглядит как достаточно продвинутый вариант мультиагентского приложения из серии - "установил и работает".
Кто попробует, - поделитесь пожалуйста опытом в комментариях с остальными.
#CoPaw #AgentScope #Alibaba #OpenSource #агенты #Китай
───
@tsingular
Вы не поверите, но у нас снова мультиагентный фреймворк из Китая.
Команда AgentScope (Alibaba) выпустила v1.0.0 своего агента CoPaw. Это прямой конкурент OpenClaw, на Python и с фокусом на работу с локальными LLM.
Проект за месяц набрал 13k+ звезд и претендует на роль «контрольной панели» для цифровой жизни ИИ команды.
🛡 Эшелонированная защита:
В CoPaw встроены три уровня безопасности:
- Tool Guard блокирует опасные команды в шелле,
- File Access Guard закрывает доступ к системным папкам и SSH-ключам,
- Skill Scanner проверяет новые навыки на наличие промпт-инъекций и утечек данных перед установкой.
⚙️ Мультиагентная фабрика: Система позволяет запускать несколько независимых агентов с разными ролями (Research, Social, Files), которые могут обмениваться задачами (Collaboration Skills).
📱 Омниплатформенность: Один инстанс CoPaw подключается ко всем популярным мессенджерам,- от Telegram и Discord до корпоративных DingTalk и Feishu (маха в списке нет).
Управляется через веб-консоль, поддерживающую мультимодальный предпросмотр (видео, аудио, файлы прямо в чате).
🔮 Будущее: В планах разработчиков добавить «Experience Distillation» (извлечение опыта из диалогов) и внедрение динамических циклов самообучения.
CoPaw выглядит как достаточно продвинутый вариант мультиагентского приложения из серии - "установил и работает".
Кто попробует, - поделитесь пожалуйста опытом в комментариях с остальными.
#CoPaw #AgentScope #Alibaba #OpenSource #агенты #Китай
───
@tsingular
❤10👍5🔥5⚡2