Forwarded from Data Secrets
Китайский поисковик Baidu релизнул модель уровня GPT-4.5 за 1% от цены
На самом деле релизнули даже две модели, и обе уже успели навести очень много шума:
⭐ НЕ-ризонер Ernie 4.5. Мультимодальная модель, превосходящая GPT-4.5 по нескольким показателям (метрики выше). Может анализировать картинки, диаграммы, документы и даже аудио. При этом стоит в 100 раз меньше GPT-4.5.
Цены OpenAI: Input $75 / 1M, Output $150 / 1M
Цены Baidu: Input $0.55 / 1M, Output $2.20 / 1M
⭐ Ризонер Ernie X1. Уровень DeepSeek R1 за полцены. Input $0.28 / 1M, output $1.1 / 1M.
Ну и самое приятное: Ernie 4.5 в чате работает бесплатно. И X1 скоро тоже обещают докатить. Пробуйте здесь: yiyan.baidu.com
На самом деле релизнули даже две модели, и обе уже успели навести очень много шума:
Цены OpenAI: Input $75 / 1M, Output $150 / 1M
Цены Baidu: Input $0.55 / 1M, Output $2.20 / 1M
Ну и самое приятное: Ernie 4.5 в чате работает бесплатно. И X1 скоро тоже обещают докатить. Пробуйте здесь: yiyan.baidu.com
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍5
Технозаметки Малышева
Завтра, в субботу 15 марта, в 11:00 проведём эфир с рассказом о практических приёмах работы с размышляющими моделями. В программе — демонстрация возможностей и особенностей работы с: DeepSeek R1 Qwen Thinking OpenAI O3-mini-high с Deep Research Grok3 с DeepSearch…
Запись вчерашнего эфира для тех, кто пропустил доступна
на канале:
Семейка продактов
на RuTube, кому где удобнее смотреть.
Рекомендуется к просмотру для
- продакт-менеджеров,
- тех, кто ищет идеи собственного стартапа или проекта,
- у кого есть идея, и её нужно изучить
- тех, кто ищет новые направления развития
- тех, кто хочет быстро сделать качественную презентацию
- тех, кто хочет освоиться с актуальными возможностями нейросетей
Ссылки из эфира:
Напишите как вам вообще заходит такой формат общения и что бы вы хотели услышать в следующих выпусках.
Поддержать канал и будущие выпуски можно тут:
💸: pay.cloudtips.ru/p/c8960bbb
#эфиры
———
@tsingular
на канале:
Семейка продактов
на RuTube, кому где удобнее смотреть.
Рекомендуется к просмотру для
- продакт-менеджеров,
- тех, кто ищет идеи собственного стартапа или проекта,
- у кого есть идея, и её нужно изучить
- тех, кто ищет новые направления развития
- тех, кто хочет быстро сделать качественную презентацию
- тех, кто хочет освоиться с актуальными возможностями нейросетей
Ссылки из эфира:
https://chat.minimax.io
https://chat.deepseek.com
https://chat.qwen.ai/
https://chatgpt.com/
https://grok.com
https://gemini.google.com
https://aistudio.google.com
https://claude.ai
https://ollama.com/library/gemma3
https://giga.chat/
https://lmstudio.ai/
https://n8n.io/ai/
https://www.langflow.org/
https://you.com/
https://www.perplexity.ai/
https://groq.com/
Напишите как вам вообще заходит такой формат общения и что бы вы хотели услышать в следующих выпусках.
Поддержать канал и будущие выпуски можно тут:
💸: pay.cloudtips.ru/p/c8960bbb
#эфиры
———
@tsingular
4🔥20⚡17❤6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Спешу поделиться крутейшей штукой, которую мы запилили с одной из команд, которые я обучаю всяким полезным ИИ знаниям.
Это Гигачат Сбербанка прикрученный к АТС.
Т.е. можно с обычного телефона, как видите на демо, позвонить и пообщаться с нейросетью о высоком :).
Пока в режиме закрытой беты.
Готовим релиз к pvesna.4cio.ru
К релизу вместе подготовим и мастер-класс и расширенные примеры использования.
Если вам нужны подобные решения в компании,- обращайтесь, познакомлю с командой разработчиков, сделаем вам умного ассистента на телефоне.
#гигачат #голос #АТС #разработка #Сбербанк
------
@tsingular
Это Гигачат Сбербанка прикрученный к АТС.
Т.е. можно с обычного телефона, как видите на демо, позвонить и пообщаться с нейросетью о высоком :).
Пока в режиме закрытой беты.
Готовим релиз к pvesna.4cio.ru
К релизу вместе подготовим и мастер-класс и расширенные примеры использования.
Если вам нужны подобные решения в компании,- обращайтесь, познакомлю с командой разработчиков, сделаем вам умного ассистента на телефоне.
#гигачат #голос #АТС #разработка #Сбербанк
------
@tsingular
🔥20👍8⚡6
🤖 AI в совете директоров: когда машина занимает роль руководителя
Реальный эксперимент с внедрением ChatGPT в совет директоров австрийской компании показал интересные результаты,- ИИ пока не готов заменить топ-менеджеров, но может помочь убрать их "туннельное мышление".
Исследователи из Warwick Business School и BCG Henderson Institute целый год "подсаживали" ChatGPT на встречи совета директоров компании Giesswein (производитель экологичных шерстяных кроссовок, $85 млн выручки) и выяснили следующее:
Самым ценным качеством AI оказалась его медлительность!
Всё, что мы ненавидим в ИИ — задержки, неловкое прерывание потока мысли — оказалось именно тем, что нужно управленцам, которые "варятся в одном котле" десятилетиями.
ChatGPT вынудил директоров остановиться и подумать, разорвал шаблоны мышления. Это помогло, например, при эмоционально сложном решении закрыть завод, работавший 50+ лет.
Основной риск: директора начали полагаться на ИИ, будто тот не упустит ничего важного. Но в реальности ChatGPT пропустил юридические последствия одного из решений, а команда, уверенная в "полноте" его анализа, тоже их проглядела.
Что реально дал ИИ бизнесу:
1. Скорость: моментальная оценка стоимости ремонта завода в Словакии, без долгих исследований
2. Экономия: вместо найма PR-агентства ChatGPT написал пресс-релиз
3. Генерация идей: предложил альтернативные продукты для неиспользуемых производственных мощностей (шерстяные одеяла)
Технические детали эксперимента:
- Использовали ChatGPT 4 в трех режимах (до встречи, во время, после)
- Без надзора человека ИИ давал банальные советы
- Наибольшую ценность показал формат, где человек-модератор направлял ИИ.
Если хотите попробовать ИИ в управлении:
- Не ждите, что он заменит консультантов без человека-модератора
- Ключевая ценность в избавлении от эффекта замыливания взгляда. Когда команда за годы начинает мыслить одинаково шаблонно.
- Обязательно проверяйте рекомендации ИИ на пропущенные аспекты (юридические, этические)
Эксперимент отсылает нас к рассказу Азимова "Разрешимое противоречие" 1950 года, в котороммашины в итоге убирают из управления и с ключевых должностей людей, которые могли им угрожать, давая не оптимальные экономические рекомендации.
#бизнес #aipresident
———
@tsingular
Реальный эксперимент с внедрением ChatGPT в совет директоров австрийской компании показал интересные результаты,- ИИ пока не готов заменить топ-менеджеров, но может помочь убрать их "туннельное мышление".
Исследователи из Warwick Business School и BCG Henderson Institute целый год "подсаживали" ChatGPT на встречи совета директоров компании Giesswein (производитель экологичных шерстяных кроссовок, $85 млн выручки) и выяснили следующее:
Самым ценным качеством AI оказалась его медлительность!
Всё, что мы ненавидим в ИИ — задержки, неловкое прерывание потока мысли — оказалось именно тем, что нужно управленцам, которые "варятся в одном котле" десятилетиями.
ChatGPT вынудил директоров остановиться и подумать, разорвал шаблоны мышления. Это помогло, например, при эмоционально сложном решении закрыть завод, работавший 50+ лет.
Основной риск: директора начали полагаться на ИИ, будто тот не упустит ничего важного. Но в реальности ChatGPT пропустил юридические последствия одного из решений, а команда, уверенная в "полноте" его анализа, тоже их проглядела.
Что реально дал ИИ бизнесу:
1. Скорость: моментальная оценка стоимости ремонта завода в Словакии, без долгих исследований
2. Экономия: вместо найма PR-агентства ChatGPT написал пресс-релиз
3. Генерация идей: предложил альтернативные продукты для неиспользуемых производственных мощностей (шерстяные одеяла)
Технические детали эксперимента:
- Использовали ChatGPT 4 в трех режимах (до встречи, во время, после)
- Без надзора человека ИИ давал банальные советы
- Наибольшую ценность показал формат, где человек-модератор направлял ИИ.
Если хотите попробовать ИИ в управлении:
- Не ждите, что он заменит консультантов без человека-модератора
- Ключевая ценность в избавлении от эффекта замыливания взгляда. Когда команда за годы начинает мыслить одинаково шаблонно.
- Обязательно проверяйте рекомендации ИИ на пропущенные аспекты (юридические, этические)
Эксперимент отсылает нас к рассказу Азимова "Разрешимое противоречие" 1950 года, в котором
#бизнес #aipresident
———
@tsingular
🤔11⚡5💯3
🔥 Mistral Small 3.1: Новый король малых моделей?
Недели не прошло, как вышла Gemma 3 27B, а сегодня Mistral AI выпускает ответочку — Mistral Small 3.1 (24B).
Технические характеристики и преимущества:
- Размер: 24B
- Контекст: 128K токенов
- Скорость: 150 токенов/сек (vLLM в батче по 16 на 4xH100)
- Мультимодальность: есть
- Лицензия: Apache 2.0
Mistral Small 3.1 обходит GPT-4o Mini, Claude 3.5 Haiku и Gemma 3 по ключевым метрикам:
- GPQA Diamond — сложные вопросы с глубоким рассуждением
- MMLU/MMLU Pro — академические и профессиональные знания
- MM-MT-Bench — понимание изображений
- Многоязычность — особенно в европейских языках
- Локальный запуск: работает на одной RTX 4090 или Mac с 32GB RAM (в Q4 нарезке. Полный размер модели 48гигов)
- Function calling: есть
Уже доступна на Hugging Face (базовая и instruct-версии), в API на платформе Mistral AI и в Google Cloud Vertex AI.
В ближайшие недели ожидается и на NVIDIA NIM.
#MistralAI #Small
———
@tsingular
Недели не прошло, как вышла Gemma 3 27B, а сегодня Mistral AI выпускает ответочку — Mistral Small 3.1 (24B).
Технические характеристики и преимущества:
- Размер: 24B
- Контекст: 128K токенов
- Скорость: 150 токенов/сек (vLLM в батче по 16 на 4xH100)
- Мультимодальность: есть
- Лицензия: Apache 2.0
Mistral Small 3.1 обходит GPT-4o Mini, Claude 3.5 Haiku и Gemma 3 по ключевым метрикам:
- GPQA Diamond — сложные вопросы с глубоким рассуждением
- MMLU/MMLU Pro — академические и профессиональные знания
- MM-MT-Bench — понимание изображений
- Многоязычность — особенно в европейских языках
- Локальный запуск: работает на одной RTX 4090 или Mac с 32GB RAM (в Q4 нарезке. Полный размер модели 48гигов)
- Function calling: есть
Уже доступна на Hugging Face (базовая и instruct-версии), в API на платформе Mistral AI и в Google Cloud Vertex AI.
В ближайшие недели ожидается и на NVIDIA NIM.
#MistralAI #Small
———
@tsingular
🔥13👍1
Media is too big
VIEW IN TELEGRAM
🧊 Roblox представляет Cube: AI генератор 3D миров
Неожиданный ход от Roblox! Компания не просто выпустила свой 3D-генератор, но и сразу открыла его код.
В чём прорыв Cube 3D?
Roblox вместо стандартного подхода создания 3Д через реконструкцию изображений (когда AI пытается "угадать" 3D-форму по картинке), научились превращать 3D-объекты в токены.
И теперь модель генерирует функциональные 3D-объекты! Как пишут разработчики: отличие как между настоящим гоночным треком и его декорацией.
Что умеет прямо сейчас?
Уже на этой неделе будет доступна бета-версия:
- API для генерации 3D-мешей прямо в Roblox Studio
- API на Lua для использования внутри игр
- Open-source версия модели для внешних разработчиков
Застрял с моделированием мотоцикла для своей гонки? "/generate a motorcycle" — и готово!
Технические детали 👨💻
Ключевая инновация — токенизация 3D-объектов, которая позволяет предсказывать следующую 3Д объект по тому же принципу как сейчас предсказываются слова в тексте.
Использовали автореграссивные трансформеры для генерации одиночных объектов, завершения форм и мультиобъектных сцен.
Обучили модель на реальных 3D-данных из Roblox, а не на синтезированных из картинок. Это обеспечивает более качественный и функциональный результат.
Применимость:
1. Разработчикам игр: сокращение цикла от идеи до MVP с недель до дней
2. Дизайнерам: больше времени на творческие задачи вместо рутинного моделирования
3. Маркетологам: быстрое создание 3D-визуализаций товаров и сред
4. AR/VR-проектам: ускорение создания контента в 10-100 раз
Что дальше? 4D с интерактивом!
Самое интересное: Roblox планирует расширить модель до генерации полных сцен и понимания контекста. Они называют это "4D-генерацией", где четвёртое измерение — это взаимодействие между объектами, средами и людьми.
Представьте: "замени все зелёные листья на деревьях на осенние" — и весь лес в игре моментально меняет сезон! Или "нужна гоночная трасса с трибунами и боксами" — и получаете не просто модель, а функциональное пространство.
Пришла беда откуда не ждали. Blender и 3D Studio&Autocad - опасносте!
#Roblox #Cube3D #3D
———
@tsingular
Неожиданный ход от Roblox! Компания не просто выпустила свой 3D-генератор, но и сразу открыла его код.
В чём прорыв Cube 3D?
Roblox вместо стандартного подхода создания 3Д через реконструкцию изображений (когда AI пытается "угадать" 3D-форму по картинке), научились превращать 3D-объекты в токены.
И теперь модель генерирует функциональные 3D-объекты! Как пишут разработчики: отличие как между настоящим гоночным треком и его декорацией.
Что умеет прямо сейчас?
Уже на этой неделе будет доступна бета-версия:
- API для генерации 3D-мешей прямо в Roblox Studio
- API на Lua для использования внутри игр
- Open-source версия модели для внешних разработчиков
Застрял с моделированием мотоцикла для своей гонки? "/generate a motorcycle" — и готово!
Технические детали 👨💻
Ключевая инновация — токенизация 3D-объектов, которая позволяет предсказывать следующую 3Д объект по тому же принципу как сейчас предсказываются слова в тексте.
Использовали автореграссивные трансформеры для генерации одиночных объектов, завершения форм и мультиобъектных сцен.
Обучили модель на реальных 3D-данных из Roblox, а не на синтезированных из картинок. Это обеспечивает более качественный и функциональный результат.
Применимость:
1. Разработчикам игр: сокращение цикла от идеи до MVP с недель до дней
2. Дизайнерам: больше времени на творческие задачи вместо рутинного моделирования
3. Маркетологам: быстрое создание 3D-визуализаций товаров и сред
4. AR/VR-проектам: ускорение создания контента в 10-100 раз
Что дальше? 4D с интерактивом!
Самое интересное: Roblox планирует расширить модель до генерации полных сцен и понимания контекста. Они называют это "4D-генерацией", где четвёртое измерение — это взаимодействие между объектами, средами и людьми.
Представьте: "замени все зелёные листья на деревьях на осенние" — и весь лес в игре моментально меняет сезон! Или "нужна гоночная трасса с трибунами и боксами" — и получаете не просто модель, а функциональное пространство.
Пришла беда откуда не ждали. Blender и 3D Studio&Autocad - опасносте!
#Roblox #Cube3D #3D
———
@tsingular
👍10🔥5✍4🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Нейрорендер всё круче.
Скоро можно будет все старые мультики перегнать в фильмы за 1 запрос.
#нейрорендер
------
@tsingular
Скоро можно будет все старые мультики перегнать в фильмы за 1 запрос.
#нейрорендер
------
@tsingular
🔥50😍10🆒5
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 3D AI Studio: генерация 3D-моделей на стероидах
Новый анонс 3D AI Studio — пожалуй, самый мощный инструмент для быстрой генерации 3D-моделей из текста или изображений.
Что впечатлило:
- Генерация занимает 15-25 секунд (не часы, как в традиционном 3D-моделировании!)
- 300,000+ пользователей и рейтинг 4.4/5 — выглядит как достойная альтернатива Meshy и Alpha3D
- Профессионалы из Nvidia и игровых студий уже активно используют
⚡️Возможности:
1. Text-to-3D — описываешь что хочешь, получаешь 3D-модель (25 кредитов)
2. Image-to-3D — загружаешь 2D картинку, AI превращает в объёмную модель
3. AI Texturing — автоматическое текстурирование (бесплатно!)
4. Remeshing — оптимизация полигональной сетки (тоже бесплатно)
5. Поддержка всех популярных форматов — OBJ, FBX, STL и др.
Для кого полезно:
🎮 Инди-разработчикам игр — вместо недель создания ассетов, можно генерировать десятки моделей за день
🛒 E-commerce — быстрое создание 3D-моделей товаров для AR-примерки
🖨 3D-печать — модели уже оптимизированы для печати
🎬 Видео и анимация — быстрое прототипирование персонажей
Технические детали:
Используют комбинацию нейросетей — одна для извлечения 3D-геометрии из 2D, другая для текстурирования. Интересно, что система автоматически создаёт LOD (level of detail) для оптимизации производительности и поддерживает различные стили — от фотореалистичных до воксельных и LEGO-подобных.
Кейсы использования:
Один разработчик упоминает, что задача, на которую раньше уходило 6 часов (моделирование пропсов), теперь занимает 15 минут. Сравнивая с традиционным пайплайном, это колоссальная экономия на аутсорсинге моделирования.
Есть нюансы:
- Работает по кредитной системе (25 кредитов за генерацию)
- Для сложных моделей всё равно потребуется доработка в Blender
- Судя по скриншотам, с органикой (люди, животные) справляется хуже, чем с неорганикой
Технический лайфхак:
В блоге описывают интересную связку: 3D AI Studio + Blender + Mixamo для быстрого создания анимированных персонажей. Сначала генерируешь модель, потом в Blender добавляешь арматуру, и наконец в Mixamo автоматически риггинг и анимации. То, что раньше занимало недели, теперь можно сделать за пару часов.
А вообще забавно наблюдать, как AI стремительно заходит в сферу 3D. Ещё пару лет назад генерация приличной 3D-модели из текста казалась фантастикой, а сейчас это доступно любому за копейки.
#3D #GameDev
———
@tsingular
Новый анонс 3D AI Studio — пожалуй, самый мощный инструмент для быстрой генерации 3D-моделей из текста или изображений.
Что впечатлило:
- Генерация занимает 15-25 секунд (не часы, как в традиционном 3D-моделировании!)
- 300,000+ пользователей и рейтинг 4.4/5 — выглядит как достойная альтернатива Meshy и Alpha3D
- Профессионалы из Nvidia и игровых студий уже активно используют
⚡️Возможности:
1. Text-to-3D — описываешь что хочешь, получаешь 3D-модель (25 кредитов)
2. Image-to-3D — загружаешь 2D картинку, AI превращает в объёмную модель
3. AI Texturing — автоматическое текстурирование (бесплатно!)
4. Remeshing — оптимизация полигональной сетки (тоже бесплатно)
5. Поддержка всех популярных форматов — OBJ, FBX, STL и др.
Для кого полезно:
🎮 Инди-разработчикам игр — вместо недель создания ассетов, можно генерировать десятки моделей за день
🛒 E-commerce — быстрое создание 3D-моделей товаров для AR-примерки
🖨 3D-печать — модели уже оптимизированы для печати
🎬 Видео и анимация — быстрое прототипирование персонажей
Технические детали:
Используют комбинацию нейросетей — одна для извлечения 3D-геометрии из 2D, другая для текстурирования. Интересно, что система автоматически создаёт LOD (level of detail) для оптимизации производительности и поддерживает различные стили — от фотореалистичных до воксельных и LEGO-подобных.
Кейсы использования:
Один разработчик упоминает, что задача, на которую раньше уходило 6 часов (моделирование пропсов), теперь занимает 15 минут. Сравнивая с традиционным пайплайном, это колоссальная экономия на аутсорсинге моделирования.
Есть нюансы:
- Работает по кредитной системе (25 кредитов за генерацию)
- Для сложных моделей всё равно потребуется доработка в Blender
- Судя по скриншотам, с органикой (люди, животные) справляется хуже, чем с неорганикой
Технический лайфхак:
В блоге описывают интересную связку: 3D AI Studio + Blender + Mixamo для быстрого создания анимированных персонажей. Сначала генерируешь модель, потом в Blender добавляешь арматуру, и наконец в Mixamo автоматически риггинг и анимации. То, что раньше занимало недели, теперь можно сделать за пару часов.
А вообще забавно наблюдать, как AI стремительно заходит в сферу 3D. Ещё пару лет назад генерация приличной 3D-модели из текста казалась фантастикой, а сейчас это доступно любому за копейки.
#3D #GameDev
———
@tsingular
⚡4👍3🆒2
Тут после эфира были вопросы, где посмотреть другие инструкции как вскипятить воду без VPN, - решил перезалить всё на RuTube.
https://rutube.ru/channel/25379731/
ВК.Видео имеет смысл выкладывать?
#эфиры
———
@tsingular
https://rutube.ru/channel/25379731/
ВК.Видео имеет смысл выкладывать?
#эфиры
———
@tsingular
👍18🔥9⚡4✍1🤨1
🚀 NVIDIA открывает NVAQC - центр ускорения квантовых вычислений
18 марта на GTC 2025 компания объявила о запуске NVIDIA Accelerated Quantum Research Center (NVAQC) в Бостоне – центра, который займётся оптимизацией квантовых вычислений.
Главная фишка NVAQC – 576 GPU NVIDIA Blackwell в составе системы GB200 NVL72 с сетевой платформой NVIDIA Quantum-2 InfiniBand. По сути, гибрид классического суперкомпьютера и квантовых процессоров.
Почему это важно?
Квантовые компьютеры страдают от шума – взаимодействия кубитов с окружающей средой, что приводит к ошибкам в вычислениях. Традиционное решение – квантовая коррекция ошибок, но это требует:
1. Тонны физических кубитов для создания одного логического кубита
2. Сверхбыстрой классической обработки для декодирования и исправления ошибок
NVAQC решает именно второй пункт – использует ИИ и параллельные вычислений для ускорения декодирования.
Команда партнёров NVIDIA, которые уже работают в проекте:
- Quantinuum (интеграция H1 QPU с CUDA-Q)
- QuEra (поиск улучшенных кодов коррекции ошибок)
- Quantum Machines (создание контроллеров для интерфейса между квантовыми процессорами и GB200)
- Академические партнёры из Гарварда и MIT
Демократизация квантовой физики:
Самое интересное – единая платформа CUDA-Q, которая позволит разработчикам создавать гибридные квантово-классические приложения, не вдаваясь в квантовую физику.
NVIDIA очевидно строит экосистему для "квантового дня Х":
- CUDA-Q как основной интерфейс для разработчиков
- CUDA-QX – набор библиотек для ускорения исследований
- DGX Quantum – референсная архитектура для интеграции квантового и классического железа
- cuQuantum – библиотеки для симуляции квантовых схем
Практический эффект обещают через 5-10 лет. Будем надеяться AGI этот процесс ускорит.
#NVIDIA #QuantumComputing #NVAQC
———
@tsingular
18 марта на GTC 2025 компания объявила о запуске NVIDIA Accelerated Quantum Research Center (NVAQC) в Бостоне – центра, который займётся оптимизацией квантовых вычислений.
Главная фишка NVAQC – 576 GPU NVIDIA Blackwell в составе системы GB200 NVL72 с сетевой платформой NVIDIA Quantum-2 InfiniBand. По сути, гибрид классического суперкомпьютера и квантовых процессоров.
Почему это важно?
Квантовые компьютеры страдают от шума – взаимодействия кубитов с окружающей средой, что приводит к ошибкам в вычислениях. Традиционное решение – квантовая коррекция ошибок, но это требует:
1. Тонны физических кубитов для создания одного логического кубита
2. Сверхбыстрой классической обработки для декодирования и исправления ошибок
NVAQC решает именно второй пункт – использует ИИ и параллельные вычислений для ускорения декодирования.
Команда партнёров NVIDIA, которые уже работают в проекте:
- Quantinuum (интеграция H1 QPU с CUDA-Q)
- QuEra (поиск улучшенных кодов коррекции ошибок)
- Quantum Machines (создание контроллеров для интерфейса между квантовыми процессорами и GB200)
- Академические партнёры из Гарварда и MIT
Демократизация квантовой физики:
Самое интересное – единая платформа CUDA-Q, которая позволит разработчикам создавать гибридные квантово-классические приложения, не вдаваясь в квантовую физику.
NVIDIA очевидно строит экосистему для "квантового дня Х":
- CUDA-Q как основной интерфейс для разработчиков
- CUDA-QX – набор библиотек для ускорения исследований
- DGX Quantum – референсная архитектура для интеграции квантового и классического железа
- cuQuantum – библиотеки для симуляции квантовых схем
Практический эффект обещают через 5-10 лет. Будем надеяться AGI этот процесс ускорит.
#NVIDIA #QuantumComputing #NVAQC
———
@tsingular
👍7🔥2
Media is too big
VIEW IN TELEGRAM
SAP в гонке AI-агентов: Joule и будущее бизнес-процессов
SAP выпустил своего агента - Joule, которая существенно отличается от решений других вендоров. В отличие от изолированных агентов, Joule-агенты изначально проектировались как система взаимодействующих специалистов, работающих в единой экосистеме бизнес-приложений SAP.
Технические особенности Joule-агентов
Ключевое преимущество — не просто автоматизация отдельных задач, а оркестрация сквозных процессов.
Joule-агенты умеют:
- Совместно планировать многоэтапные рабочие процессы
- Использовать SAP Knowledge Graph для контекстного понимания бизнес-процессов
- Подключаться напрямую к API бизнес-систем для выполнения действий
- Обмениваться данными между собой без необходимости человеческой координации
Технически агенты Joule опираются на два фундаментальных компонента: SAP Business Data Cloud для унифицированного доступа к данным и SAP Knowledge Graph для контекстного понимания бизнес-процессов. Благодаря этой связке агенты "понимают" не просто запросы, а их место в общей картине бизнес-операций.
Практическое применение
В финансах Joule-агенты уже сокращают время разрешения спорных ситуаций с часов до секунд — агенты одновременно работают в финансовом, клиентском и операционном модулях, автоматически собирая информацию, валидируя кейсы и предлагая решения.
В продажах агенты самостоятельно отслеживают сделки, идентифицируют вопросы клиентов и обновляют их актуальными ответами — без вмешательства менеджера.
В HR автоматизируются рутинные процессы: от составления описаний вакансий до ускорения согласования офферов и упрощения запросов на отгулы.
Интеграция и кастомизация
SAP предлагает конструктор Joule Agent Builder, который позволяет бизнес-пользователям создавать собственных агентов без навыков программирования.
Процесс создания включает шесть этапов:
1. Определение цели агента
2. Указание бизнес-контекста
3. Подключение к источникам данных
4. Назначение необходимых навыков
5. Настройка взаимодействия с другими агентами
6. Тестирование и внедрение
Важно отметить, что все агенты работают в рамках существующих ролевых моделей доступа SAP, что решает проблему безопасности и предотвращает несанкционированный доступ к данным.
Текущая доступность
На сегодняшний день Joule доступен только для облачных приложений SAP и через RISE/GROW with SAP. Интеграция уже реализована с SAP SuccessFactors, SAP Start, SAP S/4HANA Cloud (Public и Private Edition), SAP Customer Data Platform, SAP BTP cockpit, SAP Build Code и рядом других продуктов.
SAP не ограничивается одним поставщиком LLM, используя разные модели для разных сценариев — это обеспечивает лучшую производительность для каждого конкретного случая.
Что дальше?
SAP планирует расширить возможности кастомизации Joule в 2025 году и поддержать до 80% наиболее используемых бизнес-транзакций SAP. Также в планах интеграция с Microsoft Copilot для повышения эффективности в гетерогенных ИТ-ландшафтах.
Проблемы prompt injection, которые тормозят развитие агентов у других компаний, SAP частично решает через привязку агентов к конкретным бизнес-процессам и данным — это существенно сужает поверхность атаки, хотя проблема всё ещё актуальна.
Скоро будем вместо интеграций API систем, прописывать инструкции для агентов по работе с контрагентами и партнёрами. У каждой компании будут свои агенты- сотрудники.
#SAP #Joule #agents
———
@tsingular
SAP выпустил своего агента - Joule, которая существенно отличается от решений других вендоров. В отличие от изолированных агентов, Joule-агенты изначально проектировались как система взаимодействующих специалистов, работающих в единой экосистеме бизнес-приложений SAP.
Технические особенности Joule-агентов
Ключевое преимущество — не просто автоматизация отдельных задач, а оркестрация сквозных процессов.
Joule-агенты умеют:
- Совместно планировать многоэтапные рабочие процессы
- Использовать SAP Knowledge Graph для контекстного понимания бизнес-процессов
- Подключаться напрямую к API бизнес-систем для выполнения действий
- Обмениваться данными между собой без необходимости человеческой координации
Технически агенты Joule опираются на два фундаментальных компонента: SAP Business Data Cloud для унифицированного доступа к данным и SAP Knowledge Graph для контекстного понимания бизнес-процессов. Благодаря этой связке агенты "понимают" не просто запросы, а их место в общей картине бизнес-операций.
Практическое применение
В финансах Joule-агенты уже сокращают время разрешения спорных ситуаций с часов до секунд — агенты одновременно работают в финансовом, клиентском и операционном модулях, автоматически собирая информацию, валидируя кейсы и предлагая решения.
В продажах агенты самостоятельно отслеживают сделки, идентифицируют вопросы клиентов и обновляют их актуальными ответами — без вмешательства менеджера.
В HR автоматизируются рутинные процессы: от составления описаний вакансий до ускорения согласования офферов и упрощения запросов на отгулы.
Интеграция и кастомизация
SAP предлагает конструктор Joule Agent Builder, который позволяет бизнес-пользователям создавать собственных агентов без навыков программирования.
Процесс создания включает шесть этапов:
1. Определение цели агента
2. Указание бизнес-контекста
3. Подключение к источникам данных
4. Назначение необходимых навыков
5. Настройка взаимодействия с другими агентами
6. Тестирование и внедрение
Важно отметить, что все агенты работают в рамках существующих ролевых моделей доступа SAP, что решает проблему безопасности и предотвращает несанкционированный доступ к данным.
Текущая доступность
На сегодняшний день Joule доступен только для облачных приложений SAP и через RISE/GROW with SAP. Интеграция уже реализована с SAP SuccessFactors, SAP Start, SAP S/4HANA Cloud (Public и Private Edition), SAP Customer Data Platform, SAP BTP cockpit, SAP Build Code и рядом других продуктов.
SAP не ограничивается одним поставщиком LLM, используя разные модели для разных сценариев — это обеспечивает лучшую производительность для каждого конкретного случая.
Что дальше?
SAP планирует расширить возможности кастомизации Joule в 2025 году и поддержать до 80% наиболее используемых бизнес-транзакций SAP. Также в планах интеграция с Microsoft Copilot для повышения эффективности в гетерогенных ИТ-ландшафтах.
Проблемы prompt injection, которые тормозят развитие агентов у других компаний, SAP частично решает через привязку агентов к конкретным бизнес-процессам и данным — это существенно сужает поверхность атаки, хотя проблема всё ещё актуальна.
Скоро будем вместо интеграций API систем, прописывать инструкции для агентов по работе с контрагентами и партнёрами. У каждой компании будут свои агенты- сотрудники.
#SAP #Joule #agents
———
@tsingular
👍8🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 Nvidia GTC 2025: Новые архитектуры GPU и AI-модели для роботов
На конференции GTC 2025 NVidia представила несколько интересных технических новинок:
Дорожная карта GPU архитектур
Компания анонсировала сразу несколько поколений GPU архитектур:
- Blackwell Ultra — выйдет во второй половине 2025 года, улучшенная версия текущей архитектуры Blackwell с повышенной производительностью для AI-задач
- Vera Rubin — релиз во второй половине 2026 года, будет включать десятки терабайт памяти и кастомный CPU от Nvidia под названием Vera
- Rubin Ultra — запланирован на вторую половину 2027 года, будет представлять собой четыре GPU в одном корпусе
Интересно, что на фоне этих анонсов акции Nvidia упали на 4% — видимо, инвесторы ожидали чего-то более неожиданного. Тем более, что большая часть информации уже была слита до конференции.
AI и робототехника
- Groot N1 — открытая AI-фундаментальная модель для гуманоидных роботов с "двойной системной архитектурой" для "быстрого и медленного мышления". Модель обучена на синтетических и реальных данных.
- Newton Physics Engine — физический движок, разработанный совместно с Disney Research и Google DeepMind для симуляции движений роботов в реальных условиях. Disney планирует использовать его для своих развлекательных роботов, включая BDX-дроидов из "Звездных войн".
"Персональные AI-суперкомпьютеры"
Два новых устройства для разработчиков и предприятий:
- DGX Spark (ранее Project Digits) — компактная система размером с Mac mini, способная выполнять 1 000 триллионов операций в секунду. Поставки начнутся в ближайшее время.
- DGX Station — более мощная рабочая станция для предприятий (Nvidia’s GB300 Grace Blackwell Ultra Desktop Superchip с 784GB памяти) - поставки начнутся летом.
Вот это интересно - по сути коробка чисто под DeepSeek R1 (или к лету там уже R2 выйдет)
Партнерства с бизнес-контекстом
- General Motors — расширение сотрудничества в трех направлениях: AI для производства, AI для проектирования и симуляции автомобилей, и AI для автономного вождения (Super Cruise).
- TSMC — разработка кремниевой фотоники для датацентров, что позволит сэкономить мегаватты энергии.
Программное обеспечение для AI
- Nvidia Dynamo — операционная система для "AI-фабрик", позволяющая компаниям настраивать дата-центры под AI-нагрузки.
- Nvidia Llama Nemotron Reasoning — модель рассуждений, которая, по заявлениям, превосходит DeepSeek R1 по точности и скорости.
Ну, очевидно, вышли на плато. Никаких революций. Чисто эволюционный рост. Так? ;)
#Nvidia #GTC2025
———
@tsingular
На конференции GTC 2025 NVidia представила несколько интересных технических новинок:
Дорожная карта GPU архитектур
Компания анонсировала сразу несколько поколений GPU архитектур:
- Blackwell Ultra — выйдет во второй половине 2025 года, улучшенная версия текущей архитектуры Blackwell с повышенной производительностью для AI-задач
- Vera Rubin — релиз во второй половине 2026 года, будет включать десятки терабайт памяти и кастомный CPU от Nvidia под названием Vera
- Rubin Ultra — запланирован на вторую половину 2027 года, будет представлять собой четыре GPU в одном корпусе
Интересно, что на фоне этих анонсов акции Nvidia упали на 4% — видимо, инвесторы ожидали чего-то более неожиданного. Тем более, что большая часть информации уже была слита до конференции.
AI и робототехника
- Groot N1 — открытая AI-фундаментальная модель для гуманоидных роботов с "двойной системной архитектурой" для "быстрого и медленного мышления". Модель обучена на синтетических и реальных данных.
- Newton Physics Engine — физический движок, разработанный совместно с Disney Research и Google DeepMind для симуляции движений роботов в реальных условиях. Disney планирует использовать его для своих развлекательных роботов, включая BDX-дроидов из "Звездных войн".
"Персональные AI-суперкомпьютеры"
Два новых устройства для разработчиков и предприятий:
- DGX Spark (ранее Project Digits) — компактная система размером с Mac mini, способная выполнять 1 000 триллионов операций в секунду. Поставки начнутся в ближайшее время.
- DGX Station — более мощная рабочая станция для предприятий (Nvidia’s GB300 Grace Blackwell Ultra Desktop Superchip с 784GB памяти) - поставки начнутся летом.
Вот это интересно - по сути коробка чисто под DeepSeek R1 (или к лету там уже R2 выйдет)
Партнерства с бизнес-контекстом
- General Motors — расширение сотрудничества в трех направлениях: AI для производства, AI для проектирования и симуляции автомобилей, и AI для автономного вождения (Super Cruise).
- TSMC — разработка кремниевой фотоники для датацентров, что позволит сэкономить мегаватты энергии.
Программное обеспечение для AI
- Nvidia Dynamo — операционная система для "AI-фабрик", позволяющая компаниям настраивать дата-центры под AI-нагрузки.
- Nvidia Llama Nemotron Reasoning — модель рассуждений, которая, по заявлениям, превосходит DeepSeek R1 по точности и скорости.
Ну, очевидно, вышли на плато. Никаких революций. Чисто эволюционный рост. Так? ;)
#Nvidia #GTC2025
———
@tsingular
👍5😁3
Технозаметки Малышева
🔬 Nvidia GTC 2025: Новые архитектуры GPU и AI-модели для роботов На конференции GTC 2025 NVidia представила несколько интересных технических новинок: Дорожная карта GPU архитектур Компания анонсировала сразу несколько поколений GPU архитектур: - Blackwell…
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё из презентации NVidia на GTC2025
Как вам такой вариант домашнего ассистента?
Плоская голова,- удобно, считаю. Можно кофе поставить... :)
#Nvidia #robots #gtc2025
------
@tsingular
Как вам такой вариант домашнего ассистента?
Плоская голова,- удобно, считаю. Можно кофе поставить... :)
#Nvidia #robots #gtc2025
------
@tsingular
👍9❤🔥3😁2🆒2🔥1👾1
Forwarded from Эксплойт
NVIDIA показала RTX PRO 6000 — это буквально монстры в мире видеокарт с 96 Гб видеопамяти (!), которые предназначены для ИИ, 3D и научных исследований.
Характеристики разрывают:
— 24 064 CUDA-ядра.
— 96 ГБ GDDR7.
— 600 ВТ. Здесь придется запастись собственной электростанцией.
Всего будет три версии:
— Workstation Edition: для домашних ПК, дизайн как у RTX 5090.
— Server Edition: для дата-центров с пассивным охлаждением.
— Max-Q Edition: для сетапов с большим количеством карт. Здесь на охлаждении настоящая ТУРБИНА.
Дата выхода: апрель-май, ценник пока неизвестен. Если хотите чтобы FPS не проседали, то откладывайте почки (сразу две) и приготовьте огнетушитель.
@exploitex
Характеристики разрывают:
— 24 064 CUDA-ядра.
— 96 ГБ GDDR7.
— 600 ВТ. Здесь придется запастись собственной электростанцией.
Всего будет три версии:
— Workstation Edition: для домашних ПК, дизайн как у RTX 5090.
— Server Edition: для дата-центров с пассивным охлаждением.
— Max-Q Edition: для сетапов с большим количеством карт. Здесь на охлаждении настоящая ТУРБИНА.
Дата выхода: апрель-май, ценник пока неизвестен. Если хотите чтобы FPS не проседали, то откладывайте почки (сразу две) и приготовьте огнетушитель.
@exploitex
⚡7🤣5
BigQuery: Как облачные сервисы могут незаметно опустошить ваш счёт
История, - огонь! Чел получил счёт на $10,000 за три запроса с LIMIT. А проблема оказалась в том, что BigQuery считает стоимость по объёму данных в таблице запроса, а не по реально обработанным данным в отличие от AWS Redshift, Athena, Snowflake и др.
🚨 Это важно и для работы с ИИ-агентами
Надо понимать: современные ИИ-агенты могут делать сотни запросов к данным, причем совершенно незаметно для пользователя. Представьте, что вы попросили агента "проанализировать данные за прошлый год" — и внезапно получили счет на миллионы $.
При работе с агентами критически важно:
1. Устанавливать жёсткие лимиты по расходам ($)
2. Проверять архитектуру запросов (например, в BigQuery использовать предварительную агрегацию)
3. Тестировать на маленьких наборах данных
4. Контролировать количество запросов через промежуточный сервис
Если используете BigQuery:
- Применяйте материализованные представления
- Используйте предварительную фильтрацию в отдельных таблицах
- Рассмотрите Apache Iceberg для более гибкой работы
- Настройте бюджетные оповещения на низких порогах
⚠️ Особенность всех облачных сервисов
Они всегда делают ставку на то, что вы не будете читать мелкий шрифт. Да, технически BigQuery не обманывает — информация есть в документации. Которую вы, скорее всего, не прочитаете никогда.
В итоге: с большими данными нужно быть осторожнее, а с ИИ-агентами — в десять раз осторожнее. Лимиты, мониторинг, тесты — вот ваша защита от "внезапных" счетов.
#BigQuery #price #limit
———
@tsingular
История, - огонь! Чел получил счёт на $10,000 за три запроса с LIMIT. А проблема оказалась в том, что BigQuery считает стоимость по объёму данных в таблице запроса, а не по реально обработанным данным в отличие от AWS Redshift, Athena, Snowflake и др.
Надо понимать: современные ИИ-агенты могут делать сотни запросов к данным, причем совершенно незаметно для пользователя. Представьте, что вы попросили агента "проанализировать данные за прошлый год" — и внезапно получили счет на миллионы $.
При работе с агентами критически важно:
1. Устанавливать жёсткие лимиты по расходам ($)
2. Проверять архитектуру запросов (например, в BigQuery использовать предварительную агрегацию)
3. Тестировать на маленьких наборах данных
4. Контролировать количество запросов через промежуточный сервис
Если используете BigQuery:
- Применяйте материализованные представления
- Используйте предварительную фильтрацию в отдельных таблицах
- Рассмотрите Apache Iceberg для более гибкой работы
- Настройте бюджетные оповещения на низких порогах
⚠️ Особенность всех облачных сервисов
Они всегда делают ставку на то, что вы не будете читать мелкий шрифт. Да, технически BigQuery не обманывает — информация есть в документации. Которую вы, скорее всего, не прочитаете никогда.
В итоге: с большими данными нужно быть осторожнее, а с ИИ-агентами — в десять раз осторожнее. Лимиты, мониторинг, тесты — вот ваша защита от "внезапных" счетов.
#BigQuery #price #limit
———
@tsingular
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот кого давно не было слышно!
Atlas от Boston Dynamics тоже готовится к Олимпиаде! В том числе танцевальной, судя по всему.
Голосуем, - настоящее (🔥 ) или рендер (😈) ?
#BostonDynamics #robots
———
@tsingular
Atlas от Boston Dynamics тоже готовится к Олимпиаде! В том числе танцевальной, судя по всему.
Голосуем, - настоящее (🔥 ) или рендер (😈) ?
#BostonDynamics #robots
———
@tsingular
🔥30😈8
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree тоже сохраним для истории на текущую дату.
Голосуем, - настоящее (🔥 ) или рендер (😈) ?
#Unitree #robots
———
@tsingular
Голосуем, - настоящее (🔥 ) или рендер (😈) ?
#Unitree #robots
———
@tsingular
🔥21😈19👏1