Forwarded from Искусственный интеллект. Высокие технологии
По всему миру нейросети самостоятельно проводят кибератаки и взламывают ИТ-системы за минуты — российские компании работают на опережение и применяют симметричные технологии для превентивной защиты. Т-Банк первым в стране использовал собственную группу ИИ-агентов под названием Nulla для проверки безопасности своей инфраструктуры.
Сервис, на аудит которого ушло бы 2-3 дня работы живого специалиста, Nulla проверяет за 45 минут. Вмешательство человека при этом не требуется.
В отличие от классических сканеров, которые работают по шаблонным сценариям, ИИ-агент адаптирует стратегию атаки и подстраивает ее под особенности системы защиты. Так, Nulla выстраивает сложные, многоэтапные цепочки поиска уязвимостей, не теряя качества проверки, и формирует полную картину потенциальных атак.
Например, ИИ-агент выявляет сценарии:
- нарушения логики доступа – случаи, в которых система некорректно проверяет права и допускает обращение к чужим данным
- обход бизнес-процессов – возможность нарушить последовательность действий и пропустить ключевые этапы проверки
- сложные цепочки взаимодействия между сервисами
Разработка была протестирована на 1300 сервисах экосистемы банка и уже используется как часть системы защиты.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤6❤🔥3
Forwarded from Machinelearning
Qwen3.7 уже залетел на Arena😻
Версии
• Qwen3.7-Max-Preview
• Qwen3.7-Plus-Preview
Это пока preview-версии, вот их результаты:
- #6 на Text
- #5 в Vision
Ждём полноценный релиз.
Изначально ожидалось, что её анонсируют и запустят на Alibaba Cloud Summit 20 мая, но, похоже, команда Alibaba Qwen просто не смогла ждать ивент!
chat.qwen.ai
@ai_machinelearning_big_data
Версии
• Qwen3.7-Max-Preview
• Qwen3.7-Plus-Preview
Это пока preview-версии, вот их результаты:
- #6 на Text
- #5 в Vision
Ждём полноценный релиз.
Изначально ожидалось, что её анонсируют и запустят на Alibaba Cloud Summit 20 мая, но, похоже, команда Alibaba Qwen просто не смогла ждать ивент!
chat.qwen.ai
@ai_machinelearning_big_data
🔥15⚡3❤1✍1
Forwarded from Анализ данных (Data analysis)
Китайские кандзи теперь стали бенчмарком для VLLM
Вышел открытый Chronicles-OCR - новый визуальный бенчмарк для проверки, насколько хорошо мультимодальные модели понимают древние китайские иероглифы.
Идея очень крутая: модели дают не современные аккуратные символы из шрифта, а реальные исторические формы письма за 3000 лет эволюции.
В датасете:
• 7 исторических стилей письма - от гадательных костей до скорописи
• 2800 сбалансированных изображений
• разные физические носители, где символы выглядят совсем не как “чистый OCR”
• задачи на поиск символов, распознавание, разбор древнего текста и классификацию стиля письма
Почему это интересно?
Потому что обычный OCR проверяет, умеет ли модель читать текст. А Chronicles-OCR проверяет другое: понимает ли VLLM, как меняется визуальная форма одного и того же знака во времени, на разных материалах и в разных стилях письма.
Для мультимодальных моделей это больное место. Символ может быть тем же самым по смыслу, но визуально выглядеть как совершенно другой объект. И здесь сразу видно, где модель реально “видит”, а где просто угадывает по паттернам.
Paper: https://arxiv.org/abs/2605.11960
GitHub: https://github.com/VirtualLUOUCAS/Chronicles-OCR
Вышел открытый Chronicles-OCR - новый визуальный бенчмарк для проверки, насколько хорошо мультимодальные модели понимают древние китайские иероглифы.
Идея очень крутая: модели дают не современные аккуратные символы из шрифта, а реальные исторические формы письма за 3000 лет эволюции.
В датасете:
• 7 исторических стилей письма - от гадательных костей до скорописи
• 2800 сбалансированных изображений
• разные физические носители, где символы выглядят совсем не как “чистый OCR”
• задачи на поиск символов, распознавание, разбор древнего текста и классификацию стиля письма
Почему это интересно?
Потому что обычный OCR проверяет, умеет ли модель читать текст. А Chronicles-OCR проверяет другое: понимает ли VLLM, как меняется визуальная форма одного и того же знака во времени, на разных материалах и в разных стилях письма.
Для мультимодальных моделей это больное место. Символ может быть тем же самым по смыслу, но визуально выглядеть как совершенно другой объект. И здесь сразу видно, где модель реально “видит”, а где просто угадывает по паттернам.
Paper: https://arxiv.org/abs/2605.11960
GitHub: https://github.com/VirtualLUOUCAS/Chronicles-OCR
⚡3🔥3❤2🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
KYC можно хоронить.
Kling Motion Control - пока не в реальном времени, но можно же заранее записать движения по скрипту.
#Kling #KYC #нейрорендер
———
@tsingular
Kling Motion Control - пока не в реальном времени, но можно же заранее записать движения по скрипту.
#Kling #KYC #нейрорендер
———
@tsingular
🔥23🤯12⚡1
на ЦИПР прямой эфир прямо сейчас про ИИ в кибербезе
https://player.rms-cloud.ru/embed/cipr-2026-day2?hall=1&session=3
#ЦИПР
———
@tsingular
https://player.rms-cloud.ru/embed/cipr-2026-day2?hall=1&session=3
#ЦИПР
———
@tsingular
👍8❤3🔥3🏆3🤩1
Forwarded from VAI
This media is not supported in your browser
VIEW IN TELEGRAM
Недавно тестил возможность создания пользовательского интерфейса с помощью новой модели от GPT Image 2. Результат получался достаточно неплохим. 😎
Долго думал, как попробовать протестировать Claude Design и на каких задачах. Но идея совместить сгенерированный интерфейс и создание игрового прототипа на основе него оказалась удачной - всё хорошо сложилось.
Закинул скриншот и за пару итераций получил игровой прототип UI, предварительно попросив того же Claude написать нужный промпт.
Только представьте: 10 минут назад была идея и вы уже на её основе делаете прототип.
Да, это всего лишь прототип, и нужнорисовать генерировать иконки и дорабатывать в общем. Но какой пласт работы ИИ уже способен забрать на себя. 😱
Кстати, иконки можно так же вытащить с референса, перевести в вектор через ИИ и использовать.
Лично по моему опыту, для создания более-менее вменяемого среднего по сложности интерфейса нужно около месяца. Сейчас, используя всего два инструмента, можно очень сильно сократить этот путь и получить приличный результат.
Скачать можно в ZIP, PDF, HTML, можно Send to Canva или Figma(но тут есть нюансы, так как нет прямого пути для Figma, есть обходные пути, спросите у своей LLM, она расскажет как).
P.S. Обдумывая этот пост, наткнулся ещё на одну мысль. Из-за большого количества инструментов и информационной каши у многих просто нет понимания, как их матчить между собой.
У меня есть крутой скилл ресёрчера с мультиагентной системой. Думаю, как появится время - пройдусь им и соберу стеки инструментов, которые хорошо дополняют друг друга и которые можно применять в работе, ускоряя процессы и помогая себе. Если интересно - поделюсь потом результатами.🔥
@VAI_ART
#VAI_Practice
Долго думал, как попробовать протестировать Claude Design и на каких задачах. Но идея совместить сгенерированный интерфейс и создание игрового прототипа на основе него оказалась удачной - всё хорошо сложилось.
Закинул скриншот и за пару итераций получил игровой прототип UI, предварительно попросив того же Claude написать нужный промпт.
I'm attaching a UI screenshot as a reference.
Your task is to build a fully functional interactive HTML prototype based on it.
Requirements:
1. Recreate all visible screens/windows from the reference as faithfully as possible —
colors, layout, typography, spacing, icons (use emoji or SVG approximations if needed)
2. Implement navigation and transitions between all screens shown or implied
(buttons, tabs, modals, sidebars — make them all clickable and working)
3. Use a single self-contained HTML file with embedded CSS and JS
4. Add smooth CSS transitions between views (fade, slide — match the tone of the UI)
5. Make it responsive if the reference suggests it
6. Preserve the visual style: if it's dark/light, minimal/dense, flat/glassmorphism —
commit fully to that aesthetic
7. All interactive elements must work: menus open, forms are fillable,
navigation switches views
Output: one complete .html file, no external dependencies except Google Fonts if needed.
Do not explain the code — just produce the artifact.
Только представьте: 10 минут назад была идея и вы уже на её основе делаете прототип.
Да, это всего лишь прототип, и нужно
Кстати, иконки можно так же вытащить с референса, перевести в вектор через ИИ и использовать.
Лично по моему опыту, для создания более-менее вменяемого среднего по сложности интерфейса нужно около месяца. Сейчас, используя всего два инструмента, можно очень сильно сократить этот путь и получить приличный результат.
Скачать можно в ZIP, PDF, HTML, можно Send to Canva или Figma(но тут есть нюансы, так как нет прямого пути для Figma, есть обходные пути, спросите у своей LLM, она расскажет как).
P.S. Обдумывая этот пост, наткнулся ещё на одну мысль. Из-за большого количества инструментов и информационной каши у многих просто нет понимания, как их матчить между собой.
У меня есть крутой скилл ресёрчера с мультиагентной системой. Думаю, как появится время - пройдусь им и соберу стеки инструментов, которые хорошо дополняют друг друга и которые можно применять в работе, ускоряя процессы и помогая себе. Если интересно - поделюсь потом результатами.
@VAI_ART
#VAI_Practice
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍29🔥17⚡2❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Там 3D-генератор Rodin обновился до версии 2.5
Теперь он умеет генерить 10 МИЛЛИОНОВ ПОЛИГОНОВ.
Не уверен, что это главная метрика для генераторов, но размах впечатляет.
Там много и других ништяков и конечно Thinking Mode.
Надо тестировать..
https://hyper3d.ai/
@cgevent
Теперь он умеет генерить 10 МИЛЛИОНОВ ПОЛИГОНОВ.
Не уверен, что это главная метрика для генераторов, но размах впечатляет.
Там много и других ништяков и конечно Thinking Mode.
Надо тестировать..
https://hyper3d.ai/
@cgevent
🤯9⚡4👀1
Forwarded from Сергей Булаев AI 🤖
Андрей Карпаты ушёл в Антропик:
Сергей Булаев AI 🤖 - об AI и не только
Я присоединился к Anthropic. Думаю, ближайшие несколько лет на фронтире LLM будут особенно определяющими. Очень рад войти в команду и вернуться к R&D. По-прежнему глубоко увлечён образованием и со временем планирую возобновить работу над ним.
Сергей Булаев AI 🤖 - об AI и не только
⚡12🤯7👍6🔥4 2
Forwarded from эйай ньюз
Вышла Gemini 3.5 Flash
Она заметно сильнее чем Gemini 3.1 Pro, но цены за токены выросли в 3 раза, с $0.5/$3 до $1.5/$9 за миллион токенов. 3.1 Pro, для сравнения, стоит $2/$12 за миллион токенов для контекстов меньше 200к. Насколько реально выросла стоимость за задачу по сравнению с прошлой Flash мы узнаем только с тестами.
Самое главное — Google серьёзно отнёсся к проблемам в агентности и особенно прокачал модель в этом. Как пример показали как Gemini 3.5 Flash написала за 12 часов небольшую ОС, которая может запустить Doom. Pro модель существует, её обещают завезти в следующем месяце, страшно какие там заломят цены.
@ai_newz
Она заметно сильнее чем Gemini 3.1 Pro, но цены за токены выросли в 3 раза, с $0.5/$3 до $1.5/$9 за миллион токенов. 3.1 Pro, для сравнения, стоит $2/$12 за миллион токенов для контекстов меньше 200к. Насколько реально выросла стоимость за задачу по сравнению с прошлой Flash мы узнаем только с тестами.
Самое главное — Google серьёзно отнёсся к проблемам в агентности и особенно прокачал модель в этом. Как пример показали как Gemini 3.5 Flash написала за 12 часов небольшую ОС, которая может запустить Doom. Pro модель существует, её обещают завезти в следующем месяце, страшно какие там заломят цены.
@ai_newz
🤔10👏3❤1
🔥 Google I/O 2026 — главные анонсы
🧠 Gemini 3.5 Flash — новая флагманская модель
- Превосходит Gemini 3.1 Pro по всем бенчмаркам
- Генерация токенов в ~4× быстрее других frontier-моделей
- Демо: сгенерировала игру в стиле Chrome Dino в реальном времени (~1500 токенов/сек)
- Доступна уже сегодня в Gemini App и Search AI Mode
---
🎨 Gemini Omni — мультимодальный генератор
- Принимает любой вход: текст, фото, видео, аудио → генерирует видео
- «Рассуждает» о том, что должно произойти дальше, понимает физику
- 16 разных ракурсов видео из одного фото
- Меняет актёров/стиль сцены без пересъёмки
- Доступна подписчикам AI Plus / Pro / Ultra и бесплатно на YouTube Shorts
---
⚡️ Gemini Spark — персональный AI-агент
- Работает 24/7 в фоне на базе Gemini 3.5 Flash
- Демо: планирование вечеринки — рассылки, RSVP, Google Sheets + Slides
- Пользователь подтверждает ключевые действия перед исполнением
- Бета на следующей неделе для AI Ultra → летом в Gmail, Workspace, Android, iOS
- Интеграция с Instacart для автоматических заказов
---
💰 Тарифы AI — перетряска
- Новый план $100/мес (AI Ultra для разработчиков) — 5× лимиты Pro, 20TB, YouTube Premium, приоритетный Antigravity
- Старый Ultra снижен с $250 до $200/мес
---
🛒 Universal Cart + Agent Payments (AP2)
- Универсальная корзина: сквозная через Search, Gemini, YouTube, Gmail
- AI ищет скидки, отслеживает цену, уведомляет о переуступке
- AP2 — протокол, позволяющий агентам оплачивать покупки от вашего имени с guardrails (лимиты, бренды, категории)
- Лето 2026, США
---
🔍 AI Search — переработанный поиск
- Поисковая строка динамически расширяется, предвосхищая запрос
- Information Agents — кастомные поисковые агенты, непрерывно работающие в фоне (мониторинг квартир, акций, кроссовок)
- Circle to Search теперь определяет AI-сгенерированные изображения
- SynthID → Search и Chrome
---
🥽 Android XR — умные очки
- Audio Glasses (осень 2026) — без дисплея, Gemini говорит прямо в ухо, музыка и фото hands-free. Партнёры: Warby Parker, Gentle Monster, Samsung
- Project Aura — AR-очки с дисплеем, «лучшие из опробованных» (CNET)
- Демо: очки увидели кофейню → Gemini через DoorDash заказал cold brew → пользователь подтвердил
- Совместимы с Android и iOS
---
💻 Googlebook — новый класс ноутбуков
- Aluminum OS — слияние Android и ChromeOS
- Ноутбуки от HP, Dell, Lenovo, Acer, ASUS — осенью 2026
- Gemini встроен, стриминг приложений с телефона, Android-приложения нативно
- Magic Pointer — взмах мышью вызывает AI-инструменты
- Create My Widget — AI-генерация виджетов
---
📱 Android 17 + Android Halo
- Android Halo — уведомление вверху экрана, показывающее, что делает AI-агент в реальном времени
- Интеграция с Gemini Spark
- App Bubbles — плавающие окна для любого приложения
- Усиленная безопасность: лимит попыток ввода PIN, IMEI на экране блокировки
---
🤖 Antigravity 2.0 — платформа для AI-агентов
- Standalone desktop-приложение
- CLI для разработчиков
- Мультиагентная генерация: одновременно создаёт инфографики, ОС, даже Doom
- Защита данных на уровне Google Cloud
---
📝 Docs Live + Google Pics + Stitch
- Docs Live — создаёшь документ через разговор с Gemini, подтягивает данные из Gmail/Drive
- Google Pics — AI-редактор изображений на базе Nano Banana (летом в Workspace)
- Stitch — 100 млн+ UI-экранов сгенерировано; теперь real-time steering через естественный язык
---
🎵 Flow Music + Ask YouTube
- Flow Music — мобильное приложение, точное редактирование (замена текста в отдельных секциях, генерация из фрагментов)
- Ask YouTube — YouTube как AI-чатбот, ведёт к конкретным таймстампам
#Google #конференции
------
@tsingular
🧠 Gemini 3.5 Flash — новая флагманская модель
- Превосходит Gemini 3.1 Pro по всем бенчмаркам
- Генерация токенов в ~4× быстрее других frontier-моделей
- Демо: сгенерировала игру в стиле Chrome Dino в реальном времени (~1500 токенов/сек)
- Доступна уже сегодня в Gemini App и Search AI Mode
---
🎨 Gemini Omni — мультимодальный генератор
- Принимает любой вход: текст, фото, видео, аудио → генерирует видео
- «Рассуждает» о том, что должно произойти дальше, понимает физику
- 16 разных ракурсов видео из одного фото
- Меняет актёров/стиль сцены без пересъёмки
- Доступна подписчикам AI Plus / Pro / Ultra и бесплатно на YouTube Shorts
---
⚡️ Gemini Spark — персональный AI-агент
- Работает 24/7 в фоне на базе Gemini 3.5 Flash
- Демо: планирование вечеринки — рассылки, RSVP, Google Sheets + Slides
- Пользователь подтверждает ключевые действия перед исполнением
- Бета на следующей неделе для AI Ultra → летом в Gmail, Workspace, Android, iOS
- Интеграция с Instacart для автоматических заказов
---
💰 Тарифы AI — перетряска
- Новый план $100/мес (AI Ultra для разработчиков) — 5× лимиты Pro, 20TB, YouTube Premium, приоритетный Antigravity
- Старый Ultra снижен с $250 до $200/мес
---
🛒 Universal Cart + Agent Payments (AP2)
- Универсальная корзина: сквозная через Search, Gemini, YouTube, Gmail
- AI ищет скидки, отслеживает цену, уведомляет о переуступке
- AP2 — протокол, позволяющий агентам оплачивать покупки от вашего имени с guardrails (лимиты, бренды, категории)
- Лето 2026, США
---
🔍 AI Search — переработанный поиск
- Поисковая строка динамически расширяется, предвосхищая запрос
- Information Agents — кастомные поисковые агенты, непрерывно работающие в фоне (мониторинг квартир, акций, кроссовок)
- Circle to Search теперь определяет AI-сгенерированные изображения
- SynthID → Search и Chrome
---
🥽 Android XR — умные очки
- Audio Glasses (осень 2026) — без дисплея, Gemini говорит прямо в ухо, музыка и фото hands-free. Партнёры: Warby Parker, Gentle Monster, Samsung
- Project Aura — AR-очки с дисплеем, «лучшие из опробованных» (CNET)
- Демо: очки увидели кофейню → Gemini через DoorDash заказал cold brew → пользователь подтвердил
- Совместимы с Android и iOS
---
💻 Googlebook — новый класс ноутбуков
- Aluminum OS — слияние Android и ChromeOS
- Ноутбуки от HP, Dell, Lenovo, Acer, ASUS — осенью 2026
- Gemini встроен, стриминг приложений с телефона, Android-приложения нативно
- Magic Pointer — взмах мышью вызывает AI-инструменты
- Create My Widget — AI-генерация виджетов
---
📱 Android 17 + Android Halo
- Android Halo — уведомление вверху экрана, показывающее, что делает AI-агент в реальном времени
- Интеграция с Gemini Spark
- App Bubbles — плавающие окна для любого приложения
- Усиленная безопасность: лимит попыток ввода PIN, IMEI на экране блокировки
---
🤖 Antigravity 2.0 — платформа для AI-агентов
- Standalone desktop-приложение
- CLI для разработчиков
- Мультиагентная генерация: одновременно создаёт инфографики, ОС, даже Doom
- Защита данных на уровне Google Cloud
---
📝 Docs Live + Google Pics + Stitch
- Docs Live — создаёшь документ через разговор с Gemini, подтягивает данные из Gmail/Drive
- Google Pics — AI-редактор изображений на базе Nano Banana (летом в Workspace)
- Stitch — 100 млн+ UI-экранов сгенерировано; теперь real-time steering через естественный язык
---
🎵 Flow Music + Ask YouTube
- Flow Music — мобильное приложение, точное редактирование (замена текста в отдельных секциях, генерация из фрагментов)
- Ask YouTube — YouTube как AI-чатбот, ведёт к конкретным таймстампам
#Google #конференции
------
@tsingular
🔥17❤5⚡4 2🆒1 1 1
This media is not supported in your browser
VIEW IN TELEGRAM
Эрика Шмидта (exCEO Google) освистали на выпускном в Аризоне после речи про ИИ.
Перевёл для вас.
Какие мысли? Правильно говорит/нет?
#Eric #Schmidt
------
@tsingular
Перевёл для вас.
Какие мысли? Правильно говорит/нет?
#Eric #Schmidt
------
@tsingular
❤2😁2🤔2💯2😈1
Шедевры нейрорендера в стиле Mortal Kombat от yurii_yeltsov
сохраним на память
#MK #нейрорендер
———
@tsingular
сохраним на память
#MK #нейрорендер
———
@tsingular
🔥15🤯8⚡7✍2🗿2❤1😁1🤔1
что то после всех этих историй когда ИИ удаляет данные, я вообще слово "удалить" стараюсь не использовать в запросах.
лучше пусть я потом сам руками почищу что там осталось лишнего, чем такое вот.
Поэтому конечно этого со мной никогда не случится ;)
#юмор
———
@tsingular
лучше пусть я потом сам руками почищу что там осталось лишнего, чем такое вот.
Поэтому конечно этого со мной никогда не случится ;)
#юмор
———
@tsingular
😁29👀6🔥3💯2❤1
Media is too big
VIEW IN TELEGRAM
Google Gemini Omni: новый уровень творчества
Google собрал весь мультимодальный стек в одну модель: текст, изображение, аудио, видео на вход - видео на выход.
Первая модель семейства, Gemini Omni Flash, уже доступна подписчикам.
🤖 Что под капотом: Omni принимает любую комбинацию входов (текст + фото + звук + видео) и генерирует видео за один проход модели, а не через цепочку специализированных систем. Каждая инструкция наслаивается на предыдущую: «замени скульптуру на мыльные пузыри», «когда рука касается зеркала - зеркало плывёт» - модель помнит контекст и сохраняет персонажей сквозь правки. Физика улучшена: гравитация, кинетика, динамика жидкости.
💰 Доступ и цены: AI Plus от $20/мес, AI Ultra от $100/мес с приоритетом. Пока только потребительский продукт. Vertex AI API - «в ближайшие недели». Для продакшена пока рано - нет API, нет SLA.
🛡 Безопасность: Каждый ролик маркируется невидимым цифровым водяным знаком SynthID. Google расширяет C2PA Content Credentials и запускает AI Content Detection API для распознавания сгенерированного контента.
Omni - программируемый видеодвигатель по генерации новой реальности кинематографического качества, а не просто игрушка для нейрорендера.
Вариантная реклама, обучающие ролики, визуализация продуктов, фильмы - все можно создавать без студии и привычных рендер инструментов.
#Gemini #Omni #Google #нейрорендер
------
@tsingular
Google собрал весь мультимодальный стек в одну модель: текст, изображение, аудио, видео на вход - видео на выход.
Первая модель семейства, Gemini Omni Flash, уже доступна подписчикам.
🤖 Что под капотом: Omni принимает любую комбинацию входов (текст + фото + звук + видео) и генерирует видео за один проход модели, а не через цепочку специализированных систем. Каждая инструкция наслаивается на предыдущую: «замени скульптуру на мыльные пузыри», «когда рука касается зеркала - зеркало плывёт» - модель помнит контекст и сохраняет персонажей сквозь правки. Физика улучшена: гравитация, кинетика, динамика жидкости.
💰 Доступ и цены: AI Plus от $20/мес, AI Ultra от $100/мес с приоритетом. Пока только потребительский продукт. Vertex AI API - «в ближайшие недели». Для продакшена пока рано - нет API, нет SLA.
🛡 Безопасность: Каждый ролик маркируется невидимым цифровым водяным знаком SynthID. Google расширяет C2PA Content Credentials и запускает AI Content Detection API для распознавания сгенерированного контента.
Omni - программируемый видеодвигатель по генерации новой реальности кинематографического качества, а не просто игрушка для нейрорендера.
Вариантная реклама, обучающие ролики, визуализация продуктов, фильмы - все можно создавать без студии и привычных рендер инструментов.
#Gemini #Omni #Google #нейрорендер
------
@tsingular
🔥10❤3⚡2🤯2
Forwarded from в IT и выйти
Накопление уникальных данных будет главным условием для прорыва в отечественной робототехнике. Роботы до сих пор отстают от текстовых моделей — всё из-за отсутствия базы для обучения, заявил старший вице-президент Сбера, руководитель блока «Технологическое развитие» Андрей Белевцев на ЦИПР-2026.
Главное из выступления про физический ИИ:
Сейчас Сбер собирает собственные системы, которые видят происходящее и логично реагируют на него, так что физический киберпанк можно ждать совсем скоро.
@techmedia
Главное из выступления про физический ИИ:
• Прорыв в LLM случился благодаря огромному объему текстов, которые человечество писало веками.
• С роботами это не сработало, так как собирать данные об их движениях в пространстве слишком дорого.
• Сейчас индустрия делает ставку на модели VLA (vision, language, action).
• В моделях VLA текст — связующее звено между «зрением» машины и ее физическим действием.
Сейчас Сбер собирает собственные системы, которые видят происходящее и логично реагируют на него, так что физический киберпанк можно ждать совсем скоро.
@techmedia
👀16👻5❤2💯1