Forwarded from AI Product | Igor Akimov
GPT-5.2!
Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.
• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%
Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.
Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.
Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.
GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.
https://openai.com/index/introducing-gpt-5-2/
Модель заметно лучше держит длинные цепочки логики, аккуратнее работает с документами и надёжнее выполняет сложные инструкции.
• SWE-Bench Pro: 50.8% → 55.6%
• GPQA Diamond: 88.1% → 92.4%
• AIME 2025: 94.0% → 100%
• ARC-AGI-2: 17.6% → 52.9%
Три версии под разные задачи:
• GPT-5.2 Instant - быстрые ответы и повседневные запросы.
• GPT-5.2 Thinking - глубокие рассуждения, аналитика, многошаговые задачи.
• GPT-5.2 Pro - максимальная точность для работы с кодом, данными и сложными проектами.
Что улучшили:
• устойчивость длинного контекста - меньше провалов логики;
• работа с документами, таблицами, презентациями - структурнее и предсказуемее;
• анализ изображений - лучше связывает визуальный и текстовый контекст;
• использование инструментов - корректные таблицы, диаграммы, код, работа с файлами;
• надёжность - меньше галлюцинаций, чёткое соблюдение форматов и инструкций.
Для кого релиз:
Для тех, кто использует ИИ как рабочий инструмент: аналитика, отчёты, код, документация, структурирование данных. Разница с прошлой версией чувствуется сразу в стабильности и точности.
GPT-5.2 уже доступен в API (дороже 5.1) и начинает раскатываться в ChatGPT.
https://openai.com/index/introducing-gpt-5-2/
👍34🔥12👎6❤5😱1
А между тем, Runway ML тихо провел свой Research Demo Day Stream.
Я его послушал и вот вам краткая выжимка.
1. Gen-4.5: Вскоре вы сможете как создавать, так и редактировать исходный звук с помощью Gen-4.5, а также редактировать видео произвольной(?!) длины с помощью многокадрового монтажа (multi-shot editing)
2. General World Model, GWM-1: GWM-1 построен на основе Gen-4.5, но с одним важным отличием — он является авторегрессионным. Он прогнозирует кадр за кадром, основываясь на том, что было ранее. В любой момент вы можете вмешаться с действиями в зависимости от приложения, которые могут заключаться в перемещении в пространстве, управлении роботом-манипулятором или взаимодействии с агентом, и модель будет моделировать то, что произойдет дальше. 720p и 24 fps (но непонятно на каком железе). Еще один игрок на поле Моделей Мира.
3. GWM Robotics — это обучаемый симулятор, который генерирует синтетические данные для масштабируемого обучения роботов. Сделан на основе GWM-1.
4. GWM Worlds. Это модель мира для симуляции окружающей среды в реальном времени.
Вы даете модели статическую сцену, и она генерирует иммерсивное, бесконечное, доступное для исследования пространство с геометрией, освещением и физикой, по которому вы можете перемещаться. Все это происходит в реальном времени. Вы можете путешествовать в любое место, реальное или воображаемое. Вы можете стать любым агентом: человеком, гуляющим по городу, дроном, летящим над заснеженной горой, или роботом, перемещающимся по складу.
5. GWM Avatars - тут они показали нечто очень похожее на Hedra и Live Avatars - говорящие головы и видео большой длины с ними. Причем там не только кожаные головы, но и всякия твари, персонажи, животные и пр. 720р
А теперь спойлер: все это ни хрена не готово и будет готово когда-нибудь. Сроков не назвали.
С мирами у них должно неплохо получиться, они говорили про миры раньше всех, но в последнее время они явно отстают по скорости обновлений.
Смотрите тут: https://www.youtube.com/watch?v=OnXu-6xecxM
Читайте тут: https://runwayml.com/
@cgevent
Я его послушал и вот вам краткая выжимка.
1. Gen-4.5: Вскоре вы сможете как создавать, так и редактировать исходный звук с помощью Gen-4.5, а также редактировать видео произвольной(?!) длины с помощью многокадрового монтажа (multi-shot editing)
2. General World Model, GWM-1: GWM-1 построен на основе Gen-4.5, но с одним важным отличием — он является авторегрессионным. Он прогнозирует кадр за кадром, основываясь на том, что было ранее. В любой момент вы можете вмешаться с действиями в зависимости от приложения, которые могут заключаться в перемещении в пространстве, управлении роботом-манипулятором или взаимодействии с агентом, и модель будет моделировать то, что произойдет дальше. 720p и 24 fps (но непонятно на каком железе). Еще один игрок на поле Моделей Мира.
3. GWM Robotics — это обучаемый симулятор, который генерирует синтетические данные для масштабируемого обучения роботов. Сделан на основе GWM-1.
4. GWM Worlds. Это модель мира для симуляции окружающей среды в реальном времени.
Вы даете модели статическую сцену, и она генерирует иммерсивное, бесконечное, доступное для исследования пространство с геометрией, освещением и физикой, по которому вы можете перемещаться. Все это происходит в реальном времени. Вы можете путешествовать в любое место, реальное или воображаемое. Вы можете стать любым агентом: человеком, гуляющим по городу, дроном, летящим над заснеженной горой, или роботом, перемещающимся по складу.
5. GWM Avatars - тут они показали нечто очень похожее на Hedra и Live Avatars - говорящие головы и видео большой длины с ними. Причем там не только кожаные головы, но и всякия твари, персонажи, животные и пр. 720р
А теперь спойлер: все это ни хрена не готово и будет готово когда-нибудь. Сроков не назвали.
С мирами у них должно неплохо получиться, они говорили про миры раньше всех, но в последнее время они явно отстают по скорости обновлений.
Смотрите тут: https://www.youtube.com/watch?v=OnXu-6xecxM
Читайте тут: https://runwayml.com/
@cgevent
👍24❤15
This media is not supported in your browser
VIEW IN TELEGRAM
Meshy 6 Preview: генерация 3Д-персонажей в T\A-позе по произвольной картинке (плюс риг).
Можно подавать на вход картинку с персонажем в произвольной позе, а Meshy в процессе генерации развернет персонаж в T- или А-позу. См. видео.
Дополнительно они прикрутили примитивную систему для рига персонажей. Там даже есть окошко, напоминающее HumanIK из Maya\Motion Builder, где можно расставить суставы и он вставит скелет в персонажа.
Скелет очень примитивный, нет шеи, спины, пальцев, только ноги и руки из двух костей. Ну и не факт, что это нейрориг, скорее всего обычный алгоритм сетапа персонажей.
Но радует то, что 3Д-генераторы начинают думать дальше, чем 3Д-печать получаемых моделей.
https://www.meshy.ai/
@cgevent
Можно подавать на вход картинку с персонажем в произвольной позе, а Meshy в процессе генерации развернет персонаж в T- или А-позу. См. видео.
Дополнительно они прикрутили примитивную систему для рига персонажей. Там даже есть окошко, напоминающее HumanIK из Maya\Motion Builder, где можно расставить суставы и он вставит скелет в персонажа.
Скелет очень примитивный, нет шеи, спины, пальцев, только ноги и руки из двух костей. Ну и не факт, что это нейрориг, скорее всего обычный алгоритм сетапа персонажей.
Но радует то, что 3Д-генераторы начинают думать дальше, чем 3Д-печать получаемых моделей.
https://www.meshy.ai/
@cgevent
🔥36👍11❤5
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за влоггеров.
Еще один генератор аватаров - Creatify Aurora.
Очередной генератор говорящих голов. Однако в отличие от Хедры, они, похоже, просто юзают чужие API.
Изначально компания занималась и занимается генерацией рекламных видео на основе коммерческих генераторов типа Veo или Kling.
Похоже кожаным влоггерам придется изобретать специальные визуальные коды типа покрутить шеей на 360 или укусить себя за палец, чтобы обозначить, что они кожаные. Ибо все нейроблоггеры довольно одинаково трясут головой, а эмоции живут отдельно от контекста. И пока они выучат кусание за палец, кожаные придумают новые коды.
Впрочем, кто на них смотрит? Их же слушают, не? В машине, на работе, фоном...
https://creatify.ai/features/ai-avatar
@cgevent
Еще один генератор аватаров - Creatify Aurora.
Очередной генератор говорящих голов. Однако в отличие от Хедры, они, похоже, просто юзают чужие API.
Изначально компания занималась и занимается генерацией рекламных видео на основе коммерческих генераторов типа Veo или Kling.
Похоже кожаным влоггерам придется изобретать специальные визуальные коды типа покрутить шеей на 360 или укусить себя за палец, чтобы обозначить, что они кожаные. Ибо все нейроблоггеры довольно одинаково трясут головой, а эмоции живут отдельно от контекста. И пока они выучат кусание за палец, кожаные придумают новые коды.
Впрочем, кто на них смотрит? Их же слушают, не? В машине, на работе, фоном...
https://creatify.ai/features/ai-avatar
@cgevent
😁20🔥5👎2❤1👍1
Forwarded from AI Product | Igor Akimov
Так, GPT-5.2:
- Выдающиеся результаты в GDPVal (профессиональные задачи офисных сотрудников): 70.9% vs 60% у Opus 4.5
Существенно прокачались в кодинге, но кажется все-таки чуть уступают Opus 4.5
Существенно улучшили борьбу с галлюцинациями. Сравнивать напрямую не получается, но это лучший результат сейчас.
Практически уничтожили проблемы работы с длинным контекстом (только гляньте на график, где прошлая версия у 60% колыхается, а у новой почти 100%).
Улучиши визуальный ризонинг, но здесь лидер все-равно все еще Gemini 3.0 Pro
Вызов инструментов - сильно выросли, но в целом на уровне Opus 4.5 и Gemini 3.0 Pro, ноздря в ноздрю
Математика, абстрактное мышление и физика - просто разорвали все, что есть на рынке, при это уменьшили количество токенов для решения сложных задач (например по сравнению с о3 насчитали 300х раз).
Обновили контекст до августа 2025 года!
Короче, в офисных задачах, расчетах, длинном контексте, современных знаниях пока это лучшая модель.
Для кодинга все еще лучше Opus, для мультимодальных задач - Gemini.
- Выдающиеся результаты в GDPVal (профессиональные задачи офисных сотрудников): 70.9% vs 60% у Opus 4.5
Существенно прокачались в кодинге, но кажется все-таки чуть уступают Opus 4.5
Существенно улучшили борьбу с галлюцинациями. Сравнивать напрямую не получается, но это лучший результат сейчас.
Практически уничтожили проблемы работы с длинным контекстом (только гляньте на график, где прошлая версия у 60% колыхается, а у новой почти 100%).
Улучиши визуальный ризонинг, но здесь лидер все-равно все еще Gemini 3.0 Pro
Вызов инструментов - сильно выросли, но в целом на уровне Opus 4.5 и Gemini 3.0 Pro, ноздря в ноздрю
Математика, абстрактное мышление и физика - просто разорвали все, что есть на рынке, при это уменьшили количество токенов для решения сложных задач (например по сравнению с о3 насчитали 300х раз).
Обновили контекст до августа 2025 года!
Короче, в офисных задачах, расчетах, длинном контексте, современных знаниях пока это лучшая модель.
Для кодинга все еще лучше Opus, для мультимодальных задач - Gemini.
🔥30👍16❤3👎3😁3