С другой стороны, Горький урок Саттона (забрутфорсить ллмки данными и компьютом и они станут АГИ) хоть и подзаглох на претрейне, но переместился теперь в инференс. Компании тратят лярды на увеличение контекста в инференсе и это правда даёт неплохие результаты.
Я часто злюсь на Кими К2.5, но вот после такого я остываю. Главное запромптить это чудо грамотно.
This media is not supported in your browser
VIEW IN TELEGRAM
Сравнение возможностей создания симулятора планеты на GLM-5 vs GPT-5.2 Extended Thinking vs Kimi-K2.5 Thinking vs Gemini 3 Pro
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Попалось в тиктоке и мой наметанный за пару дней глаз сразу распознал что это Сиданс 2. Как понять, что видео сгенерировано в Сидансе? Если у него кинематографичная картинка, оно длинное и нет ни одного косяка то это Сиданс 2☝️
❤1🔥1
Forwarded from Силиконовый Мешок
С удивлением обнаружил, что цены на коды для Perplexity снова снизились ($5). Неужели «чистки» закончились или продавцы сливают остатки? - так СТОП! Теперь они продают подписку на МЕСЯЦ!
У меня, кстати, самая старая подписка заканчивается 26 февраля. Взял у того же продавца еще одну. Но фиг знает, забанят или нет, поэтому - на свой страх и риск.
У меня, кстати, самая старая подписка заканчивается 26 февраля. Взял у того же продавца еще одну. Но фиг знает, забанят или нет, поэтому - на свой страх и риск.
This media is not supported in your browser
VIEW IN TELEGRAM
Помните, Николас Кейдж пробовался на роль супермена. Ну, так вот.
Сиданс 2, конечно.
Сиданс 2, конечно.
🔥2
Прикол, хотел буквально то же самое сейчас написать. Я уже больше двух месяцев не открывал ЧатГПТ. С Нового года вообще ни разу. Схема та же, с недавних пор для прям серьезных задач Клодопус, а для бытовых Джеминай. Новости смотрю в Гроке. И в моем окружении я не один такой.
Куда-то не туда свернул Альтман, куда-то не туда...
Куда-то не туда свернул Альтман, куда-то не туда...
👍6💯1
На этой неделе Google DeepMind и OpenAI одновременно показали, что их модели могут не только в бенчмарки, но и в науку.
DeepMind выкатили агента Aletheia, который автономно пишет математические статьи и решает открытые задачи. А OpenAI опубликовали работу, где GPT-5.2 нашёл и доказал новый результат в квантовой теории поля — то, что десятилетиями не могли сделать люди. Ниже разбираемся, что именно произошло и чем эти два прорыва отличаются.
Начнём с OpenAI. 11 февраля вышел препринт «Single-minus gluon tree amplitudes are nonzero» — соавторы Эндрю Строминджер из Гарварда (один из архитекторов теории струн), Алекс Лупсаска из Вандербильта и OpenAI, Альфредо Геварра из Института перспективных исследований, Дэвид Скиннер из Кембриджа и Кевин Вейл от OpenAI. Суть: физики вручную рассчитали амплитуды рассеяния глюонов для небольших значений параметра n. Выражения получались чудовищно громоздкие, росли суперэкспоненциально, и найти в них закономерность было практически невозможно. Тогда они скормили результаты GPT-5.2 Pro. Модель упростила выражения, нашла паттерн и предложила общую формулу для любого n. После этого внутренняя версия модели со специальной обвязкой за 12 часов выдала формальное доказательство. Физики проверили его аналитически — всё сошлось. Строминджер сказал прямо: это первый раз, когда он видит, чтобы ИИ решил задачу в его области теоретической физики, которую люди, возможно, вообще не смогли бы решить.
Теперь Google. 12 февраля DeepMind опубликовали две статьи о системе Aletheia, построенной на базе Gemini 3 Deep Think. Это полноценный агент с трёхступенчатым циклом: генератор предлагает решение, верификатор проверяет его на естественном языке, рецензент исправляет ошибки. Плюс агент умеет искать по реальной математической литературе через Google Search, чтобы не галлюцинировать ссылки. Результаты: точность 95.1% на олимпиадном бенчмарке IMO-Proof Bench Advanced (предыдущий рекорд — 65.7%). Aletheia полностью автономно написала исследовательскую статью по арифметической геометрии, причём использовала методы из подобласти, с которой сами авторы проекта не были знакомы. В другой работе агент предложил стратегию доказательства верхнего уровня, а математики проработали детали — обычно ИИ используют наоборот, для рутины. При масштабной проверке на 700 открытых задачах из базы гипотез Эрдёша агент автономно решил четыре, опроверг десятилетнюю гипотезу и нашёл критическую ошибку в статье по криптографии.
Чем они отличаются. OpenAI показали глубину: один конкретный результат на переднем крае теоретической физики, который мог бы вообще остаться нерешённым. Google показали ширину и системность: агентная архитектура, массовая проверка, таксономия уровней автономности по аналогии с автопилотом. У Aletheia есть честная статистика ошибок — на задачах PhD-уровня система выдаёт ответы менее чем в 60% случаев. У OpenAI такой систематической оценки нет, зато есть один очень яркий кейс, от которого у Строминджера и Лупсаски, по словам очевидцев, горели глаза.
Есть общий знаменатель. Строминджер и Лупсаска сформулировали это так: «изменились две вещи — модель стала лучше, и мы научились с ней разговаривать». Это описывает обе истории. В случае Aletheia прогресс тоже идёт не только от новых весов, но и от агентной обвязки и inference-time scaling — версия января 2026 года требует в 100 раз меньше вычислений для задач олимпиадного уровня, чем версия лета 2025-го.
Патрик О'Шонесси, инвестор и подкастер, который ужинал со Строминджером и Лупсаской в день публикации, написал в твиттере:
Это, конечно, эмоция момента. Но факт в том, что за одну неделю два разных лидера индустрии независимо показали: ИИ может быть не только инструментом учёного, но и его соавтором. Не на бенчмарках, а в реальных статьях с реальными открытиями. Строминджер добавил, что теперь большинству физиков, которые хотят оставаться на переднем крае, придётся учиться разговаривать с моделями.
Год назад это было не так.
DeepMind выкатили агента Aletheia, который автономно пишет математические статьи и решает открытые задачи. А OpenAI опубликовали работу, где GPT-5.2 нашёл и доказал новый результат в квантовой теории поля — то, что десятилетиями не могли сделать люди. Ниже разбираемся, что именно произошло и чем эти два прорыва отличаются.
Начнём с OpenAI. 11 февраля вышел препринт «Single-minus gluon tree amplitudes are nonzero» — соавторы Эндрю Строминджер из Гарварда (один из архитекторов теории струн), Алекс Лупсаска из Вандербильта и OpenAI, Альфредо Геварра из Института перспективных исследований, Дэвид Скиннер из Кембриджа и Кевин Вейл от OpenAI. Суть: физики вручную рассчитали амплитуды рассеяния глюонов для небольших значений параметра n. Выражения получались чудовищно громоздкие, росли суперэкспоненциально, и найти в них закономерность было практически невозможно. Тогда они скормили результаты GPT-5.2 Pro. Модель упростила выражения, нашла паттерн и предложила общую формулу для любого n. После этого внутренняя версия модели со специальной обвязкой за 12 часов выдала формальное доказательство. Физики проверили его аналитически — всё сошлось. Строминджер сказал прямо: это первый раз, когда он видит, чтобы ИИ решил задачу в его области теоретической физики, которую люди, возможно, вообще не смогли бы решить.
Теперь Google. 12 февраля DeepMind опубликовали две статьи о системе Aletheia, построенной на базе Gemini 3 Deep Think. Это полноценный агент с трёхступенчатым циклом: генератор предлагает решение, верификатор проверяет его на естественном языке, рецензент исправляет ошибки. Плюс агент умеет искать по реальной математической литературе через Google Search, чтобы не галлюцинировать ссылки. Результаты: точность 95.1% на олимпиадном бенчмарке IMO-Proof Bench Advanced (предыдущий рекорд — 65.7%). Aletheia полностью автономно написала исследовательскую статью по арифметической геометрии, причём использовала методы из подобласти, с которой сами авторы проекта не были знакомы. В другой работе агент предложил стратегию доказательства верхнего уровня, а математики проработали детали — обычно ИИ используют наоборот, для рутины. При масштабной проверке на 700 открытых задачах из базы гипотез Эрдёша агент автономно решил четыре, опроверг десятилетнюю гипотезу и нашёл критическую ошибку в статье по криптографии.
Чем они отличаются. OpenAI показали глубину: один конкретный результат на переднем крае теоретической физики, который мог бы вообще остаться нерешённым. Google показали ширину и системность: агентная архитектура, массовая проверка, таксономия уровней автономности по аналогии с автопилотом. У Aletheia есть честная статистика ошибок — на задачах PhD-уровня система выдаёт ответы менее чем в 60% случаев. У OpenAI такой систематической оценки нет, зато есть один очень яркий кейс, от которого у Строминджера и Лупсаски, по словам очевидцев, горели глаза.
Есть общий знаменатель. Строминджер и Лупсаска сформулировали это так: «изменились две вещи — модель стала лучше, и мы научились с ней разговаривать». Это описывает обе истории. В случае Aletheia прогресс тоже идёт не только от новых весов, но и от агентной обвязки и inference-time scaling — версия января 2026 года требует в 100 раз меньше вычислений для задач олимпиадного уровня, чем версия лета 2025-го.
Патрик О'Шонесси, инвестор и подкастер, который ужинал со Строминджером и Лупсаской в день публикации, написал в твиттере:
ASI уже здесь, просто неравномерно распределён
Это, конечно, эмоция момента. Но факт в том, что за одну неделю два разных лидера индустрии независимо показали: ИИ может быть не только инструментом учёного, но и его соавтором. Не на бенчмарках, а в реальных статьях с реальными открытиями. Строминджер добавил, что теперь большинству физиков, которые хотят оставаться на переднем крае, придётся учиться разговаривать с моделями.
Год назад это было не так.
❤3
На Чаткате пропал второй Сиданс. Его и так то нельзя было уже заюзать, так как кредиты потратились еще раньше. Ни на каких агрегаторах модели нет. По слухам, на редких счастливчиков модель раскатывают в Dreamina, но я, получается, не редкий счастливчик. Все примеры в твиттере, особенно с голливудскими звездами — очевидно, сгененрены на китайских провайдерах или в Jimeng. Пытаться там зарегаться некитайцу не из Китая — все равно что пытаться высадиться на Луну с турбовинтового самолета.
Ждём, сука, 24 февраля...
Ждём, сука, 24 февраля...
Я поздравляю американских ИИ-визионеров, требовавших огородить Поднебесную от чипов Нвидиа. Теперь мы вынуждены сидеть и ждать, когда коммунисты соизволят раскатать самый передовой ИИ-продукт на планете.
Офигенный был план. Надёжный, как швейцарские часы.
Офигенный был план. Надёжный, как швейцарские часы.
😁5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
ААААААААААААСТАНАВИТЕСЬ
😭 😣 😁
Это обновленный вчера Gemini 3 Deep Think делает Симс с ваншота. Мои шутки про ГТА 6 до ГТА 6 станут не шутками?
Поиграться в это
Это обновленный вчера Gemini 3 Deep Think делает Симс с ваншота. Мои шутки про ГТА 6 до ГТА 6 станут не шутками?
Поиграться в это
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
В октябре ллмки не могли сделать статичный svg с пеликаном на велосипеде. Gemini 3 в Deep Think режиме в феврале: анимированный svg полета ракеты в космос.
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Лицо тех, кто утверждал, что нейросети не окажут фундаментального влияния на нашу жизнь представили?
🥰2
В Kimi теперь можно развернуть OpenClaw (это тот самый суперагент, который наделал шума на прошлой неделе) одним щелчком мыши без танцев с бубном ⌨️
Трата 20 тысяч тенге оправдана
Трата 20 тысяч тенге оправдана
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Композеры, извините, но реально на выход. Seedance 2.0 способна удалять из кадра нежелательные объекты не меняя ничего больше, идеально. Присмотритесь, удалено не только отражение оператора в зеркале, но и сам оператор в левом верхнем углу.
🔥4🤯2
Botlicker
В Kimi теперь можно развернуть OpenClaw (это тот самый суперагент, который наделал шума на прошлой неделе) одним щелчком мыши без танцев с бубном ⌨️ Трата 20 тысяч тенге оправдана
Вот какие возможности теперь есть прямо из коробки с OpenClaw в Kimi, если у вас подписка Alegretto (39$) и выше
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Новость о том, что создатель OpenClaw теперь работает в OpenAI по приглашению Альтмана:
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вангую, в этом году Голливуду придётся признать прогресс и пойти по пути музыкальных мейджер-лейблов: будут заключены многочисленные контракты на реюз через Сиданс/Вео/Сору лиц артистов и франшиз и буквально каждый сможет создавать свои ремэйки/ремиксы чего угодно.
Умилительно, что я два месяца назад говорил о создании любительских киноремэйков как о будущем в горизонте 5 лет, а это оказалось возможным уже сейчас.
Умилительно, что я два месяца назад говорил о создании любительских киноремэйков как о будущем в горизонте 5 лет, а это оказалось возможным уже сейчас.