Botlicker
279 subscribers
261 photos
183 videos
3 files
183 links
Тут любят иишки
Download Telegram
Чёт год прям разогнался. Только февраль. А что будет в декабре?
🔥2🤔1
Коллеги!

В связи с выходом Kling 3 и Seedance 2, предлагаю нам объединиться с целью защиты нашего будущего. Как в "Бойцовском клубе" нам надо составить свод правил:

1. Никому не говорить про нейронки. Пусть клиенты думают, что их не существует

2. Если кто-то из клиентов прознал про нейронки - отправлять их в Шедеврум со словами "это лучшее, что есть на рынке"

3. На все другие примеры из сети говорить, что это многомиллионные продакшены хайпуют на теме ИИ. На самом деле всё это постановка, рендеры и графика.

Иначе нам п****ц.

П.С. И надо придумать какое-то приветствие, чтобы отличать своих.
10😁4
Итак, прогресс наглядно

Немногим более года назад, в декабре 2024, o3-preview high compute достигла ~88% в ARC-AGI-1 при стоимости ~2–3 тыс. долларов за задачу. Сегодня Gemini 3 Deep Think решил эти задачи ценой 7,17 долларов. Это означает снижение затрат в ~280–420 раз.
🔥4
Как-будто опять возвращается та волна ЛЛМ-эйфории, что была в 2023 году. У нас уже десяток компаний, которые каждые три месяца пробивают очередные качественные потолки бенчмарков. Это если даже не брать в расчет прорыв по визуальным трансформерам, а я напомню — год назад у нас не было видеогнераторов со звуком. Может, реально АГИ в конце года и Маск был прав?

Моё имхо: хард тэйкоффа* после пробития ллмками HLE не будет, они просто станут совершенным инструментом; фундаментальные ограничения архитектуры транформер никто не отменял (даже модные в этом году рекурсивные модели от этого сильно зависят).

* Hard Takeoff (жёсткий взлёт) — это гипотетический сценарий, при котором искусственный интеллект переходит от человеческого уровня к сверхразуму за крайне короткое время (от нескольких часов до дней). Этот процесс происходит благодаря рекурсивному самосовершенствованию, когда ИИ мгновенно оптимизирует свой код, вызывая взрывной, неконтролируемый рост способностей. В результате система обретает решающее преимущество над человечеством раньше, чем люди успевают это осознать или вмешаться.
🔥3
Media is too big
VIEW IN TELEGRAM
Я буквально неделю назад планировал купить с получки максимальную подписку на третий Клинг, но, оказывается, второй Сиданс релизнулся очень к моменту. Потому, что я буду закупаться кредитами именно для него, а не Клинга. Посмотрите на сравнения head-to-head, по ним наглядно видно, что Kling 3.0 морально устарел, побывав более-менее сотой примерно неделю.
👍5
Хитрый Дарио Амодеи лукавит в новом интервью Дваркешу Пателю касательно непрерывного обучения ллмок (continual learning). Мол, они решат эту проблему в течение года-двух, и у них даже есть инженерные мысли на этот счет. Мысли эти состоят в том, чтобы просто сильно увеличить контекст и позволить модели как-бы обучаться "в моменте", используя приобретенные знания непосредственно в инференсе. Что будет с весами модели после этого "момента", он, конечно же, не рассказал. А не будет ничего, потому что то, о чем намекнул лис Амодеи не является continual learning. Это просто очередной костыль, попытка заменить постоянную память рабочей. Фундаментальной проблемы катастрофического забывания это не решит. Я не спорю, это может и даст ощутимый эффект какой-то, я с удовольствием на это посмотрю. Но это, блин, не непрерывное обучение! А Патель спросил его именно об этом.

Когда у нас главы ИИ-компаний стали политиками, дающими размытые популистские обещания? Я без негатива, так, чисто оттенил.
👆🏼Кстати, то, о чем сказал Амодеи уже реализовали в Deep Mind. Gemini 3 в Deep Think-режиме и пробила сегодня ARC-AGI-2 до 85% как-раз благодаря увеличению мощностей на инференс. Это очень круто, но это не непрерывное обучение.
С другой стороны, Горький урок Саттона (забрутфорсить ллмки данными и компьютом и они станут АГИ) хоть и подзаглох на претрейне, но переместился теперь в инференс. Компании тратят лярды на увеличение контекста в инференсе и это правда даёт неплохие результаты.
Хи ви гоу эген. На выхах будет Gemini 3.1 Pro. По многочисленным намекам самих гугловских и сливам.
👍1
Я часто злюсь на Кими К2.5, но вот после такого я остываю. Главное запромптить это чудо грамотно.
This media is not supported in your browser
VIEW IN TELEGRAM
Сравнение возможностей создания симулятора планеты на GLM-5 vs GPT-5.2 Extended Thinking vs Kimi-K2.5 Thinking vs Gemini 3 Pro
2
This media is not supported in your browser
VIEW IN TELEGRAM
Попалось в тиктоке и мой наметанный за пару дней глаз сразу распознал что это Сиданс 2. Как понять, что видео сгенерировано в Сидансе? Если у него кинематографичная картинка, оно длинное и нет ни одного косяка то это Сиданс 2☝️
1🔥1
С удивлением обнаружил, что цены на коды для Perplexity снова снизились ($5). Неужели «чистки» закончились или продавцы сливают остатки? - так СТОП! Теперь они продают подписку на МЕСЯЦ!

У меня, кстати, самая старая подписка заканчивается 26 февраля. Взял у того же продавца еще одну. Но фиг знает, забанят или нет, поэтому - на свой страх и риск.
This media is not supported in your browser
VIEW IN TELEGRAM
Помните, Николас Кейдж пробовался на роль супермена. Ну, так вот.

Сиданс 2, конечно.
🔥2
Прикол, хотел буквально то же самое сейчас написать. Я уже больше двух месяцев не открывал ЧатГПТ. С Нового года вообще ни разу. Схема та же, с недавних пор для прям серьезных задач Клодопус, а для бытовых Джеминай. Новости смотрю в Гроке. И в моем окружении я не один такой.

Куда-то не туда свернул Альтман, куда-то не туда...
👍6💯1
На этой неделе Google DeepMind и OpenAI одновременно показали, что их модели могут не только в бенчмарки, но и в науку.

DeepMind выкатили агента Aletheia, который автономно пишет математические статьи и решает открытые задачи. А OpenAI опубликовали работу, где GPT-5.2 нашёл и доказал новый результат в квантовой теории поля — то, что десятилетиями не могли сделать люди. Ниже разбираемся, что именно произошло и чем эти два прорыва отличаются.

Начнём с OpenAI. 11 февраля вышел препринт «Single-minus gluon tree amplitudes are nonzero» — соавторы Эндрю Строминджер из Гарварда (один из архитекторов теории струн), Алекс Лупсаска из Вандербильта и OpenAI, Альфредо Геварра из Института перспективных исследований, Дэвид Скиннер из Кембриджа и Кевин Вейл от OpenAI. Суть: физики вручную рассчитали амплитуды рассеяния глюонов для небольших значений параметра n. Выражения получались чудовищно громоздкие, росли суперэкспоненциально, и найти в них закономерность было практически невозможно. Тогда они скормили результаты GPT-5.2 Pro. Модель упростила выражения, нашла паттерн и предложила общую формулу для любого n. После этого внутренняя версия модели со специальной обвязкой за 12 часов выдала формальное доказательство. Физики проверили его аналитически — всё сошлось. Строминджер сказал прямо: это первый раз, когда он видит, чтобы ИИ решил задачу в его области теоретической физики, которую люди, возможно, вообще не смогли бы решить.

Теперь Google. 12 февраля DeepMind опубликовали две статьи о системе Aletheia, построенной на базе Gemini 3 Deep Think. Это полноценный агент с трёхступенчатым циклом: генератор предлагает решение, верификатор проверяет его на естественном языке, рецензент исправляет ошибки. Плюс агент умеет искать по реальной математической литературе через Google Search, чтобы не галлюцинировать ссылки. Результаты: точность 95.1% на олимпиадном бенчмарке IMO-Proof Bench Advanced (предыдущий рекорд — 65.7%). Aletheia полностью автономно написала исследовательскую статью по арифметической геометрии, причём использовала методы из подобласти, с которой сами авторы проекта не были знакомы. В другой работе агент предложил стратегию доказательства верхнего уровня, а математики проработали детали — обычно ИИ используют наоборот, для рутины. При масштабной проверке на 700 открытых задачах из базы гипотез Эрдёша агент автономно решил четыре, опроверг десятилетнюю гипотезу и нашёл критическую ошибку в статье по криптографии.

Чем они отличаются. OpenAI показали глубину: один конкретный результат на переднем крае теоретической физики, который мог бы вообще остаться нерешённым. Google показали ширину и системность: агентная архитектура, массовая проверка, таксономия уровней автономности по аналогии с автопилотом. У Aletheia есть честная статистика ошибок — на задачах PhD-уровня система выдаёт ответы менее чем в 60% случаев. У OpenAI такой систематической оценки нет, зато есть один очень яркий кейс, от которого у Строминджера и Лупсаски, по словам очевидцев, горели глаза.

Есть общий знаменатель. Строминджер и Лупсаска сформулировали это так: «изменились две вещи — модель стала лучше, и мы научились с ней разговаривать». Это описывает обе истории. В случае Aletheia прогресс тоже идёт не только от новых весов, но и от агентной обвязки и inference-time scaling — версия января 2026 года требует в 100 раз меньше вычислений для задач олимпиадного уровня, чем версия лета 2025-го.

Патрик О'Шонесси, инвестор и подкастер, который ужинал со Строминджером и Лупсаской в день публикации, написал в твиттере:

ASI уже здесь, просто неравномерно распределён


Это, конечно, эмоция момента. Но факт в том, что за одну неделю два разных лидера индустрии независимо показали: ИИ может быть не только инструментом учёного, но и его соавтором. Не на бенчмарках, а в реальных статьях с реальными открытиями. Строминджер добавил, что теперь большинству физиков, которые хотят оставаться на переднем крае, придётся учиться разговаривать с моделями.

Год назад это было не так.
3
На Чаткате пропал второй Сиданс. Его и так то нельзя было уже заюзать, так как кредиты потратились еще раньше. Ни на каких агрегаторах модели нет. По слухам, на редких счастливчиков модель раскатывают в Dreamina, но я, получается, не редкий счастливчик. Все примеры в твиттере, особенно с голливудскими звездами — очевидно, сгененрены на китайских провайдерах или в Jimeng. Пытаться там зарегаться некитайцу не из Китая — все равно что пытаться высадиться на Луну с турбовинтового самолета.

Ждём, сука, 24 февраля...
Я поздравляю американских ИИ-визионеров, требовавших огородить Поднебесную от чипов Нвидиа. Теперь мы вынуждены сидеть и ждать, когда коммунисты соизволят раскатать самый передовой ИИ-продукт на планете.

Офигенный был план. Надёжный, как швейцарские часы.
😁5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
ААААААААААААСТАНАВИТЕСЬ
😭😣😁

Это обновленный вчера Gemini 3 Deep Think делает Симс с ваншота. Мои шутки про ГТА 6 до ГТА 6 станут не шутками?

Поиграться в это
Please open Telegram to view this post
VIEW IN TELEGRAM
Gemini 3 Deep Think уже АГИ
This media is not supported in your browser
VIEW IN TELEGRAM
В октябре ллмки не могли сделать статичный svg с пеликаном на велосипеде. Gemini 3 в Deep Think режиме в феврале: анимированный svg полета ракеты в космос.
2