Botlicker – Telegram

Botlicker

279 subscribers

261 photos

183 videos

3 files

183 links

Тут любят иишки

Download Telegram

About

Blog

Apps

Platform

279 subscribers

Чёт год прям разогнался. Только февраль. А что будет в декабре?

🔥2🤔1

141 views06:11

Коллеги!

В связи с выходом Kling 3 и Seedance 2, предлагаю нам объединиться с целью защиты нашего будущего. Как в "Бойцовском клубе" нам надо составить свод правил:

1. Никому не говорить про нейронки. Пусть клиенты думают, что их не существует

2. Если кто-то из клиентов прознал про нейронки - отправлять их в Шедеврум со словами "это лучшее, что есть на рынке"

3. На все другие примеры из сети говорить, что это многомиллионные продакшены хайпуют на теме ИИ. На самом деле всё это постановка, рендеры и графика.

Иначе нам п****ц.

П.С. И надо придумать какое-то приветствие, чтобы отличать своих.

❤10😁4

150 views07:39

Итак, прогресс наглядно

Немногим более года назад, в декабре 2024, o3-preview high compute достигла ~88% в ARC-AGI-1 при стоимости ~2–3 тыс. долларов за задачу. Сегодня Gemini 3 Deep Think решил эти задачи ценой 7,17 долларов. Это означает снижение затрат в ~280–420 раз.

🔥4

149 viewsedited 09:55

Как-будто опять возвращается та волна ЛЛМ-эйфории, что была в 2023 году. У нас уже десяток компаний, которые каждые три месяца пробивают очередные качественные потолки бенчмарков. Это если даже не брать в расчет прорыв по визуальным трансформерам, а я напомню — год назад у нас не было видеогнераторов со звуком. Может, реально АГИ в конце года и Маск был прав?

Моё имхо: хард тэйкоффа* после пробития ллмками HLE не будет, они просто станут совершенным инструментом; фундаментальные ограничения архитектуры транформер никто не отменял (даже модные в этом году рекурсивные модели от этого сильно зависят).

* Hard Takeoff (жёсткий взлёт) — это гипотетический сценарий, при котором искусственный интеллект переходит от человеческого уровня к сверхразуму за крайне короткое время (от нескольких часов до дней). Этот процесс происходит благодаря рекурсивному самосовершенствованию, когда ИИ мгновенно оптимизирует свой код, вызывая взрывной, неконтролируемый рост способностей. В результате система обретает решающее преимущество над человечеством раньше, чем люди успевают это осознать или вмешаться.

🔥3

143 views11:12

Media is too big

VIEW IN TELEGRAM

Я буквально неделю назад планировал купить с получки максимальную подписку на третий Клинг, но, оказывается, второй Сиданс релизнулся очень к моменту. Потому, что я буду закупаться кредитами именно для него, а не Клинга. Посмотрите на сравнения head-to-head, по ним наглядно видно, что Kling 3.0 морально устарел, побывав более-менее сотой примерно неделю.

👍5

163 views16:39

Хитрый Дарио Амодеи лукавит в новом интервью Дваркешу Пателю касательно непрерывного обучения ллмок (continual learning). Мол, они решат эту проблему в течение года-двух, и у них даже есть инженерные мысли на этот счет. Мысли эти состоят в том, чтобы просто сильно увеличить контекст и позволить модели как-бы обучаться "в моменте", используя приобретенные знания непосредственно в инференсе. Что будет с весами модели после этого "момента", он, конечно же, не рассказал. А не будет ничего, потому что то, о чем намекнул лис Амодеи не является continual learning. Это просто очередной костыль, попытка заменить постоянную память рабочей. Фундаментальной проблемы катастрофического забывания это не решит. Я не спорю, это может и даст ощутимый эффект какой-то, я с удовольствием на это посмотрю. Но это, блин, не непрерывное обучение! А Патель спросил его именно об этом.

Когда у нас главы ИИ-компаний стали политиками, дающими размытые популистские обещания? Я без негатива, так, чисто оттенил.

Dario Amodei — “We are near the end of the exponential”

Dario Amodei thinks we are just a few years away from “a country of geniuses in a data center”. In this episode, we discuss what to make of the scaling hypothesis in the current RL regime, how AI will diffuse throughout the economy, whether Anthropic is underinvesting…

147 viewsedited 20:18

👆🏼Кстати, то, о чем сказал Амодеи уже реализовали в Deep Mind. Gemini 3 в Deep Think-режиме и пробила сегодня ARC-AGI-2 до 85% как-раз благодаря увеличению мощностей на инференс. Это очень круто, но это не непрерывное обучение.

143 views20:25

С другой стороны, Горький урок Саттона (забрутфорсить ллмки данными и компьютом и они станут АГИ) хоть и подзаглох на претрейне, но переместился теперь в инференс. Компании тратят лярды на увеличение контекста в инференсе и это правда даёт неплохие результаты.

144 views20:46

Хи ви гоу эген. На выхах будет Gemini 3.1 Pro. По многочисленным намекам самих гугловских и сливам.

👍1

144 views21:02

Я часто злюсь на Кими К2.5, но вот после такого я остываю. Главное запромптить это чудо грамотно.

143 viewsedited 22:00

This media is not supported in your browser

VIEW IN TELEGRAM

Сравнение возможностей создания симулятора планеты на GLM-5 vs GPT-5.2 Extended Thinking vs Kimi-K2.5 Thinking vs Gemini 3 Pro

❤2

149 views22:09

This media is not supported in your browser

VIEW IN TELEGRAM

Попалось в тиктоке и мой наметанный за пару дней глаз сразу распознал что это Сиданс 2. Как понять, что видео сгенерировано в Сидансе? Если у него кинематографичная картинка, оно длинное и нет ни одного косяка то это Сиданс 2☝️

❤1🔥1

163 viewsedited 10:27

Forwarded from Силиконовый Мешок

С удивлением обнаружил, что цены на коды для Perplexity снова снизились ($5). Неужели «чистки» закончились или продавцы сливают остатки? - так СТОП! Теперь они продают подписку на МЕСЯЦ!

У меня, кстати, самая старая подписка заканчивается 26 февраля. Взял у того же продавца еще одну. Но фиг знает, забанят или нет, поэтому - на свой страх и риск.

135 views13:03

This media is not supported in your browser

VIEW IN TELEGRAM

Помните, Николас Кейдж пробовался на роль супермена. Ну, так вот.

Сиданс 2, конечно.

🔥2

161 viewsedited 14:49

Прикол, хотел буквально то же самое сейчас написать. Я уже больше двух месяцев не открывал ЧатГПТ. С Нового года вообще ни разу. Схема та же, с недавних пор для прям серьезных задач Клодопус, а для бытовых Джеминай. Новости смотрю в Гроке. И в моем окружении я не один такой.

Куда-то не туда свернул Альтман, куда-то не туда...

👍6💯1

144 viewsedited 16:16

На этой неделе Google DeepMind и OpenAI одновременно показали, что их модели могут не только в бенчмарки, но и в науку.

DeepMind выкатили агента Aletheia, который автономно пишет математические статьи и решает открытые задачи. А OpenAI опубликовали работу, где GPT-5.2 нашёл и доказал новый результат в квантовой теории поля — то, что десятилетиями не могли сделать люди. Ниже разбираемся, что именно произошло и чем эти два прорыва отличаются.

Начнём с OpenAI. 11 февраля вышел препринт «Single-minus gluon tree amplitudes are nonzero» — соавторы Эндрю Строминджер из Гарварда (один из архитекторов теории струн), Алекс Лупсаска из Вандербильта и OpenAI, Альфредо Геварра из Института перспективных исследований, Дэвид Скиннер из Кембриджа и Кевин Вейл от OpenAI. Суть: физики вручную рассчитали амплитуды рассеяния глюонов для небольших значений параметра n. Выражения получались чудовищно громоздкие, росли суперэкспоненциально, и найти в них закономерность было практически невозможно. Тогда они скормили результаты GPT-5.2 Pro. Модель упростила выражения, нашла паттерн и предложила общую формулу для любого n. После этого внутренняя версия модели со специальной обвязкой за 12 часов выдала формальное доказательство. Физики проверили его аналитически — всё сошлось. Строминджер сказал прямо: это первый раз, когда он видит, чтобы ИИ решил задачу в его области теоретической физики, которую люди, возможно, вообще не смогли бы решить.

Теперь Google. 12 февраля DeepMind опубликовали две статьи о системе Aletheia, построенной на базе Gemini 3 Deep Think. Это полноценный агент с трёхступенчатым циклом: генератор предлагает решение, верификатор проверяет его на естественном языке, рецензент исправляет ошибки. Плюс агент умеет искать по реальной математической литературе через Google Search, чтобы не галлюцинировать ссылки. Результаты: точность 95.1% на олимпиадном бенчмарке IMO-Proof Bench Advanced (предыдущий рекорд — 65.7%). Aletheia полностью автономно написала исследовательскую статью по арифметической геометрии, причём использовала методы из подобласти, с которой сами авторы проекта не были знакомы. В другой работе агент предложил стратегию доказательства верхнего уровня, а математики проработали детали — обычно ИИ используют наоборот, для рутины. При масштабной проверке на 700 открытых задачах из базы гипотез Эрдёша агент автономно решил четыре, опроверг десятилетнюю гипотезу и нашёл критическую ошибку в статье по криптографии.

Чем они отличаются. OpenAI показали глубину: один конкретный результат на переднем крае теоретической физики, который мог бы вообще остаться нерешённым. Google показали ширину и системность: агентная архитектура, массовая проверка, таксономия уровней автономности по аналогии с автопилотом. У Aletheia есть честная статистика ошибок — на задачах PhD-уровня система выдаёт ответы менее чем в 60% случаев. У OpenAI такой систематической оценки нет, зато есть один очень яркий кейс, от которого у Строминджера и Лупсаски, по словам очевидцев, горели глаза.

Есть общий знаменатель. Строминджер и Лупсаска сформулировали это так: «изменились две вещи — модель стала лучше, и мы научились с ней разговаривать». Это описывает обе истории. В случае Aletheia прогресс тоже идёт не только от новых весов, но и от агентной обвязки и inference-time scaling — версия января 2026 года требует в 100 раз меньше вычислений для задач олимпиадного уровня, чем версия лета 2025-го.

Патрик О'Шонесси, инвестор и подкастер, который ужинал со Строминджером и Лупсаской в день публикации, написал в твиттере:

ASI уже здесь, просто неравномерно распределён

Это, конечно, эмоция момента. Но факт в том, что за одну неделю два разных лидера индустрии независимо показали: ИИ может быть не только инструментом учёного, но и его соавтором. Не на бенчмарках, а в реальных статьях с реальными открытиями. Строминджер добавил, что теперь большинству физиков, которые хотят оставаться на переднем крае, придётся учиться разговаривать с моделями.

Год назад это было не так.

❤3

235 views16:56

На Чаткате пропал второй Сиданс. Его и так то нельзя было уже заюзать, так как кредиты потратились еще раньше. Ни на каких агрегаторах модели нет. По слухам, на редких счастливчиков модель раскатывают в Dreamina, но я, получается, не редкий счастливчик. Все примеры в твиттере, особенно с голливудскими звездами — очевидно, сгененрены на китайских провайдерах или в Jimeng. Пытаться там зарегаться некитайцу не из Китая — все равно что пытаться высадиться на Луну с турбовинтового самолета.

Ждём, сука, 24 февраля...

144 views20:47

Я поздравляю американских ИИ-визионеров, требовавших огородить Поднебесную от чипов Нвидиа. Теперь мы вынуждены сидеть и ждать, когда коммунисты соизволят раскатать самый передовой ИИ-продукт на планете.

Офигенный был план. Надёжный, как швейцарские часы.

😁5👍1

153 viewsedited 20:52

This media is not supported in your browser

VIEW IN TELEGRAM

ААААААААААААСТАНАВИТЕСЬ

😭

😣

😁

Это обновленный вчера Gemini 3 Deep Think делает Симс с ваншота. Мои шутки про ГТА 6 до ГТА 6 станут не шутками?

Поиграться в это

Please open Telegram to view this post

VIEW IN TELEGRAM

241 viewsedited 21:13

Gemini 3 Deep Think уже АГИ

236 views21:26

This media is not supported in your browser

VIEW IN TELEGRAM

В октябре ллмки не могли сделать статичный svg с пеликаном на велосипеде. Gemini 3 в Deep Think режиме в феврале: анимированный svg полета ракеты в космос.

❤2

236 viewsedited 21:30