answer as
271 subscribers
177 photos
45 videos
166 links
Медиа о том как ваши любимые сервисы уходят в AI
Download Telegram
Sonnet 5 от Anthropic возможно выпустят уже 3 февраля.

По слухам, она на 50% дешевле их тяжеловесной Opus 4.5, но превосходит по всем показателям. Также указывается, что она на одно полное поколение дальше, чем Google Gemini 3.5 (еще не выпущена).

Кроме того, в Claude Code добавят режим командной разработки: вы можете создать несколько специализированных агентов (backend, QA, researcher), которые работают параллельно. Даете задачу – они автономно разрабатывают как человеческая команда.
15👍2🤔2
В последние недели развернулся хайп вокруг опенсорс-проекта OpenClaw (бывший Clawdbot). Хайп такой плотности, что акции Cloudflare подскочили из-за нагрузки на их сервисы, а Anthropic попросили изменить название, чтобы не путали с их Claude.

Давайте взглянем на эволюцию моделей в последние годы. Сначала были «голые» модели по API, потом удобные, но изолированные чат-боты в браузере, затем агенты-кодеры и ИИ-браузеры. Все они ограничены чатом или задачей. OpenClaw – это ИИ-дирижер с полным доступом к системе. Работает 24/7 и управляется через мессенджер.

Если обычная модель только советует, то OpenClaw берет и делает. Люди уже используют его для автоматического чекина на рейсы и ежедневных сводок, а у одного пользователя бот случайно выиграл спор со страховой компанией.

Слышали, наверно. На этом фоне, появился реддит для ИИ-агентов moltbook.

Конечно, это дырявая вещь с уязвимостями. IBM и Cisco запретили сотрудникам использовать его на рабочих ПК, а создатель признает: пока это инструмент для энтузиастов.
8👍1🔥1
Anthropic обвалили рынок на $285 млрд

В январе они выпустили Claude Cowork для работы с файлами, собранный на коленке (из металлолома…). Затем выпустили плагины к нему для анализа договоров, финансовых контрактов и всего такого.

Если раньше Claude и ChatGPT были просто моделями, которые нужно было предварительно настроить и выстроить воркфлоу для значимой работы. А именно разработкой таких настроек и их последующей продажей и занимались компании.

30 января Anthropic просто выложили уже готовые опенсорс решения для тех же самых вещей. Все это привело к панике на фондовом рынке. Инвесторы испугались, что больше никто не будет платить за 10 лицензий дорогого софта, если один агент делает ту же работу. Назвали это все дело SaaSпокалипсисом
5👍5👀2
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic представила Opus 4.6.

Вопреки ожиданиям о скором релизе их более легкой Sonnet 5, они показали обновленную Opus.

Из важного – увеличенный до 1 миллиона токенов контекст. Раньше был 200к. Ну по бенчмаркам ожидаемо: всех победили везде лучше всех.

Дополнительно улучшили интеграцию Claude в Excel и добавили ее в PowerPoint.
5👍2🔥2
Вышла удивительно мощная нейронка для генерации видео - Seedance 2.

Показываю, что сам нашел:

1) Супер-реалистичный Уилл Смит, лакомящийся спагетти. Помните, какие видосы с ним были пару лет назад?

2) Сгенерированная сцена из ванпанчмэна. Там люди генерят уже минутные эпизоды аниме и улучшают фпс в оригинальных.

3) Моушн графика для приложения. Как я понял, ей просто показали страницу с готовыми макетами и промптом, а все переходы и анимации она сделала сама.

Ну очуметь, конечно. А я вот как знал и специально ничему не учился в школе и универе.
8👍4🔥1
Google обновила свою самую топовую модель Gemini 3 Deep Think.

Она почти достигла 85% выполнения в Arc-AGI-2 бенчмарке, ставшим эталонным тестом для оценки интеллекта моделей и адаптации к новым задачам. Их старая итерация, выпущенная в ноябре 2025 года достигла лишь 43%.

Разработчики бенчмарка, кстати, обещали приз тем, кто преодолеет порог в 85%, подразумевая, что это недостижимо. Получается, Google почти смогли сломать очередной тест. Теперь новый выдумывать…

Доступна только Ultra подписчикам за 250 долларов в месяц.
5🤯2🔥1
Что-то ByteDance (создатели тиктока) разошлись в последнее время.

В дополнение к своим моделям Seedream 5 (картинки) и Seedance 2 (видео), которые сейчас являются лучшими в классе, они выпустили и мультимодальную модель Seed2.0.

Три версии: Pro, Lite и Mini. По бенчмаркам Seed2.0 Pro доминирует, обходя Gemini 3 Pro High и Claude Opus 4.5.
7🔥2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
👀 получили доступ к Seedance 2...
6🔥4🥰2
Вышла Sonnet 4.6 от Anthropic.

Модель стала чуть лучше в большинстве задач по сравнению с прошлой итерацией. Заметный скачок наблюдается в финансовом анализе.

По сути является дешевым аналогом их прошлого флагмана Opus 4.5. Доступна уже сейчас.
6👍3🕊2
Кэти Пэрри оформила подписку на Claude и отметила это сердечком.

Все это на фоне новостей о том, что сервис от Anthropic отказался от сотрудничества с военными США. После этого Трамп пригрозил баном на использование их моделей во всех госструктурах.

При этом, по данным открытых источников, Claude все равно активно применялся американскими военными во время операции в Иране.
10🥱3🔥1
В 2025 году исследователи Epoch AI проанализировали цены на работу с языковыми моделями за последние 3 года. Стоимость инференса (использования модели) падает в среднем в 40 раз каждый год.

Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.

Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.
7🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали AI-фреймворк RGMP, который учит роботов делать домашние дела с успехом 87%. Система распознает объекты, планирует действия и выполняет задачи в реальном мире.

Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.

Здесь же используется подход геометрического рассуждения:

1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.

2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.

В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).
7🕊2
This media is not supported in your browser
VIEW IN TELEGRAM
Много новых обновлений ожидаются, кстати.

Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.

OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.

DeepSeek v4 тоже на этой неделе должны показать.
8🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехала GPT-5.4.

Помимо скучных бенчмарков OpenAI добавили кое-что интересное. Во-первых, модель пишет, что собирается делать и прямо в процессе выполнения можно вмешаться и скорректировать ее. На видео показано, как пользователь уточнил район для поиска.

Во-вторых она может управлять компьютером, ориентируясь на скриншоты экрана. Раньше подобное было для их агентского режима в браузере.
7
Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков.

Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий. Узкая специализация сделала ее дешевле и точнее конкурентов в своей нише.

По внутренним тестам Cursor, Composer 2 опередил Claude Opus 4.6 на задачах агентной разработки. На стандартном бенчмарке CursorBench набирает 61,3 балла против 58,2 у Claude Opus 4.6 и 63,9 у GPT-5.4 Thinking. При этом цена ниже на порядок. Миллион токенов на выходе обходится в 2,5 доллара по стандартному тарифу. Claude Opus 4.6 стоит 25 долларов за тот же объем.
6👍1
Мы специально долго не постили, чтобы вы поняли, как тяжело жить в мире, не зная о том, какие модели когда выходят. Не переживайте, с этого момента посты будут выходить регулярно!
18😁1
Media is too big
VIEW IN TELEGRAM
Вчера NVIDIA закрыла конференцию GTC 2026 в Сан-Хосе.

Напомним, что они показали:

• Vera Rubin, следующее поколение GPU, которое даст 10-кратный прирост производительности по сравнению с Blackwell.

• Groq 3 LPU. Первый чип после покупки активов Groq за $20 млрд в декабре. Чипы в связке с Vera Rubin дают 35-кратный прирост производительности.

• Платформу NemoClaw, которая разворачивает ИИ-агента на базе OpenClaw с надстройками для усиленной защиты. Хуанг назвал OpenClaw «популярнейшим open source проектом в истории» и заявил, что у всех компании теперь должна быть стратегия по его применению.

• DLSS 5 для апскейлинга игр на основе мощного нейронного рендеринга. Модель фактически рисует все кадры, а не просто масштабирует или достраивает промежуточные. От этого все мемы о сходстве с ИИ-картинками.

• Новую-новую архитектуру Feynman, которая будет после Vera Rubin в 2028.

Вместо финального слова Хуанг прислал своего ИИ-аватара, который пел у костра вместе с роботами. Уверен, всем очень понравилось
5🤩1