answer as – Telegram

answer as

271 subscribers

177 photos

45 videos

166 links

Медиа о том как ваши любимые сервисы уходят в AI

Download Telegram

About

Blog

Apps

Platform

271 subscribers

Sonnet 5 от Anthropic возможно выпустят уже 3 февраля.

По слухам, она на 50% дешевле их тяжеловесной Opus 4.5, но превосходит по всем показателям. Также указывается, что она на одно полное поколение дальше, чем Google Gemini 3.5 (еще не выпущена).

Кроме того, в Claude Code добавят режим командной разработки: вы можете создать несколько специализированных агентов (backend, QA, researcher), которые работают параллельно. Даете задачу – они автономно разрабатывают как человеческая команда.

1❤5👍2🤔2

129 views11:05

В последние недели развернулся хайп вокруг опенсорс-проекта OpenClaw (бывший Clawdbot). Хайп такой плотности, что акции Cloudflare подскочили из-за нагрузки на их сервисы, а Anthropic попросили изменить название, чтобы не путали с их Claude.

Давайте взглянем на эволюцию моделей в последние годы. Сначала были «голые» модели по API, потом удобные, но изолированные чат-боты в браузере, затем агенты-кодеры и ИИ-браузеры. Все они ограничены чатом или задачей. OpenClaw – это ИИ-дирижер с полным доступом к системе. Работает 24/7 и управляется через мессенджер.

Если обычная модель только советует, то OpenClaw берет и делает. Люди уже используют его для автоматического чекина на рейсы и ежедневных сводок, а у одного пользователя бот случайно выиграл спор со страховой компанией.

Слышали, наверно. На этом фоне, появился реддит для ИИ-агентов moltbook.

Конечно, это дырявая вещь с уязвимостями. IBM и Cisco запретили сотрудникам использовать его на рабочих ПК, а создатель признает: пока это инструмент для энтузиастов.

❤8👍1🔥1

154 views15:04

Anthropic обвалили рынок на $285 млрд

В январе они выпустили Claude Cowork для работы с файлами, собранный на коленке (из металлолома…). Затем выпустили плагины к нему для анализа договоров, финансовых контрактов и всего такого.

Если раньше Claude и ChatGPT были просто моделями, которые нужно было предварительно настроить и выстроить воркфлоу для значимой работы. А именно разработкой таких настроек и их последующей продажей и занимались компании.

30 января Anthropic просто выложили уже готовые опенсорс решения для тех же самых вещей. Все это привело к панике на фондовом рынке. Инвесторы испугались, что больше никто не будет платить за 10 лицензий дорогого софта, если один агент делает ту же работу. Назвали это все дело SaaSпокалипсисом

❤5👍5👀2

130 viewsedited 08:03

This media is not supported in your browser

VIEW IN TELEGRAM

Anthropic представила Opus 4.6.

Вопреки ожиданиям о скором релизе их более легкой Sonnet 5, они показали обновленную Opus.

Из важного – увеличенный до 1 миллиона токенов контекст. Раньше был 200к. Ну по бенчмаркам ожидаемо: всех победили везде лучше всех.

Дополнительно улучшили интеграцию Claude в Excel и добавили ее в PowerPoint.

❤5👍2🔥2

142 views19:01

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Вышла удивительно мощная нейронка для генерации видео - Seedance 2.

Показываю, что сам нашел:

1) Супер-реалистичный Уилл Смит, лакомящийся спагетти. Помните, какие видосы с ним были пару лет назад?

2) Сгенерированная сцена из ванпанчмэна. Там люди генерят уже минутные эпизоды аниме и улучшают фпс в оригинальных.

3) Моушн графика для приложения. Как я понял, ей просто показали страницу с готовыми макетами и промптом, а все переходы и анимации она сделала сама.

Ну очуметь, конечно. А я вот как знал и специально ничему не учился в школе и универе.

❤8👍4🔥1

153 views08:36

Google обновила свою самую топовую модель Gemini 3 Deep Think.

Она почти достигла 85% выполнения в Arc-AGI-2 бенчмарке, ставшим эталонным тестом для оценки интеллекта моделей и адаптации к новым задачам. Их старая итерация, выпущенная в ноябре 2025 года достигла лишь 43%.

Разработчики бенчмарка, кстати, обещали приз тем, кто преодолеет порог в 85%, подразумевая, что это недостижимо. Получается, Google почти смогли сломать очередной тест. Теперь новый выдумывать…

Доступна только Ultra подписчикам за 250 долларов в месяц.

❤5🤯2🔥1

119 viewsedited 18:50

Пеликан на велосипеде Поскольку весь мир сейчас занят развитием генеративных нейронных сетей вроде ChatGPT, Midjourney или Veo 3.1 (смотрим цены на оперативную память), мы решили рассказать вам о том, как конкурирующие модели вообще сравниваются между собой…

Помните пеликана на велосипеде? Вот как справляется Gemini 3 Deep Think

❤6👍3🔥1

122 views17:22

Что-то ByteDance (создатели тиктока) разошлись в последнее время.

В дополнение к своим моделям Seedream 5 (картинки) и Seedance 2 (видео), которые сейчас являются лучшими в классе, они выпустили и мультимодальную модель Seed2.0.

Три версии: Pro, Lite и Mini. По бенчмаркам Seed2.0 Pro доминирует, обходя Gemini 3 Pro High и Claude Opus 4.5.

❤7🔥2🥰1

183 views18:10

This media is not supported in your browser

VIEW IN TELEGRAM

👀 получили доступ к Seedance 2...

❤6🔥4🥰2

172 views20:02

Вышла Sonnet 4.6 от Anthropic.

Модель стала чуть лучше в большинстве задач по сравнению с прошлой итерацией. Заметный скачок наблюдается в финансовом анализе.

По сути является дешевым аналогом их прошлого флагмана Opus 4.5. Доступна уже сейчас.

❤6👍3🕊2

155 views19:08

Кэти Пэрри оформила подписку на Claude и отметила это сердечком.

Все это на фоне новостей о том, что сервис от Anthropic отказался от сотрудничества с военными США. После этого Трамп пригрозил баном на использование их моделей во всех госструктурах.

При этом, по данным открытых источников, Claude все равно активно применялся американскими военными во время операции в Иране.

❤10🥱3🔥1

110 viewsedited 18:50

В 2025 году исследователи Epoch AI проанализировали цены на работу с языковыми моделями за последние 3 года. Стоимость инференса (использования модели) падает в среднем в 40 раз каждый год.

Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.

Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.

❤7🔥1🥰1

98 viewsedited 10:52

This media is not supported in your browser

VIEW IN TELEGRAM

Исследователи создали AI-фреймворк RGMP, который учит роботов делать домашние дела с успехом 87%. Система распознает объекты, планирует действия и выполняет задачи в реальном мире.

Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.

Здесь же используется подход геометрического рассуждения:

1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.

2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.

В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).

❤7🕊2

121 views13:21

This media is not supported in your browser

VIEW IN TELEGRAM

Много новых обновлений ожидаются, кстати.

Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.

OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.

DeepSeek v4 тоже на этой неделе должны показать.

❤8🔥1🥰1

117 views11:28

This media is not supported in your browser

VIEW IN TELEGRAM

Подъехала GPT-5.4.

Помимо скучных бенчмарков OpenAI добавили кое-что интересное. Во-первых, модель пишет, что собирается делать и прямо в процессе выполнения можно вмешаться и скорректировать ее. На видео показано, как пользователь уточнил район для поиска.

Во-вторых она может управлять компьютером, ориентируясь на скриншоты экрана. Раньше подобное было для их агентского режима в браузере.

❤7

114 views07:49

Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков.

Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий. Узкая специализация сделала ее дешевле и точнее конкурентов в своей нише.

По внутренним тестам Cursor, Composer 2 опередил Claude Opus 4.6 на задачах агентной разработки. На стандартном бенчмарке CursorBench набирает 61,3 балла против 58,2 у Claude Opus 4.6 и 63,9 у GPT-5.4 Thinking. При этом цена ниже на порядок. Миллион токенов на выходе обходится в 2,5 доллара по стандартному тарифу. Claude Opus 4.6 стоит 25 долларов за тот же объем.

❤6👍1

80 views08:17

Мы специально долго не постили, чтобы вы поняли, как тяжело жить в мире, не зная о том, какие модели когда выходят. Не переживайте, с этого момента посты будут выходить регулярно!

1❤8😁1

73 views08:20

Media is too big

VIEW IN TELEGRAM

Вчера NVIDIA закрыла конференцию GTC 2026 в Сан-Хосе.

Напомним, что они показали:

• Vera Rubin, следующее поколение GPU, которое даст 10-кратный прирост производительности по сравнению с Blackwell.

• Groq 3 LPU. Первый чип после покупки активов Groq за $20 млрд в декабре. Чипы в связке с Vera Rubin дают 35-кратный прирост производительности.

• Платформу NemoClaw, которая разворачивает ИИ-агента на базе OpenClaw с надстройками для усиленной защиты. Хуанг назвал OpenClaw «популярнейшим open source проектом в истории» и заявил, что у всех компании теперь должна быть стратегия по его применению.

• DLSS 5 для апскейлинга игр на основе мощного нейронного рендеринга. Модель фактически рисует все кадры, а не просто масштабирует или достраивает промежуточные. От этого все мемы о сходстве с ИИ-картинками.

• Новую-новую архитектуру Feynman, которая будет после Vera Rubin в 2028.

Вместо финального слова Хуанг прислал своего ИИ-аватара, который пел у костра вместе с роботами. Уверен, всем очень понравилось

❤5🤩1

68 views13:53

Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков. Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий.…

Ой… Composer 2 оказался всего лишь оптимизированной опенсорс моделью Kimi-K2.5. Разработчики из Cursor даже не упомянули об этом

❤5

79 views17:18