answer as
271 subscribers
177 photos
45 videos
166 links
Медиа о том как ваши любимые сервисы уходят в AI
Download Telegram
Платформа для оценки моделей запустила Video Arena.

LMArena.ai перенесла свой Discord-бот для тестирования видеомоделей на сайт: lmarena.ai/video

Пока доступно в режиме Battle, то есть слепое тестирование двух случайных моделей. Вводите промпт или картинку, получаете два анонимных видео, голосуете за лучшее. Всего загружено 15 моделей, среди которых Veo 3, Sora 2, Kling-2.6-pro.

Для генерации нужна регистрация, а полученные видео можно скачивать.

Я затестил с таким промптом (не ругайтесь я английский не знаю):

POV of city from bird, with chasing by police of bank burglars. Animation, GTA-like
16🥰2🤝2
Alibaba выложила семейство моделей Qwen 3 text-to-speech в открытый доступ.

Это модели для генерации речи. Они способны клонировать голос и генерировать конкретный по запросу (типа 30-летний богач с уверенным тоном). Есть возможность модификации эмоций при произношении.

Генерация происходит в режиме стриминга: фактически в момент печати первых символов. Поддерживает 10 языков, в том числе русский.

Доступны на GitHub и HuggingFace.
6🔥2🥰1
Руководитель проекта Google AI Studio для тестирования гугловских ИИ-моделей сообщил о постепенном снижении количества генераций для бесплатных пользователей.

Мы урезали лимиты в веб-интерфейсе AI Studio. Если хотите продолжать тестировать модели без ограничений, переходите на API ключи. Лимиты планируют снижать и дальше.
Компания работает над интеграцией AI Studio в подписку Google AI Pro/Ultra.


Фактически бесплатный доступ к Gemini 3.0 Pro в веб-интерфейсе скоро станет сильно урезанным.
7👀2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI представила Prism – бесплатный редактор с интеграцией GPT-5.2 для научных работ.

Построен на базе LaTeX (система верстки для научных текстов с большим количеством уравнений). Все работает в облаке без локальной установки. Над текстом можно работать с другими людьми, как гугл докс.

AI-ассистент полностью погружен в контекст проекта: помогает с вычиткой, проверяет логику, обновляет уравнения и ссылки. Видит всю историю изменений и предыдущие версии документа. Может даже найти статьи по теме работы.

Ну все курсовые, держитесь.
7🤓3🔥2
Media is too big
VIEW IN TELEGRAM
🤯 Google показали Project Genie для генерации интерактивных миров.

Пишете промпт, выбираете какого-угодно персонажа – и все, можно исследовать с нуля созданный мир.

Окружение строится в реальном времени по мере движения персонажа и камеры. Модель на лету генерирует продолжение локации, физику и освещение. Честно говоря, выглядит как волшебство.

Саму модель показывали еще летом 2025, но доступ был ограниченный. Сейчас аж рассщедрились на ультра подписчиков (250 долларов в месяц).
8👍2🥰1
Sonnet 5 от Anthropic возможно выпустят уже 3 февраля.

По слухам, она на 50% дешевле их тяжеловесной Opus 4.5, но превосходит по всем показателям. Также указывается, что она на одно полное поколение дальше, чем Google Gemini 3.5 (еще не выпущена).

Кроме того, в Claude Code добавят режим командной разработки: вы можете создать несколько специализированных агентов (backend, QA, researcher), которые работают параллельно. Даете задачу – они автономно разрабатывают как человеческая команда.
15👍2🤔2
В последние недели развернулся хайп вокруг опенсорс-проекта OpenClaw (бывший Clawdbot). Хайп такой плотности, что акции Cloudflare подскочили из-за нагрузки на их сервисы, а Anthropic попросили изменить название, чтобы не путали с их Claude.

Давайте взглянем на эволюцию моделей в последние годы. Сначала были «голые» модели по API, потом удобные, но изолированные чат-боты в браузере, затем агенты-кодеры и ИИ-браузеры. Все они ограничены чатом или задачей. OpenClaw – это ИИ-дирижер с полным доступом к системе. Работает 24/7 и управляется через мессенджер.

Если обычная модель только советует, то OpenClaw берет и делает. Люди уже используют его для автоматического чекина на рейсы и ежедневных сводок, а у одного пользователя бот случайно выиграл спор со страховой компанией.

Слышали, наверно. На этом фоне, появился реддит для ИИ-агентов moltbook.

Конечно, это дырявая вещь с уязвимостями. IBM и Cisco запретили сотрудникам использовать его на рабочих ПК, а создатель признает: пока это инструмент для энтузиастов.
8👍1🔥1
Anthropic обвалили рынок на $285 млрд

В январе они выпустили Claude Cowork для работы с файлами, собранный на коленке (из металлолома…). Затем выпустили плагины к нему для анализа договоров, финансовых контрактов и всего такого.

Если раньше Claude и ChatGPT были просто моделями, которые нужно было предварительно настроить и выстроить воркфлоу для значимой работы. А именно разработкой таких настроек и их последующей продажей и занимались компании.

30 января Anthropic просто выложили уже готовые опенсорс решения для тех же самых вещей. Все это привело к панике на фондовом рынке. Инвесторы испугались, что больше никто не будет платить за 10 лицензий дорогого софта, если один агент делает ту же работу. Назвали это все дело SaaSпокалипсисом
5👍5👀2
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic представила Opus 4.6.

Вопреки ожиданиям о скором релизе их более легкой Sonnet 5, они показали обновленную Opus.

Из важного – увеличенный до 1 миллиона токенов контекст. Раньше был 200к. Ну по бенчмаркам ожидаемо: всех победили везде лучше всех.

Дополнительно улучшили интеграцию Claude в Excel и добавили ее в PowerPoint.
5👍2🔥2
Вышла удивительно мощная нейронка для генерации видео - Seedance 2.

Показываю, что сам нашел:

1) Супер-реалистичный Уилл Смит, лакомящийся спагетти. Помните, какие видосы с ним были пару лет назад?

2) Сгенерированная сцена из ванпанчмэна. Там люди генерят уже минутные эпизоды аниме и улучшают фпс в оригинальных.

3) Моушн графика для приложения. Как я понял, ей просто показали страницу с готовыми макетами и промптом, а все переходы и анимации она сделала сама.

Ну очуметь, конечно. А я вот как знал и специально ничему не учился в школе и универе.
8👍4🔥1
Google обновила свою самую топовую модель Gemini 3 Deep Think.

Она почти достигла 85% выполнения в Arc-AGI-2 бенчмарке, ставшим эталонным тестом для оценки интеллекта моделей и адаптации к новым задачам. Их старая итерация, выпущенная в ноябре 2025 года достигла лишь 43%.

Разработчики бенчмарка, кстати, обещали приз тем, кто преодолеет порог в 85%, подразумевая, что это недостижимо. Получается, Google почти смогли сломать очередной тест. Теперь новый выдумывать…

Доступна только Ultra подписчикам за 250 долларов в месяц.
5🤯2🔥1
Что-то ByteDance (создатели тиктока) разошлись в последнее время.

В дополнение к своим моделям Seedream 5 (картинки) и Seedance 2 (видео), которые сейчас являются лучшими в классе, они выпустили и мультимодальную модель Seed2.0.

Три версии: Pro, Lite и Mini. По бенчмаркам Seed2.0 Pro доминирует, обходя Gemini 3 Pro High и Claude Opus 4.5.
7🔥2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
👀 получили доступ к Seedance 2...
6🔥4🥰2
Вышла Sonnet 4.6 от Anthropic.

Модель стала чуть лучше в большинстве задач по сравнению с прошлой итерацией. Заметный скачок наблюдается в финансовом анализе.

По сути является дешевым аналогом их прошлого флагмана Opus 4.5. Доступна уже сейчас.
6👍3🕊2
Кэти Пэрри оформила подписку на Claude и отметила это сердечком.

Все это на фоне новостей о том, что сервис от Anthropic отказался от сотрудничества с военными США. После этого Трамп пригрозил баном на использование их моделей во всех госструктурах.

При этом, по данным открытых источников, Claude все равно активно применялся американскими военными во время операции в Иране.
10🥱3🔥1
В 2025 году исследователи Epoch AI проанализировали цены на работу с языковыми моделями за последние 3 года. Стоимость инференса (использования модели) падает в среднем в 40 раз каждый год.

Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.

Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.
7🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали AI-фреймворк RGMP, который учит роботов делать домашние дела с успехом 87%. Система распознает объекты, планирует действия и выполняет задачи в реальном мире.

Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.

Здесь же используется подход геометрического рассуждения:

1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.

2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.

В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).
7🕊2
This media is not supported in your browser
VIEW IN TELEGRAM
Много новых обновлений ожидаются, кстати.

Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.

OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.

DeepSeek v4 тоже на этой неделе должны показать.
8🔥1🥰1