сбежавшая нейросеть

Встречаем Google Veo 3.1!

~~Официального анонса пока не было~~, Официальный анонс опубликован, а у меня и у многих пользователей модель несколько часов как доступна в редакторе Google Flow — дальше ждем раскатку на всех основных площадках (там еще Gemini App, Vertex AI и API). Кстати, во Flow бесплатно дают 100 кредитов — если проберетесь через гео-блок (у Google это не так просто), то можно попробовать несколько видео. На подписке Pro дают 1000 кредитов на месяц во Flow — плюс будут отдельные генерации в Gemini App (там сейчас по 3 в сутки) и Vertex AI.

Доступно 2 модели: Quality (100 кредитов) и Fast (20 кредитов), можно выбирать вертикальное или горизонтальное соотношение сторон, а также загружать опорные кадры для видео. Попробовал загрузить аватарку группы — результат так себе. Но я не мастер промптить модели для генерации видео, так что больно не бейте.

Похоже, модель стала лучше работать с русским языком — смотрим ролик со сплетничающими старушками. А вот с русскими шрифтами все еще беда — кому Бельмени за 350 рублей?

Также пока не оправдались слухи, что Veo-3.1 будет создавать ролики до 30 секунд продолжительностью. Возможно, позже добавят на других платформах, но во Flow только стандартные 8 секунд.

Генерация в обоих режимах идет быстро, но пока не стабильно — у меня каждый второй ролик обрывался на 99% (кредиты, впрочем, вернулись). Если будете сталкиваться, то подождите 1-2 дня, обычно за это время проблемы с серверами исправляют.

Ролики с ретривером и девушкой — не мои. Просто взял для полноты два первых красивых примера из X.

Будем ждать подробностей, но вообще переход с версии 3 на версию 3.1— не самое большое событие. Вместо революций Google просто укрепляет лидерские позиции в связи с выходом Sora 2. Новинку от OpenAI как раз протестировали на LMArena, где она выступила достойно, но без прорывов: Pro-версия Sora 2 делит первое место с “большой” Veo 3, а обычная соревнуется с Veo 3 Fast. Так что если Veo 3.1 даже чуть-чуть подтянется в бенчмарках — этого будет достаточно для возвращения лидерства.

2👍32🔥13❤12😁1

7K views14:20

сбежавшая нейросеть

ИИ пишет уже 50% контента в интернете. Но читают все равно человеческий!

Агентство Graphite выпустило исследование количества и качества ИИ-контента в интернете, пугающее на первый взгляд, но полезное в реальности.

Что делали? Взяли выборку из 66 тысяч англоязычных статей за 2020 – 2025 годы, прогнали ее через детектор ИИ-текстов Surfer, а затем оценили, как тексты ведут себя в выдаче Google и поиске чат-ботов (ChatGPT и Perplexity).

Исследование показало, что начиная с 30 ноября 2022 года (дата запуска ChatGPT) количество ИИ-контента начало быстро расти. В декабре 2023 его доля составила уже 44%, а еще через год даже превысила 50% – ИИ начал писать больше текстов, чем люди.

Однако в 2025 году показатели вышли на плато и до мая (окончание исследования) держались в пропорции 50/50 с небольшим преимуществом ИИ. Так что наступление эры мертвого интернета откладывается на неопределенный срок, выдыхаем!

Еще интереснее выглядит вторая часть исследования, где авторы изучили как часто тексты двух категорий появляются в выдаче поисковых систем. В случае классического Google 86% текстов в выдаче были написаны человеком. ChatGPT и Perplexity также не жалуют ИИ-коллег: по 82% текстов, на которые они ссылаются в ответах – “живые”. Плюс в случае с Google количество ИИ-текстов сокращается на высоких позициях – до топ-1 добираются лишь 7%.

Казалось бы, можно начинать праздновать победу человечества над ИИ, но на самом деле это – скорее победа одной части человечества над другой. По работе я постоянно сталкиваюсь с партнерскими текстами, которые были написаны ИИ, и распознаю их даже не по похожему стилю и использованию длинных тире (кстати, это типографское правило), а по другому – полному отсутствию идей, попыток аналитики и личного опыта.

Авторы просто промптят что-нибудь в духе “ты – лауреат Нобелевской премии по копирайтингу, напиши статью про 5 новых тенденций в маркетинге, до 10 тыс. знаков, быстро!”. И все – уже через минуту произведение готово отправиться на задворки корпоративного блога или популярной UGC-площадки.

Это подтверждает статистика Graphite: хуже всего из ИИ-текстов в поиске заходили новости, туризм и кулинария. С новостями все ясно: на коне здесь те, кто публикует информацию первыми, для чего надо обладать эксклюзивными источниками. Это вообще не про ИИ, он у нас один на всех.

Такие, казалось бы, простые темы, как туризм и кулинария основаны на эмоциях и личном опыте. Это опять не про ИИ: он может составить идеальный рецепт, но никогда не попробует приготовленное по нему блюдо, он может перечислить огромное количество фактов о любой стране – но не побывать в ней.

В каких категориях ИИ-тексты работают лучше всего? Технологии и крипто – здесь все понятно, очень продвинутые пользователи, которым ИИ-тема ближе всего. Саморазвитие и образование уже интереснее, но моя гипотеза – в этих категориях любят хорошо структурированные и понятные обучающие материалы, а их ИИ при правильном промптинге как раз пишет хорошо.

Ну и интересное напоследок. В отчете Graphite упоминается еще один тип текстов – которые написаны в коллаборации ИИ и человека: грубо говоря, нейронка готовит черновик, а затем пользователь наполняет его собственным опытом, эмоциям и гипотезами. Авторы признают, что количество таких текстов оценить нереально – и вряд ли когда-нибудь появится детектор, способный это сделать. Но в Graphite считают, что именно за подобным сотрудничеством – будущее.

Тут мне не остается ничего кроме как согласиться. Я уже рассказывал, как сам использую ИИ в работе над текстам, но вообще личного опыта – еще на пару постов. Я почти не пишу тексты с помощью ИИ (хотя не вижу проблемы, когда кто-то так делает) – но работа над материалом обычно сопровождается диалогом из десятков запросов. ИИ помогает найти информацию, понять сложные моменты, дает справку, делает прогнозы, критикует мои идеи – и иногда даже предлагает собственные.

Уверен, если писать таким образом – то шансы оказаться в топе Google всегда будут высоки.

1👍58🔥16❤13

7.54K views15:22

сбежавшая нейросеть

Как GPT-5 Pro начала “кусать” научные задачи

ИИ в науке начали использовать раньше привычных нам чат-ботов, генераторов картинок и видео. В 2020 году AlphaFold закрыла одну из главных проблем биологии – задачу предсказания трехмерной структуры белка по аминокислотной последовательности. Результаты доступны любому желающему, с их помощью разработка многих лекарств ускорилась на месяцы и даже годы, а Демис Хассабис и Джон Джампер из Google DeepMind получили Нобелевку.

Подобных специализированных систем существуют десятки, но сейчас происходит другой интересный процесс – с наукой начала справляться и GPT-5 Pro. Это самая мощная на сегодня общедоступная модель (пусть и за 200 долларов в месяц), и для обычного пользователя ее научные способности значат, что и в широких задачах GPT-5 Pro сделала шаг вперед.

Начнем с теста Гёделя, который Моран Фельдман и Амин Карбаси придумали специально для ИИ. В математике постоянно возникает большое количество новых задач уровня бакалавра/аспиранта. Их решение не тянет на открытие, но это крохотные шаги, которые также двигают науку вперед. А главное – задач еще нет в учебных корпусах ИИ.

Фельдман и Карбаси взяли пять таких примеров и передали их GPT-5 Pro, параллельно накидав свои решения. Результат – модель успешно справилась с тремя задачами из пяти, причем в одном случае она предложила вариант решения, о котором авторы даже не задумались.

Это не единственный пример. Алекс Лупсаска, теоретик физики и математики, летом написал статью о новых симметриях в теории возмущений черных дыр, для которой занимался вычислениями несколько дней. Из любопытства он дал ту же задачу GPT-5 Pro – и получил ответ через 30 минут. Да, все это не открытия, но демонстрация, что ИИ подбираются к серьезной научной работе.

Впрочем, реальное открытие у меня для вас тоже есть. Математик Паата Иванишвили с помощью GPT-5 Pro нашел пример, который опровергает гипотезу 2007 года из списка открытых задач Института Саймонса (№ 25). Задача про ситуацию, когда часть поступающих данных пропадает: долго считалось, что лучший способ принять решение — использовать правило большинства. Оказалось, что это не так.

Если попробовать объяснить просто, то представьте научный зонд с несколькими датчиками “плюс/минус”, где часть ответов иногда пропадает. Долго считали, что лучшее универсальное правило – смотреть на большинство пришедших сигналов. Иванишвили с помощью GPT-5 Pro нашел аккуратный пример, где чуть точнее работает взвешенное правило: одни ответы учитываются сильнее, другие слабее, и в среднем это дает небольшой, но достаточный выигрыш. Похожая логика встречается в каналах связи, сенсорных сетях, опросах – так что если решение пройдет рецензирование, то от него будет практическая польза.

И еще один пример – на этот раз, забавный. Существует каталог задач Эрдеша – набор сложных математических вопросов со статусом “решен или нет”. Недавно задачу №339, считавшуюся нерешенной, “скормили” GPT-5 Pro – та подумала, пробормотала нечто вроде “учитесь гуглить, бестолочи!” и… выдала решение, написанное еще в 2003 году, но затерявшееся среди других работ. Исследователи начали прогонять остальные задачи – и на данный момент нашли решения для шести штук, а еще к 12 добавили важные документы по теме.

Легенда математики Теренс Тао считает, что в ближайшее время именно здесь будет основная польза от ИИ – много важных знаний и открытий теряется из-за несовершенства баз данных и каталогов, работать с которыми крайне сложно. А вот нейросети тренировались именно на систематизации гигантских корпусов знаний.

Отмечу, что одной наукой здесь не ограничится. Каждый, кто работал в крупной компании, знает, насколько сложно поддерживать внутренюю базу знаний в актуальном виде. Похожими проблемами страдают архивы, картотеки и многое другое. И это как раз то, о чем говорил в начале: способности новых ИИ в науке – оборачиваются пользой и в реальности.

🔥65👍30❤27👏6

8.19K views16:14

сбежавшая нейросеть

"У нас есть AGI дома"

С интересом наблюдаю за дискуссией вокруг AGI – общего искусственного интеллекта. После выхода GPT-5 глава OpenAI Сэм Альтман неожиданно назвал AGI не очень полезным термином. Писал об этом здесь; мысль в чем-то здравая: под термином AGI часто понимают ИИ, который сможет выполнять любую интеллектуальную работу на уровне человека – а если мы создадим модель, которая будет невероятно хороша в 80% случаев? Разве это не будет прорывом?

С того момента Альтман изменил мнение:на публичной дискуссии издательства Axel Springer он предсказал появление “сверхинтеллекта” к 2030 году. А Грег Брокман, директор OpenAI, предсказывает AGI к 2028 году.

Удивительным образом, 2030-й – это год, когда в бизнес-планах OpenAI более-менее начинает сходиться дебет с кредитом. До этого момента предстоит жить на гигантских заемных средствах, а привлекать их куда проще, обещая инвесторам крутую штуку вроде “сверхинтеллекта”... но ладно, давайте считать, что просто так совпало.

Глава Google DeepMind Демис Хассабис уже более осторожен: он оценивает в 50% шанс на AGI к 2030-му, допуская задержку до 2035 года. Google “торопиться” некуда: компания строит ИИ на свои деньги и обладает лучшей инфраструктурой для его интеграции – поиск, Chrome, офисные приложения и крупнейшая в мире рекламная сеть.

Но самое интересное мнение на днях высказал Андрей Карпати, один из лучших ИИ-исследователей современности. В интервью Дваркешу Пателю он озвучил “AGI через 10 лет” как самый оптимистичный прогноз. До этого же нас ждет десятилетие возни с ИИ-агентами, которые далеки от реальных работников.

Андрей привел в пример “марш девяток”, с которым он столкнулся во время руководства ИИ-направлением Tesla. Вы можете сделать прототип, надежный на 90% – и он окажется эффектной демонстрацией технологии. Но в рабочем продукте придется достигать эффективности даже не в 99%, а в 99,99% – при этом каждая “девятка” на пути будет даваться с большим трудом.

Карпати считает, что похожей будет и дорога к AGI. Современные модели являются красивой демонстрацией технологии, но ни одна крупная компания не решится “нанять” ИИ-агента так же, как нанимает хотя бы стажера. И этому есть несколько причин.

У современных ИИ-агентов до сих пор провалы в здравом смысле: отлично выполняя одни задачи, они валятся на элементарной логике в других. Хромает и мультимодальность: распознавание изображений, видео и речи. Но главное – у современных ИИ нет ни непрерывного обучения новым навыкам, ни полноценной памяти (“вчера со мной случилось это и это”).

В отличие от человеческого мозга, ИИ не “думают” постоянно – они долго и дорого обучаются на подготовленном корпусе данных, а затем совершают действия и дают ответы на основе полученных знаний. Конечно, новые модели умеют “подглядывать” в интернет, но это немного не то – если закрыть чат, то они “забывают” эту информацию.

Создание непрерывного обучения будет одним из крупнейших прорывов в ИИ-технологиях. Есть несколько идей, но пока не работает ни одна: они приводят к “катастрофическому забыванию”, когда, получая новые знания, модель забывает часть старых.

Но интересно здесь другое – не исключено, что первыми “прото-AGI” опробуют массовые пользователи. Крупнейшие разработчики ИИ уже выпустили индивидуальную память, когда модель извлекает из чатов знания о пользователе и адаптирует свои ответы.

Эти знания не “интегрируются” в сам ИИ, а хранятся в виде обычного текстового файла. Но для пользовательских задач этого достаточно: например, я активно экспериментирую с памятью ChatGPT (рассказывал здесь) – ИИ помнит все важное обо мне, знает, какой стиль ответов я предпочитаю, умеет решать многие шаблонные задачи вроде поиска информации под тексты и даже “знаком” с моей семьей.

Не скажу, что работает идеально, но тот же Альтман проговорился, что при создании GPT-6 улучшению памяти уделят особое внимание. И есть шанс, что в очередной раз передовые ИИ-технологии сначала доберутся до массового пользователя.

2👍59❤30🔥14👏1

7.04K views17:35

сбежавшая нейросеть

Не время для Атласа

Пока я болел (а за компанию болел и ТГ-канал, не радуя вас новыми постами😢), OpenAI выпустили новый продукт – ИИ-браузер ChatGPT Atlas. Сегодня наконец-то установил и попробовал, вердикт – как и Perplexity Comet, пока это забавная игрушка, но не более.

Но направление ИИ-браузеров интересное, поэтому одним описанием новинки не ограничусь – во второй половине поста расскажу, куда мы со всем этим можем приехать.

Основных функций в Atlas три:

1. Диалог с ИИ на любой страничке – сделать саммари, найти нужную информацию, задать вопросы по содержимому и т. д. В диалоге поддерживается только самая простая GPT-5 Instant, но обещали добавить выбор моделей.

В некоторых случаях удобно, но будем честными – это уровень расширения для Chrome, а не отдельного браузера. Для себя же я не вижу проблем взять ссылку на страницу, закинуть ее в ChatGPT и обсудить там.

2. ИИ-поиск по истории. Удобно, но даже не уровень расширения для Chrome, едем дальше.

3. Агент на базе представленного летом ChatGPT Agent – он “ходит” по веб-сайтам как живой человек, рассматривает картинки и интерфейс, кликает ссылки, заполняет формы и даже совершает покупки.

Именно агент является ключевой фичей браузера, но тут мы упираемся в суровую реальность: большой и свободный интернет пока не по зубам для нынешних ИИ. В нем миллионы сайтов с разным подходом к навигации, разной организацией регистрации и покупки. А еще, конечно, капча — помню, как в одном из диалогов со мной Grok 3 выругался и обозвал ее чем-то вроде human-oppression machine (машиной, которую люди придумали для пыток ИИ).

Не удивлен отзывам, которые вижу: “дал четыре задания, браузер справился лишь с одним”, “не выполнил ни одного из пяти заданий, удаляю!”. А в тех случаях, когда агент все-таки справляется, это занимает столько времени, что можно три раза прокликать руками.

Плюс вопросы безопасности. Даже в OpenAI признают, что агенты подвержены такой технике, как promt injection, когда вглубь объемного текста подмешивают инструкцию для ИИ, прочитав которую он, например, сливает ваши данные.

Atlas обучен противостоять самым очевидным приемам, но сегодня в X видел интересный пример: пользователь переписал код сайта таким образом, что каждый раз, когда агент кликает по кнопке, в буфер обмена копируется вредоносная ссылка. В Atlas можно запустить агента, а самому работать в соседнем окне, поэтому расчет подобной атаки на то, что кто-то из пользователей не обратит внимание, какая ссылка в буфере обмена, и перейдет на вредоносный сайт. Будьте осторожны!

Интересной стратегией для разработчиков сайтов выглядит начать оптимизировать их под агентов. Но подобные оптимизации будут окупаться только в том случае, если агентов начнут использовать массово. А ими не пользуются из-за низкой эффективности – и получается порочный круг.

В одном из прошлых постов я делился мнением, что со временем ИИ заменит нам операционные системы – станет “прокладкой” между железом и пользователем, предоставляя последнему максимально персональный опыт. Но маршрут, которым мы к этому придем, пока видится открытым.

У OpenAI мне больше нравится представленная недавно функция интеграции приложений прямо в ChatGPT – их пока немного, но работают качественно. Того же самого агента после доработки также надо встраивать в основной функционал ChatGPT – мне во время работы с GPT-5 часто не хватает функции, чтобы модель сама открыла браузер и изучила что-то в сети. Это не полноценная агентская работа, но тем и хорошо – на коротких задачах меньше ошибок, а значит, появляется шанс приучить пользователей к функции и собрать информацию для улучшения агента.

На ИИ-браузерах также не стоит ставить крест, но это направление скорее для старых игроков рынка. Например, Microsoft активно добавляет функции Copilot в Edge, а Google интегрирует Gemini в поиск и Chrome – намного больше шансов, что пользователи привыкнут к ИИ-функциям в этих продуктах, а не поставят себе новый браузер.

сбежавшая нейросеть

Взгляд в будущее с Claude Sonnet 4.5

На фоне хайпа с Sora 2 потерялся любопытный релиз Claude Sonnet 4.5,. Не буду повторять новостные тексты, а вместо этого выделю три важных момента.

Во-первых, скорость. Буквально 5 августа Anthropic выпустили Claude…

5🔥23❤13👍13😁2

7.09K views18:52

сбежавшая нейросеть