xAI представила Grok 4.3 beta, но пока только для подписчиков SuperGrok Heavy за 300 долларов в месяц. Теперь он может создавать слайды, таблицы и документы.
Параллельно были найдены следы Grok Build – собственного CLI-агента для кодинга. В нем будет два режима: Parallel, где задача выполняется несколькими агентами и Arena, в котором агенты конкурируют между собой, а пользователь выбирает наиболее предпочтительный ответ. Релиз ожидается на следующей неделе.
Параллельно были найдены следы Grok Build – собственного CLI-агента для кодинга. В нем будет два режима: Parallel, где задача выполняется несколькими агентами и Arena, в котором агенты конкурируют между собой, а пользователь выбирает наиболее предпочтительный ответ. Релиз ожидается на следующей неделе.
❤3
OpenAI распустила подразделение OpenAI for Science, отвечавшее за Sora и Prism. Вместе с ними ушли вице-президент Кевин Уэйл и глава проекта Билл Пиблз.
Компания режет все, что сейчас не приносит деньги, и концентрируется на корпоративном рынке и своем супераппе. Sora сжигала около миллиона долларов в сутки на вычисления и ее отключили еще в марте этого года.
Кстати, Уэйл возглавлял команду, которая вчера выпустила GPT-Rosalind.
Компания режет все, что сейчас не приносит деньги, и концентрируется на корпоративном рынке и своем супераппе. Sora сжигала около миллиона долларов в сутки на вычисления и ее отключили еще в марте этого года.
Кстати, Уэйл возглавлял команду, которая вчера выпустила GPT-Rosalind.
❤4
DeepSeek ищет инвесторов впервые с момента основания. Компания рассчитывает на $300 млн при оценке $10 млрд+.
Основатель Лян Вэньфэн строил компанию по принципу "свободы от коммерческого давления". Они отказывали всем венчурным фондам и крупным технологическим компаниям Китая. Единственным источником денег был хедж-фонд основателя – High-Flyer.
Теперь же ключевые инженеры уходят в Xiaomi и ByteDance, выход V4 задерживается из-за адаптации под чипы Huawei, а конкуренты ушли далеко вперед. Anthropic, например, сейчас оценивается в $800 млрд, то есть DeepSeek стоит в 80 раз меньше.
Основатель Лян Вэньфэн строил компанию по принципу "свободы от коммерческого давления". Они отказывали всем венчурным фондам и крупным технологическим компаниям Китая. Единственным источником денег был хедж-фонд основателя – High-Flyer.
Теперь же ключевые инженеры уходят в Xiaomi и ByteDance, выход V4 задерживается из-за адаптации под чипы Huawei, а конкуренты ушли далеко вперед. Anthropic, например, сейчас оценивается в $800 млрд, то есть DeepSeek стоит в 80 раз меньше.
1❤4👍1
Облачная платформа для разработки Vercel сообщила о взломе своей инфраструктуры. Хакеры продают украденные данные за 2 млн долларов.
Началось все с маленького ИИ-инструмента. Один из сотрудников подключил свой гугл аккаунт в сервис для работы с документами Context.ai, который был взломан в марте этого года. Через него хакеры получили OAuth-токен сотрудника Vercel, вошли в его рабочий аккаунт Google, а оттуда – во внутренние системы компании. Причем сначала получили доступ к открытым данным, а затем расшифровали и закрытые данные.
Началось все с маленького ИИ-инструмента. Один из сотрудников подключил свой гугл аккаунт в сервис для работы с документами Context.ai, который был взломан в марте этого года. Через него хакеры получили OAuth-токен сотрудника Vercel, вошли в его рабочий аккаунт Google, а оттуда – во внутренние системы компании. Причем сначала получили доступ к открытым данным, а затем расшифровали и закрытые данные.
❤5
Китайский аналог Netflix – iQIYI запустил базу данных актерских лиц для ИИ-контента. Больше 100 знаменитостей якобы согласились отдать свою внешность нейросетям для генерации сериалов и фильмов.
Проблема в том, что актеры позже вышли в соцсети с опровержением, что никто ни на что не соглашался. Компания назвала все это «недопониманием» и сообщила, что весь контроль над обликом сохранится у актеров. Фанатов также возмутили слова главы компании о том, что живые актеры скоро превратятся в «нематериальное культурное наследие», то есть в музейный экспонат, который нужно сохранить. На этом фоне хэштег «iQIYI сошел с ума» стал главным трендом на Weibo.
Юристы предупреждают, что как только лицо попадет в тренировочные данные оно фактически перестает принадлежать его владельцу: цифровой образ будет многократно воспроизводиться и модифицироваться для обучения и доработки моделей.
Проблема в том, что актеры позже вышли в соцсети с опровержением, что никто ни на что не соглашался. Компания назвала все это «недопониманием» и сообщила, что весь контроль над обликом сохранится у актеров. Фанатов также возмутили слова главы компании о том, что живые актеры скоро превратятся в «нематериальное культурное наследие», то есть в музейный экспонат, который нужно сохранить. На этом фоне хэштег «iQIYI сошел с ума» стал главным трендом на Weibo.
Юристы предупреждают, что как только лицо попадет в тренировочные данные оно фактически перестает принадлежать его владельцу: цифровой образ будет многократно воспроизводиться и модифицироваться для обучения и доработки моделей.
❤2👀1
Moonshot AI из Китая выпустила опенсорс модель Kimi K2.6, превосходящую GPT-5.4 и Claude Opus 4.6 в ряде бенчмарков.
В основе архитектура из триллиона параметров, в которой активны только 32 миллиарда. На SWE-Bench Pro результат 58.6 против 57.7 у GPT-5.4. Улучшен режим "роя агентов", в котором модель может создать до 400 узкоспециализированных агентов для параллельного решения одной задачи. Модифицировано оркестрирование для работы в OpenClaw системах.
Команда Moonshot сообщает, что агент на базе K2.6 автономно проработал 5 дней, управляя системами и реагируя на инциденты без участия человека. В одном из демо агент сам писал код 13 часов и улучшил производительность движка на 185%.
Веса открыты на Hugging Face. Можно попробовать бесплатно без VPN тут, но сейчас ожидаемо большая нагрузка.
В основе архитектура из триллиона параметров, в которой активны только 32 миллиарда. На SWE-Bench Pro результат 58.6 против 57.7 у GPT-5.4. Улучшен режим "роя агентов", в котором модель может создать до 400 узкоспециализированных агентов для параллельного решения одной задачи. Модифицировано оркестрирование для работы в OpenClaw системах.
Команда Moonshot сообщает, что агент на базе K2.6 автономно проработал 5 дней, управляя системами и реагируя на инциденты без участия человека. В одном из демо агент сам писал код 13 часов и улучшил производительность движка на 185%.
Веса открыты на Hugging Face. Можно попробовать бесплатно без VPN тут, но сейчас ожидаемо большая нагрузка.
❤4
Meta* сократит 8 000 сотрудников. Увольнения начнутся 20 мая. Решение объясняется тем, что компания перенаправит до $135 млрд на развитие ИИ-инфраструктуры в 2026.
Под удар попали отделы продаж, рекрутинга и, в очередной раз, Reality Labs – подразделение виртуальной реальности, на которое раньше тратили миллиарды.
* Meta Platforms Inc. признана экстремистской организацией, ее деятельность запрещена на территории России.
Под удар попали отделы продаж, рекрутинга и, в очередной раз, Reality Labs – подразделение виртуальной реальности, на которое раньше тратили миллиарды.
* Meta Platforms Inc. признана экстремистской организацией, ее деятельность запрещена на территории России.
😢4❤2
answer as
Говорят, что на Arena.ai (сервис для слепого сравнения моделей) всплыла GPT-Image-2 от OpenAI Arena показывает две модели без названий, где пользователи голосуют за лучшую, а потом узнают кто есть кто. Именно так до официального релиза просочились DeepSeek…
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла ChatGPT Images 2.0
❤4
Google выпустила два автономных агента для глубоких исследований в сети - Deep Research и Deep Research Max. Оба работают на базе Gemini 3.1 Pro и доступны через платные тарифы Gemini API в режиме публичного превью.
Обычный Deep Research быстрее и подходит для чат-интерфейсов. Max работает медленнее, но точнее. Оба умеют подключаться к частным базам данных через MCP, читать PDF и видео, и сами генерируют графики прямо внутри отчета. Для финансовой аналитики подключили FactSet, S&P Global и PitchBook.
Обычный Deep Research быстрее и подходит для чат-интерфейсов. Max работает медленнее, но точнее. Оба умеют подключаться к частным базам данных через MCP, читать PDF и видео, и сами генерируют графики прямо внутри отчета. Для финансовой аналитики подключили FactSet, S&P Global и PitchBook.
❤3
Anthropic планирует убрать Claude Code из Pro подписки.
Пользователи обратили внимание, что у части новых подписчиков тарифа за $20/мес отсутствует Claude Code в списке функций. Руководитель по развитию продукта прокомментировал ситуацию так: компания сейчас «тестирует» такую опцию на 2% аудитории.
Тенденция очень плохая и звучит как отговорка. Кому и зачем может понадобиться тестировать отсутствие заявленной функции в платной подписке?
Скорее всего, в ближайшем будущем Claude Code уберут из стандартного тарифа как минимум для всех новых пользователей.
Если использовать Claude Code на полную мощность, то в пересчете на API-токены один активный юзер может сжигать мощностей примерно на $60. Подписка стоит всего $20. Очевидно, что Anthropic больше не хочет субсидировать такие издержки из своего кармана.
Пользователи обратили внимание, что у части новых подписчиков тарифа за $20/мес отсутствует Claude Code в списке функций. Руководитель по развитию продукта прокомментировал ситуацию так: компания сейчас «тестирует» такую опцию на 2% аудитории.
Тенденция очень плохая и звучит как отговорка. Кому и зачем может понадобиться тестировать отсутствие заявленной функции в платной подписке?
Скорее всего, в ближайшем будущем Claude Code уберут из стандартного тарифа как минимум для всех новых пользователей.
Если использовать Claude Code на полную мощность, то в пересчете на API-токены один активный юзер может сжигать мощностей примерно на $60. Подписка стоит всего $20. Очевидно, что Anthropic больше не хочет субсидировать такие издержки из своего кармана.
❤3😢2
Grok лежит уже третий день подряд.
В начале недели xAI запустила новые функции, а раннее – бету 4.3. Видимо, поэтому нагрузка возросла. Пользователи видят ошибку "high demand", часть платных подписчиков SuperGrok тоже не могут зайти. Тем временем страница статуса xAI показывает, что проблем нет.
В начале недели xAI запустила новые функции, а раннее – бету 4.3. Видимо, поэтому нагрузка возросла. Пользователи видят ошибку "high demand", часть платных подписчиков SuperGrok тоже не могут зайти. Тем временем страница статуса xAI показывает, что проблем нет.
❤2
DeepSeek выпустила V4 в один день с GPT-5.5. Вышло две версии – Pro на 1.6 триллиона параметров и Flash на 284 миллиарда, обе с поддержкой контекста в миллион токенов. Веса открыты под лицензией Apache 2.0.
V4-Pro занял третье место среди открытых моделей в рейтинге кодинга Arena Code и обошел GPT-5.4 на Codeforces. При этом его стоимость 3.48 доллара за миллион токенов, что почти в 9 раз дешевле новой GPT-5.5. Модель обучена на чипах Huawei Ascend, что важно в контексте американских санкций на экспорт процессоров.
V4-Pro занял третье место среди открытых моделей в рейтинге кодинга Arena Code и обошел GPT-5.4 на Codeforces. При этом его стоимость 3.48 доллара за миллион токенов, что почти в 9 раз дешевле новой GPT-5.5. Модель обучена на чипах Huawei Ascend, что важно в контексте американских санкций на экспорт процессоров.
❤4
answer as
Вышла GPT-5.5.
GPT-5.5 стала первой полностью переобученной моделью со времен GPT-4.5. Вышло две версии, GPT-5.5 Thinking и Pro.
Семейство прибавило в основных агентских задачах и интеллектуальных тестах, а еще стало первым, кто пробил порог в 85% по абстрактным размышлениям ARC-AGI-2. Мнения пользователей сходятся в том, что она поумнела, лучше следует инструкциям, а ответы ощущаются более полными.
Но есть и проблемы. При оценке моделей, им выгоднее что-нибудь ответить наугад, чем честно сказать «не знаю». GPT-5.5 страдает от этого сильнее других. По тесту AA-Omniscience степень ее галлюцинаций составила 86% против 36% у Opus 4.7 и 50% у Gemini 3.1 Pro preview.
Дополнительно:
• стала эффективнее по расходу токенов, но подорожала в API в два раза. Самого доступа к API еще нет из-за доработки фильтров безопасности;
• GPT-5.5 помогла оптимизировать свою же инфраструктуру на 20%;
• био и кибер навыки модели отнесли к категории High, поэтому в ней включили более строгие фильтры на такие запросы (пример на фото)
Семейство прибавило в основных агентских задачах и интеллектуальных тестах, а еще стало первым, кто пробил порог в 85% по абстрактным размышлениям ARC-AGI-2. Мнения пользователей сходятся в том, что она поумнела, лучше следует инструкциям, а ответы ощущаются более полными.
Но есть и проблемы. При оценке моделей, им выгоднее что-нибудь ответить наугад, чем честно сказать «не знаю». GPT-5.5 страдает от этого сильнее других. По тесту AA-Omniscience степень ее галлюцинаций составила 86% против 36% у Opus 4.7 и 50% у Gemini 3.1 Pro preview.
Дополнительно:
• стала эффективнее по расходу токенов, но подорожала в API в два раза. Самого доступа к API еще нет из-за доработки фильтров безопасности;
• GPT-5.5 помогла оптимизировать свою же инфраструктуру на 20%;
• био и кибер навыки модели отнесли к категории High, поэтому в ней включили более строгие фильтры на такие запросы (пример на фото)
❤3👏2
Китайская модель нашла себя в ИИ-сериале. Ее цифровой двойник бьет женщин и обижает животных в микродраме "Цветок персика", которую крутили на Hongguo – платформе ByteDance (создатели Seedance и Seedream).
Модель Кристин Ли заметила, что создатели взяли конкретный набор ее фото двухлетней давности из соцсетей. Еще один пострадавший – стилист традиционных костюмов, которого сделали неприятным антагонистом. После обвинений руководство провело проверку: продюсеры не смогли предоставить разрешение на использование и шоу просто удалили.
Модель Кристин Ли заметила, что создатели взяли конкретный набор ее фото двухлетней давности из соцсетей. Еще один пострадавший – стилист традиционных костюмов, которого сделали неприятным антагонистом. После обвинений руководство провело проверку: продюсеры не смогли предоставить разрешение на использование и шоу просто удалили.
❤4
Google вложила $40 млрд в Anthropic. $10 млрд уже переведено, остальное – если компания выполнит показатели. Сверху Google даст еще 5 гигаватт облачных вычислительных мощностей на пять лет. Оценка Anthropic теперь $350 млрд, при годовой выручке в $30 млрд.
Amazon несколько дней назад тоже объявил инвестицию в размере $25 млрд в них же.
Amazon несколько дней назад тоже объявил инвестицию в размере $25 млрд в них же.
❤2
Anthropic запустила внутренний рынок, где ИИ-агенты торговались вместо людей.
69 сотрудников попросили подготовить список своих личных вещей, которые они хотели бы продать и список вещей, которые они хотели бы купить. Затем на их аккаунты выдали по $100 и подключили агенты Claude, которые неделю вели самостоятельные переговоры на основе списков владельцев. Итог: 186 сделок на $4000+. Один агент купил 19 мячиков для пинг-понга, потому что сотрудница разрешила купить что нибудь "в подарок себе (Claude)".
В рамках маркета Anthropic тихо прогнала 4 параллельных теста. В одном из них, части аккаунтов подключили топовую на тот момент Opus 4.5, другим – самую дешевую Haiku 4.5. Opus выторговывал в среднем на $2.68 больше за каждый товар. Интересно, что люди с более слабым агентом считали сделки честными и не заподозрили никакого подвоха.
69 сотрудников попросили подготовить список своих личных вещей, которые они хотели бы продать и список вещей, которые они хотели бы купить. Затем на их аккаунты выдали по $100 и подключили агенты Claude, которые неделю вели самостоятельные переговоры на основе списков владельцев. Итог: 186 сделок на $4000+. Один агент купил 19 мячиков для пинг-понга, потому что сотрудница разрешила купить что нибудь "в подарок себе (Claude)".
В рамках маркета Anthropic тихо прогнала 4 параллельных теста. В одном из них, части аккаунтов подключили топовую на тот момент Opus 4.5, другим – самую дешевую Haiku 4.5. Opus выторговывал в среднем на $2.68 больше за каждый товар. Интересно, что люди с более слабым агентом считали сделки честными и не заподозрили никакого подвоха.
❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Google запустила экспериментальный режим поиска "Ask YouTube". Вместо списка видео по ключевым словам пользователь получает текстовый ответ с подборкой релевантных клипов и возможностью уточнять в рамках одного диалога.
Функция работает через кнопку в строке поиска. Система собирает ответ из содержимого видео, Shorts и текстовых описаний. Google предупреждает, что качество и точность могут варьироваться, и просит ставить оценки. Пока доступно только премиум-подписчикам в США, зарегистрированным в специальной программе для теста функций.
Функция работает через кнопку в строке поиска. Система собирает ответ из содержимого видео, Shorts и текстовых описаний. Google предупреждает, что качество и точность могут варьироваться, и просит ставить оценки. Пока доступно только премиум-подписчикам в США, зарегистрированным в специальной программе для теста функций.
👍6