This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic представила Opus 4.6.
Вопреки ожиданиям о скором релизе их более легкой Sonnet 5, они показали обновленную Opus.
Из важного – увеличенный до 1 миллиона токенов контекст. Раньше был 200к. Ну по бенчмаркам ожидаемо: всех победили везде лучше всех.
Дополнительно улучшили интеграцию Claude в Excel и добавили ее в PowerPoint.
Вопреки ожиданиям о скором релизе их более легкой Sonnet 5, они показали обновленную Opus.
Из важного – увеличенный до 1 миллиона токенов контекст. Раньше был 200к. Ну по бенчмаркам ожидаемо: всех победили везде лучше всех.
Дополнительно улучшили интеграцию Claude в Excel и добавили ее в PowerPoint.
❤5👍2🔥2
Вышла удивительно мощная нейронка для генерации видео - Seedance 2.
Показываю, что сам нашел:
1) Супер-реалистичный Уилл Смит, лакомящийся спагетти. Помните, какие видосы с ним были пару лет назад?
2) Сгенерированная сцена из ванпанчмэна. Там люди генерят уже минутные эпизоды аниме и улучшают фпс в оригинальных.
3) Моушн графика для приложения. Как я понял, ей просто показали страницу с готовыми макетами и промптом, а все переходы и анимации она сделала сама.
Ну очуметь, конечно. А я вот как знал и специально ничему не учился в школе и универе.
Показываю, что сам нашел:
1) Супер-реалистичный Уилл Смит, лакомящийся спагетти. Помните, какие видосы с ним были пару лет назад?
2) Сгенерированная сцена из ванпанчмэна. Там люди генерят уже минутные эпизоды аниме и улучшают фпс в оригинальных.
3) Моушн графика для приложения. Как я понял, ей просто показали страницу с готовыми макетами и промптом, а все переходы и анимации она сделала сама.
Ну очуметь, конечно. А я вот как знал и специально ничему не учился в школе и универе.
❤8👍4🔥1
Google обновила свою самую топовую модель Gemini 3 Deep Think.
Она почти достигла 85% выполнения в Arc-AGI-2 бенчмарке, ставшим эталонным тестом для оценки интеллекта моделей и адаптации к новым задачам. Их старая итерация, выпущенная в ноябре 2025 года достигла лишь 43%.
Разработчики бенчмарка, кстати, обещали приз тем, кто преодолеет порог в 85%, подразумевая, что это недостижимо. Получается, Google почти смогли сломать очередной тест. Теперь новый выдумывать…
Доступна только Ultra подписчикам за 250 долларов в месяц.
Она почти достигла 85% выполнения в Arc-AGI-2 бенчмарке, ставшим эталонным тестом для оценки интеллекта моделей и адаптации к новым задачам. Их старая итерация, выпущенная в ноябре 2025 года достигла лишь 43%.
Разработчики бенчмарка, кстати, обещали приз тем, кто преодолеет порог в 85%, подразумевая, что это недостижимо. Получается, Google почти смогли сломать очередной тест. Теперь новый выдумывать…
Доступна только Ultra подписчикам за 250 долларов в месяц.
❤5🤯2🔥1
answer as
Пеликан на велосипеде Поскольку весь мир сейчас занят развитием генеративных нейронных сетей вроде ChatGPT, Midjourney или Veo 3.1 (смотрим цены на оперативную память), мы решили рассказать вам о том, как конкурирующие модели вообще сравниваются между собой…
Помните пеликана на велосипеде? Вот как справляется Gemini 3 Deep Think
❤6👍3🔥1
Что-то ByteDance (создатели тиктока) разошлись в последнее время.
В дополнение к своим моделям Seedream 5 (картинки) и Seedance 2 (видео), которые сейчас являются лучшими в классе, они выпустили и мультимодальную модель Seed2.0.
Три версии: Pro, Lite и Mini. По бенчмаркам Seed2.0 Pro доминирует, обходя Gemini 3 Pro High и Claude Opus 4.5.
В дополнение к своим моделям Seedream 5 (картинки) и Seedance 2 (видео), которые сейчас являются лучшими в классе, они выпустили и мультимодальную модель Seed2.0.
Три версии: Pro, Lite и Mini. По бенчмаркам Seed2.0 Pro доминирует, обходя Gemini 3 Pro High и Claude Opus 4.5.
❤7🔥2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
👀 получили доступ к Seedance 2...
❤6🔥4🥰2
Кэти Пэрри оформила подписку на Claude и отметила это сердечком.
Все это на фоне новостей о том, что сервис от Anthropic отказался от сотрудничества с военными США. После этого Трамп пригрозил баном на использование их моделей во всех госструктурах.
При этом, по данным открытых источников, Claude все равно активно применялся американскими военными во время операции в Иране.
Все это на фоне новостей о том, что сервис от Anthropic отказался от сотрудничества с военными США. После этого Трамп пригрозил баном на использование их моделей во всех госструктурах.
При этом, по данным открытых источников, Claude все равно активно применялся американскими военными во время операции в Иране.
❤10🥱3🔥1
В 2025 году исследователи Epoch AI проанализировали цены на работу с языковыми моделями за последние 3 года. Стоимость инференса (использования модели) падает в среднем в 40 раз каждый год.
Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.
Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.
Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.
Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.
❤7🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали AI-фреймворк RGMP, который учит роботов делать домашние дела с успехом 87%. Система распознает объекты, планирует действия и выполняет задачи в реальном мире.
Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.
Здесь же используется подход геометрического рассуждения:
1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.
2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.
В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).
Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.
Здесь же используется подход геометрического рассуждения:
1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.
2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.
В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).
❤7🕊2
This media is not supported in your browser
VIEW IN TELEGRAM
Много новых обновлений ожидаются, кстати.
Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.
OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.
DeepSeek v4 тоже на этой неделе должны показать.
Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.
OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.
DeepSeek v4 тоже на этой неделе должны показать.
❤8🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехала GPT-5.4.
Помимо скучных бенчмарков OpenAI добавили кое-что интересное. Во-первых, модель пишет, что собирается делать и прямо в процессе выполнения можно вмешаться и скорректировать ее. На видео показано, как пользователь уточнил район для поиска.
Во-вторых она может управлять компьютером, ориентируясь на скриншоты экрана. Раньше подобное было для их агентского режима в браузере.
Помимо скучных бенчмарков OpenAI добавили кое-что интересное. Во-первых, модель пишет, что собирается делать и прямо в процессе выполнения можно вмешаться и скорректировать ее. На видео показано, как пользователь уточнил район для поиска.
Во-вторых она может управлять компьютером, ориентируясь на скриншоты экрана. Раньше подобное было для их агентского режима в браузере.
❤7
Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков.
Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий. Узкая специализация сделала ее дешевле и точнее конкурентов в своей нише.
По внутренним тестам Cursor, Composer 2 опередил Claude Opus 4.6 на задачах агентной разработки. На стандартном бенчмарке CursorBench набирает 61,3 балла против 58,2 у Claude Opus 4.6 и 63,9 у GPT-5.4 Thinking. При этом цена ниже на порядок. Миллион токенов на выходе обходится в 2,5 доллара по стандартному тарифу. Claude Opus 4.6 стоит 25 долларов за тот же объем.
Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий. Узкая специализация сделала ее дешевле и точнее конкурентов в своей нише.
По внутренним тестам Cursor, Composer 2 опередил Claude Opus 4.6 на задачах агентной разработки. На стандартном бенчмарке CursorBench набирает 61,3 балла против 58,2 у Claude Opus 4.6 и 63,9 у GPT-5.4 Thinking. При этом цена ниже на порядок. Миллион токенов на выходе обходится в 2,5 доллара по стандартному тарифу. Claude Opus 4.6 стоит 25 долларов за тот же объем.
❤6👍1
Мы специально долго не постили, чтобы вы поняли, как тяжело жить в мире, не зная о том, какие модели когда выходят. Не переживайте, с этого момента посты будут выходить регулярно!
1❤8😁1
Media is too big
VIEW IN TELEGRAM
Вчера NVIDIA закрыла конференцию GTC 2026 в Сан-Хосе.
Напомним, что они показали:
• Vera Rubin, следующее поколение GPU, которое даст 10-кратный прирост производительности по сравнению с Blackwell.
• Groq 3 LPU. Первый чип после покупки активов Groq за $20 млрд в декабре. Чипы в связке с Vera Rubin дают 35-кратный прирост производительности.
• Платформу NemoClaw, которая разворачивает ИИ-агента на базе OpenClaw с надстройками для усиленной защиты. Хуанг назвал OpenClaw «популярнейшим open source проектом в истории» и заявил, что у всех компании теперь должна быть стратегия по его применению.
• DLSS 5 для апскейлинга игр на основе мощного нейронного рендеринга. Модель фактически рисует все кадры, а не просто масштабирует или достраивает промежуточные. От этого все мемы о сходстве с ИИ-картинками.
• Новую-новую архитектуру Feynman, которая будет после Vera Rubin в 2028.
Вместо финального слова Хуанг прислал своего ИИ-аватара, который пел у костра вместе с роботами. Уверен, всем очень понравилось
Напомним, что они показали:
• Vera Rubin, следующее поколение GPU, которое даст 10-кратный прирост производительности по сравнению с Blackwell.
• Groq 3 LPU. Первый чип после покупки активов Groq за $20 млрд в декабре. Чипы в связке с Vera Rubin дают 35-кратный прирост производительности.
• Платформу NemoClaw, которая разворачивает ИИ-агента на базе OpenClaw с надстройками для усиленной защиты. Хуанг назвал OpenClaw «популярнейшим open source проектом в истории» и заявил, что у всех компании теперь должна быть стратегия по его применению.
• DLSS 5 для апскейлинга игр на основе мощного нейронного рендеринга. Модель фактически рисует все кадры, а не просто масштабирует или достраивает промежуточные. От этого все мемы о сходстве с ИИ-картинками.
• Новую-новую архитектуру Feynman, которая будет после Vera Rubin в 2028.
Вместо финального слова Хуанг прислал своего ИИ-аватара, который пел у костра вместе с роботами. Уверен, всем очень понравилось
❤5🤩1
answer as
Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков. Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий.…
Ой… Composer 2 оказался всего лишь оптимизированной опенсорс моделью Kimi-K2.5. Разработчики из Cursor даже не упомянули об этом
❤5
OpenAI делает одно большое приложение вместо нескольких мелких.
У OpenAI накопилось слишком много отдельных продуктов, часть из которых так и не нашла свою аудиторию. Поэтому решили делать суперапп, который объединит ChatGPT, браузер Atlas и платформу для кодинга Codex. Все в одном окне, без переключений между приложениями.
На недавней встрече гендиректор по приложениям Фиджи Симо прямо сказала сотрудникам: никаких "побочных квестов". Фокус на агентских возможностях, на задачах, которые ИИ будет выполнять автономно на компьютере.
Мобильный ChatGPT при этом трогать не планируют.
У OpenAI накопилось слишком много отдельных продуктов, часть из которых так и не нашла свою аудиторию. Поэтому решили делать суперапп, который объединит ChatGPT, браузер Atlas и платформу для кодинга Codex. Все в одном окне, без переключений между приложениями.
На недавней встрече гендиректор по приложениям Фиджи Симо прямо сказала сотрудникам: никаких "побочных квестов". Фокус на агентских возможностях, на задачах, которые ИИ будет выполнять автономно на компьютере.
Мобильный ChatGPT при этом трогать не планируют.
❤5
Сидней, 2024. Пол Конингем, технический предприниматель, узнал, что у его собаки Рози рак. Операция и химиотерапия не помогли. Он решил спросить ChatGPT.
ChatGPT предложил иммунотерапию и направил к Центру геномики при Сиднейском университете UNSW. Конингем убедил ученых взяться за проект, оплатил геномное секвенирование опухоли Рози и начал с помощью ИИ-инструментов анализировать ДНК. AlphaFold от DeepMind помог найти мутировавшие белки как мишени для лечения. В итоге нанохимик Пол Тордарсон создал персональную мРНК-вакцину специально под конкретную собаку - первую в истории - за два месяца.
К середине марта опухоль на лапе Рози уменьшилась примерно на 75%.
Человек без медицинского образования с помощью ИИ нашел дорогу к технологии, которую теперь планируют применить на людях. "Это демократизирует весь процесс", сказал ученый UNSW.
ChatGPT предложил иммунотерапию и направил к Центру геномики при Сиднейском университете UNSW. Конингем убедил ученых взяться за проект, оплатил геномное секвенирование опухоли Рози и начал с помощью ИИ-инструментов анализировать ДНК. AlphaFold от DeepMind помог найти мутировавшие белки как мишени для лечения. В итоге нанохимик Пол Тордарсон создал персональную мРНК-вакцину специально под конкретную собаку - первую в истории - за два месяца.
К середине марта опухоль на лапе Рози уменьшилась примерно на 75%.
Человек без медицинского образования с помощью ИИ нашел дорогу к технологии, которую теперь планируют применить на людях. "Это демократизирует весь процесс", сказал ученый UNSW.
❤🔥5❤3
OpenAI собирается нанять почти вдвое больше людей к концу года – с 4 500 до 8 000 сотрудников.
Большинство новых позиций в отделах разработки продуктов, инженерии, исследованиях и продажах. Отдельно упоминается новая специализация "технических амбассадоров", которые будут помогать бизнесу правильно использовать многочисленные инструменты OpenAI.
Примечательно, что несколько месяцев назад Альтман публично рассуждал, что ИИ-агенты скоро будут выполнять работу целых команд разработчиков. Ну… видимо везде, но не у них.
Большинство новых позиций в отделах разработки продуктов, инженерии, исследованиях и продажах. Отдельно упоминается новая специализация "технических амбассадоров", которые будут помогать бизнесу правильно использовать многочисленные инструменты OpenAI.
Примечательно, что несколько месяцев назад Альтман публично рассуждал, что ИИ-агенты скоро будут выполнять работу целых команд разработчиков. Ну… видимо везде, но не у них.
❤5🤯2