В 2025 году исследователи Epoch AI проанализировали цены на работу с языковыми моделями за последние 3 года. Стоимость инференса (использования модели) падает в среднем в 40 раз каждый год.
Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.
Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.
Например, стоимость производительности GPT-4 уровня снизилась за год в 40 раз. А модели уровня GPT-3.5 на момент исследования можно было запускать локально на домашних компьютерах с видеокартой среднего уровня.
Авторы пришли к выводу, что никакой "монополии больших компаний" нет. Через 8 месяцев после релиза топовой модели ее производительность становится доступна обычным пользователям.
❤7🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследователи создали AI-фреймворк RGMP, который учит роботов делать домашние дела с успехом 87%. Система распознает объекты, планирует действия и выполняет задачи в реальном мире.
Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.
Здесь же используется подход геометрического рассуждения:
1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.
2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.
В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).
Ей требуется в 5 раз меньше обучающих данных, чем другим моделям. Суть в том, что традиционным моделям нужно огромное количество размеченных данных с траекториями движения, причем они все равно не могут выполнять задачи, на которых не обучены.
Здесь же используется подход геометрического рассуждения:
1) Система сначала анализирует геометрию (плоская, цилиндрическая, неправильной формы) и выбирает подходящий навык из библиотеки. Например, для плоского объекта – щипок, для банки – обхват ладонью.
2) Затем происходит генерация движений. Система сканирует изображение участками и создает "пространственную память" сцены. Потом определяет положение объекта, и наконец моделирует траекторию движения.
В результате, робот, обученный на захвате фанты научился брать: бутылки (78% точности), баллончик (81%), даже руку человека (90%).
❤7🕊2
This media is not supported in your browser
VIEW IN TELEGRAM
Много новых обновлений ожидаются, кстати.
Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.
OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.
DeepSeek v4 тоже на этой неделе должны показать.
Вчера вот вышла GPT-5.3 Instant, которую постарались сделать более отзывчивой и менее оправдывающейся.
OpenAI в твиттере говорят, что выход обычной GPT-5.4 ближе, чем кажется. А там еще Google намекают на скорый релиз Gemini 3.5.
DeepSeek v4 тоже на этой неделе должны показать.
❤8🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Подъехала GPT-5.4.
Помимо скучных бенчмарков OpenAI добавили кое-что интересное. Во-первых, модель пишет, что собирается делать и прямо в процессе выполнения можно вмешаться и скорректировать ее. На видео показано, как пользователь уточнил район для поиска.
Во-вторых она может управлять компьютером, ориентируясь на скриншоты экрана. Раньше подобное было для их агентского режима в браузере.
Помимо скучных бенчмарков OpenAI добавили кое-что интересное. Во-первых, модель пишет, что собирается делать и прямо в процессе выполнения можно вмешаться и скорректировать ее. На видео показано, как пользователь уточнил район для поиска.
Во-вторых она может управлять компьютером, ориентируясь на скриншоты экрана. Раньше подобное было для их агентского режима в браузере.
❤7
Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков.
Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий. Узкая специализация сделала ее дешевле и точнее конкурентов в своей нише.
По внутренним тестам Cursor, Composer 2 опередил Claude Opus 4.6 на задачах агентной разработки. На стандартном бенчмарке CursorBench набирает 61,3 балла против 58,2 у Claude Opus 4.6 и 63,9 у GPT-5.4 Thinking. При этом цена ниже на порядок. Миллион токенов на выходе обходится в 2,5 доллара по стандартному тарифу. Claude Opus 4.6 стоит 25 долларов за тот же объем.
Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий. Узкая специализация сделала ее дешевле и точнее конкурентов в своей нише.
По внутренним тестам Cursor, Composer 2 опередил Claude Opus 4.6 на задачах агентной разработки. На стандартном бенчмарке CursorBench набирает 61,3 балла против 58,2 у Claude Opus 4.6 и 63,9 у GPT-5.4 Thinking. При этом цена ниже на порядок. Миллион токенов на выходе обходится в 2,5 доллара по стандартному тарифу. Claude Opus 4.6 стоит 25 долларов за тот же объем.
❤6👍1
Мы специально долго не постили, чтобы вы поняли, как тяжело жить в мире, не зная о том, какие модели когда выходят. Не переживайте, с этого момента посты будут выходить регулярно!
1❤8😁1
Media is too big
VIEW IN TELEGRAM
Вчера NVIDIA закрыла конференцию GTC 2026 в Сан-Хосе.
Напомним, что они показали:
• Vera Rubin, следующее поколение GPU, которое даст 10-кратный прирост производительности по сравнению с Blackwell.
• Groq 3 LPU. Первый чип после покупки активов Groq за $20 млрд в декабре. Чипы в связке с Vera Rubin дают 35-кратный прирост производительности.
• Платформу NemoClaw, которая разворачивает ИИ-агента на базе OpenClaw с надстройками для усиленной защиты. Хуанг назвал OpenClaw «популярнейшим open source проектом в истории» и заявил, что у всех компании теперь должна быть стратегия по его применению.
• DLSS 5 для апскейлинга игр на основе мощного нейронного рендеринга. Модель фактически рисует все кадры, а не просто масштабирует или достраивает промежуточные. От этого все мемы о сходстве с ИИ-картинками.
• Новую-новую архитектуру Feynman, которая будет после Vera Rubin в 2028.
Вместо финального слова Хуанг прислал своего ИИ-аватара, который пел у костра вместе с роботами. Уверен, всем очень понравилось
Напомним, что они показали:
• Vera Rubin, следующее поколение GPU, которое даст 10-кратный прирост производительности по сравнению с Blackwell.
• Groq 3 LPU. Первый чип после покупки активов Groq за $20 млрд в декабре. Чипы в связке с Vera Rubin дают 35-кратный прирост производительности.
• Платформу NemoClaw, которая разворачивает ИИ-агента на базе OpenClaw с надстройками для усиленной защиты. Хуанг назвал OpenClaw «популярнейшим open source проектом в истории» и заявил, что у всех компании теперь должна быть стратегия по его применению.
• DLSS 5 для апскейлинга игр на основе мощного нейронного рендеринга. Модель фактически рисует все кадры, а не просто масштабирует или достраивает промежуточные. От этого все мемы о сходстве с ИИ-картинками.
• Новую-новую архитектуру Feynman, которая будет после Vera Rubin в 2028.
Вместо финального слова Хуанг прислал своего ИИ-аватара, который пел у костра вместе с роботами. Уверен, всем очень понравилось
❤5🤩1
answer as
Cursor выпустили Composer 2 – третье поколение собственной языковой модели для разработчиков. Модель предварительно обучали на коде, а потом докручивали путем обучения с подкреплением на длинных агентных задачах, где нужны сотни последовательных действий.…
Ой… Composer 2 оказался всего лишь оптимизированной опенсорс моделью Kimi-K2.5. Разработчики из Cursor даже не упомянули об этом
❤5
OpenAI делает одно большое приложение вместо нескольких мелких.
У OpenAI накопилось слишком много отдельных продуктов, часть из которых так и не нашла свою аудиторию. Поэтому решили делать суперапп, который объединит ChatGPT, браузер Atlas и платформу для кодинга Codex. Все в одном окне, без переключений между приложениями.
На недавней встрече гендиректор по приложениям Фиджи Симо прямо сказала сотрудникам: никаких "побочных квестов". Фокус на агентских возможностях, на задачах, которые ИИ будет выполнять автономно на компьютере.
Мобильный ChatGPT при этом трогать не планируют.
У OpenAI накопилось слишком много отдельных продуктов, часть из которых так и не нашла свою аудиторию. Поэтому решили делать суперапп, который объединит ChatGPT, браузер Atlas и платформу для кодинга Codex. Все в одном окне, без переключений между приложениями.
На недавней встрече гендиректор по приложениям Фиджи Симо прямо сказала сотрудникам: никаких "побочных квестов". Фокус на агентских возможностях, на задачах, которые ИИ будет выполнять автономно на компьютере.
Мобильный ChatGPT при этом трогать не планируют.
❤5
Сидней, 2024. Пол Конингем, технический предприниматель, узнал, что у его собаки Рози рак. Операция и химиотерапия не помогли. Он решил спросить ChatGPT.
ChatGPT предложил иммунотерапию и направил к Центру геномики при Сиднейском университете UNSW. Конингем убедил ученых взяться за проект, оплатил геномное секвенирование опухоли Рози и начал с помощью ИИ-инструментов анализировать ДНК. AlphaFold от DeepMind помог найти мутировавшие белки как мишени для лечения. В итоге нанохимик Пол Тордарсон создал персональную мРНК-вакцину специально под конкретную собаку - первую в истории - за два месяца.
К середине марта опухоль на лапе Рози уменьшилась примерно на 75%.
Человек без медицинского образования с помощью ИИ нашел дорогу к технологии, которую теперь планируют применить на людях. "Это демократизирует весь процесс", сказал ученый UNSW.
ChatGPT предложил иммунотерапию и направил к Центру геномики при Сиднейском университете UNSW. Конингем убедил ученых взяться за проект, оплатил геномное секвенирование опухоли Рози и начал с помощью ИИ-инструментов анализировать ДНК. AlphaFold от DeepMind помог найти мутировавшие белки как мишени для лечения. В итоге нанохимик Пол Тордарсон создал персональную мРНК-вакцину специально под конкретную собаку - первую в истории - за два месяца.
К середине марта опухоль на лапе Рози уменьшилась примерно на 75%.
Человек без медицинского образования с помощью ИИ нашел дорогу к технологии, которую теперь планируют применить на людях. "Это демократизирует весь процесс", сказал ученый UNSW.
❤🔥5❤3
OpenAI собирается нанять почти вдвое больше людей к концу года – с 4 500 до 8 000 сотрудников.
Большинство новых позиций в отделах разработки продуктов, инженерии, исследованиях и продажах. Отдельно упоминается новая специализация "технических амбассадоров", которые будут помогать бизнесу правильно использовать многочисленные инструменты OpenAI.
Примечательно, что несколько месяцев назад Альтман публично рассуждал, что ИИ-агенты скоро будут выполнять работу целых команд разработчиков. Ну… видимо везде, но не у них.
Большинство новых позиций в отделах разработки продуктов, инженерии, исследованиях и продажах. Отдельно упоминается новая специализация "технических амбассадоров", которые будут помогать бизнесу правильно использовать многочисленные инструменты OpenAI.
Примечательно, что несколько месяцев назад Альтман публично рассуждал, что ИИ-агенты скоро будут выполнять работу целых команд разработчиков. Ну… видимо везде, но не у них.
❤5🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Год назад Anthropic запустили стрим на Twitch, где Claude играет в Pokemon Red. Поводом стал релиз Sonnet 3.7 с режимом рассуждений. Раньше их модели работали одинаково: получил вопрос – выдал ответ. Тут впервые появилась пауза на размышление.
Чтобы показать эффект наглядно использовали игру из 90х. В ней нельзя угадать ответ, нужно принимать сотни решений и выстраивать стратегии. Sonnet 3.5 не смог выйти из своего дома. Sonnet 3.7 прошел треть игры и застрял. Тысячи зрителей болели за него, когда он пять часов бродил по лесу.
Теперь каждый раз, когда Anthropic выпускал новую модель, ее отправляли играть. Затем стали отправлять других. Gemini прошел Pokemon Blue, GPT-5.1 одолел Pokemon Crystal. Дошло даже до того, что запустили соревнование, где ИИ-агенты сражаются между собой.
Возвращаясь к Anthropic, Opus 4.6 добрался почти до финала уже за 200 часов (взрослому нужно 25–30). Чемпионом Claude пока не бывать, но все равно трогательно смотреть, как он третий час толкает валун в пещере.
Чтобы показать эффект наглядно использовали игру из 90х. В ней нельзя угадать ответ, нужно принимать сотни решений и выстраивать стратегии. Sonnet 3.5 не смог выйти из своего дома. Sonnet 3.7 прошел треть игры и застрял. Тысячи зрителей болели за него, когда он пять часов бродил по лесу.
Теперь каждый раз, когда Anthropic выпускал новую модель, ее отправляли играть. Затем стали отправлять других. Gemini прошел Pokemon Blue, GPT-5.1 одолел Pokemon Crystal. Дошло даже до того, что запустили соревнование, где ИИ-агенты сражаются между собой.
Возвращаясь к Anthropic, Opus 4.6 добрался почти до финала уже за 200 часов (взрослому нужно 25–30). Чемпионом Claude пока не бывать, но все равно трогательно смотреть, как он третий час толкает валун в пещере.
❤7🥰2🐳2
Blue Origin Джеффа Безоса хочет вынести дата-центры на орбиту. Компания подала заявку в Федеральную комиссию по связи на запуск 51 600 спутников, которые будут обрабатывать ИИ-запросы прямо в космосе. Проект называется Project Sunrise.
Дата-центры на земле скоро столкнутся с проблемами: отсутствием свободных мест под серверные, недостатком воды для охлаждения, повышением стоимости электричества. Орбита в каком-то смысле решает все три проблемы сразу. Солнце светит всегда, охлаждать проще через радиаторы в вакууме, и земельный вопрос не стоит вообще. Blue Origin утверждает, что это снизит стоимость вычислений по сравнению с наземными решениями.
Спутники выйдут на высоты от 500 до 1800 км. Первые запуски возможны уже через два года, в случае одобрения регулятором.
Примечательно, что ранее Blue Origin жаловались на SpaceX и их планы запустить в небо 1 миллион спутников, что сделает невозможным вывод на орбиту других космических аппаратов. Сейчас на орбите Земли около 15 тысяч спутников.
Дата-центры на земле скоро столкнутся с проблемами: отсутствием свободных мест под серверные, недостатком воды для охлаждения, повышением стоимости электричества. Орбита в каком-то смысле решает все три проблемы сразу. Солнце светит всегда, охлаждать проще через радиаторы в вакууме, и земельный вопрос не стоит вообще. Blue Origin утверждает, что это снизит стоимость вычислений по сравнению с наземными решениями.
Спутники выйдут на высоты от 500 до 1800 км. Первые запуски возможны уже через два года, в случае одобрения регулятором.
Примечательно, что ранее Blue Origin жаловались на SpaceX и их планы запустить в небо 1 миллион спутников, что сделает невозможным вывод на орбиту других космических аппаратов. Сейчас на орбите Земли около 15 тысяч спутников.
❤4👀2
Сэм Альтман передал контроль над командами безопасности и защиты OpenAI другим руководителям. Сам он теперь сосредоточится на привлечении инвестиций, цепочках поставок и строительстве дата-центров "в беспрецедентных масштабах" – так он написал сотрудникам сегодня.
В том же письме Альтман сообщил, что OpenAI завершила начальную разработку следующей крупной модели с рабочим названием Spud. Ради ее усиленного развития решили даже закрыть приложение с нейро-роликами Sora.
В том же письме Альтман сообщил, что OpenAI завершила начальную разработку следующей крупной модели с рабочим названием Spud. Ради ее усиленного развития решили даже закрыть приложение с нейро-роликами Sora.
❤8🥰1
Luma AI выпустила Uni-1 – модель генерации изображений, которая умеет думать, пока рисует.
Пишут, что устроена Uni-1 по-особенному. В основе обычный декодерный трансформер (как у языковых моделей), только вместо чистого текста на вход и выход подается смешанная последовательность из текста и картинок. Перед тем как что-то сгенерировать, модель раскладывает задачу: разбирает инструкцию, планирует композицию, разрешает противоречия и только потом генерирует.
По итогам тестирования Uni-1 заняла первое место по общему качеству, по редактированию и по генерации с опорой на референс. При переводе текста в картинку Google Nano Banana пока выигрывает. Зато Uni-1 стоит на 10-30% дешевле.
В комментариях анонсирующий ролик. Попробовать можно бесплатно на сайте. У них очень интересный интерфейс по типу Фигмы.
Пишут, что устроена Uni-1 по-особенному. В основе обычный декодерный трансформер (как у языковых моделей), только вместо чистого текста на вход и выход подается смешанная последовательность из текста и картинок. Перед тем как что-то сгенерировать, модель раскладывает задачу: разбирает инструкцию, планирует композицию, разрешает противоречия и только потом генерирует.
По итогам тестирования Uni-1 заняла первое место по общему качеству, по редактированию и по генерации с опорой на референс. При переводе текста в картинку Google Nano Banana пока выигрывает. Зато Uni-1 стоит на 10-30% дешевле.
В комментариях анонсирующий ролик. Попробовать можно бесплатно на сайте. У них очень интересный интерфейс по типу Фигмы.
❤4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
CEO облачной корпорации Salesforce выложил видео, как Figure 03, новейшее поколение гуманоидных роботов, сгибает прутья сортирует посылки в условиях буллинга.
😁6❤4🔥2
Reflection AI - компания с открытым кодом, которая строит себя как альтернативу OpenAI, хочет привлечь $2,5 млрд при оценке $25 млрд. По данным Wall Street Journal, в переговорах об участии уже JPMorgan.
Основали ее в 2024 году бывшие исследователи Google DeepMind - Миша Ласкин и Иоаннис Антоноглу, один из создателей AlphaGo. Миссия - строить мощные модели с открытым кодом, способные конкурировать с закрытыми лабораториями. В марте 2025 года компания вышла из тени с $130 млн при оценке $545 млн, в октябре подняла $2 млрд при $8 млрд. Теперь еще $2,5 млрд уже при оценке в $25 млрд.
Однако ни одной публичной модели от них до сих пор нет. Агент для написания кода Asimov, который на момент показа был лучше Sonnet 3.7 и 4, все еще в листе ожидания.
Получается, что сайт есть, команда есть, инвестиций есть, продукта - нет.
Основали ее в 2024 году бывшие исследователи Google DeepMind - Миша Ласкин и Иоаннис Антоноглу, один из создателей AlphaGo. Миссия - строить мощные модели с открытым кодом, способные конкурировать с закрытыми лабораториями. В марте 2025 года компания вышла из тени с $130 млн при оценке $545 млн, в октябре подняла $2 млрд при $8 млрд. Теперь еще $2,5 млрд уже при оценке в $25 млрд.
Однако ни одной публичной модели от них до сих пор нет. Агент для написания кода Asimov, который на момент показа был лучше Sonnet 3.7 и 4, все еще в листе ожидания.
Получается, что сайт есть, команда есть, инвестиций есть, продукта - нет.
❤6🤨1😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Пишут, что Mistral выпустила Voxtral TTS, голосовую модель для синтеза речи с открытым кодом.
Модель основана на Ministral 3B и запускается даже на смартфонах, при этом скорость отклика составляет 90 мс, а рендеринг 10 секунд занимает около 1,6 секунды. Она умеет клонировать голос по 5-секундному сэмплу и поддерживает 9 языков. Mistral заявлет, что обошла ElevenLabs по качеству.
Новостей об этом много, но саму модель еще никуда не выложили, а официальная страница выдает ошибку. Ну, зато трейлер красивый есть.
UPD: офф страница теперь ведет на новость
Модель основана на Ministral 3B и запускается даже на смартфонах, при этом скорость отклика составляет 90 мс, а рендеринг 10 секунд занимает около 1,6 секунды. Она умеет клонировать голос по 5-секундному сэмплу и поддерживает 9 языков. Mistral заявлет, что обошла ElevenLabs по качеству.
Новостей об этом много, но саму модель еще никуда не выложили, а официальная страница выдает ошибку. Ну, зато трейлер красивый есть.
UPD: офф страница теперь ведет на новость
👍6❤3