Sakana AI предложили способ обучать большие модели по частям
Они выпустили статью про так называемые Diffusion Blocks, в которой показали, как можно обучать модели не целиком, а блоками.
Вообще, в стандартном обучении необходимость гонять данные через все слои сетки и затем гнать обратно градиенты довольно проблематична. В памяти нужно держать промежуточные состояния всех слоев, с углублением модели память сильно разрастается, и это барьер для масштабирования.
Если взглянуть на диффузионные модели, то там все иначе. Они обучаются как бы постепенному очищению шума до нужного ответа, и разные уровни шума (когда модель учится убирать шум при конкретном уровне зашумления) можно обучать относительно независимо.
Ученые из Sakana базируют свою механику как раз на идее диффузии. По сути, прохождение сигнала через блоки сетки тоже можно рассматривать как очищение от шума: каждый слой учится приближать сигнал к ответу.
И тогда получается, что по аналогии с диффузионными моделями мы можем обучать разные маленькие денойзеры отдельно. Технически, сеть делится на несколько блоков, каждому из которых назначают свой диапазон шума. Проще говоря, блок учится проходить определенную часть пути от шума к ответу.
Если в сети N блоков, то при обучении это дает примерно N-кратную экономию памяти. При этом авторы утверждают, что качество на тестах получается сопоставимым с end-to-end обучением.
Большой интерес тут, конечно, представляет файнтюнинг. На практике этот метод был бы невероятно полезен именно для дообучения, но для этого нужно как-то научиться конвертировать большие предобученные модели в DiffusionBlocks. Собственно, исследователи обещают этим заняться.
Блогпост | Статья
Они выпустили статью про так называемые Diffusion Blocks, в которой показали, как можно обучать модели не целиком, а блоками.
Вообще, в стандартном обучении необходимость гонять данные через все слои сетки и затем гнать обратно градиенты довольно проблематична. В памяти нужно держать промежуточные состояния всех слоев, с углублением модели память сильно разрастается, и это барьер для масштабирования.
Если взглянуть на диффузионные модели, то там все иначе. Они обучаются как бы постепенному очищению шума до нужного ответа, и разные уровни шума (когда модель учится убирать шум при конкретном уровне зашумления) можно обучать относительно независимо.
Ученые из Sakana базируют свою механику как раз на идее диффузии. По сути, прохождение сигнала через блоки сетки тоже можно рассматривать как очищение от шума: каждый слой учится приближать сигнал к ответу.
И тогда получается, что по аналогии с диффузионными моделями мы можем обучать разные маленькие денойзеры отдельно. Технически, сеть делится на несколько блоков, каждому из которых назначают свой диапазон шума. Проще говоря, блок учится проходить определенную часть пути от шума к ответу.
Если в сети N блоков, то при обучении это дает примерно N-кратную экономию памяти. При этом авторы утверждают, что качество на тестах получается сопоставимым с end-to-end обучением.
Большой интерес тут, конечно, представляет файнтюнинг. На практике этот метод был бы невероятно полезен именно для дообучения, но для этого нужно как-то научиться конвертировать большие предобученные модели в DiffusionBlocks. Собственно, исследователи обещают этим заняться.
Блогпост | Статья
👍64🔥34❤20😁2🤔2🤯1
Используя идеи ИИ, ученые опровергли известную гипотезу сумм-произведений для действительных чисел
Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное решение найдено, но ИИ удалось найти абсолютно новое бесконечное семейство конфигураций, которое опровергло эту версию.
Если хотите почитать подробнее, мы писали об этом здесь: t.me/data_secrets/9265.
Основная фишка решения заключалась в альтернативном подходе, который люди до этого не замечали. Модель связала геометрическую задачу с алгебраической теорией чисел, и использовала в решении башни полей классов.
Ученые сразу обратили внимание на этот трюк. И вот, используя те же башни полей, группа математиков буквально вчера опровергла еще одну известную гипотезу.
Вот их статья: arxiv.org/pdf/2605.28781. В ней они прямо пишут, что "вдохновились на повторное рассмотрение возможности
опровержения гипотезы благодаря изобретенному в OpenAI контрпримеру для задачи о единичных расстояниях".
Кстати, в ходе работы авторы также использовали GPT-5.5 Pro, но пишут, что финальное доказательство все-таки получили самостоятельно.
Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное решение найдено, но ИИ удалось найти абсолютно новое бесконечное семейство конфигураций, которое опровергло эту версию.
Если хотите почитать подробнее, мы писали об этом здесь: t.me/data_secrets/9265.
Основная фишка решения заключалась в альтернативном подходе, который люди до этого не замечали. Модель связала геометрическую задачу с алгебраической теорией чисел, и использовала в решении башни полей классов.
Ученые сразу обратили внимание на этот трюк. И вот, используя те же башни полей, группа математиков буквально вчера опровергла еще одну известную гипотезу.
Вот их статья: arxiv.org/pdf/2605.28781. В ней они прямо пишут, что "вдохновились на повторное рассмотрение возможности
опровержения гипотезы благодаря изобретенному в OpenAI контрпримеру для задачи о единичных расстояниях".
Кстати, в ходе работы авторы также использовали GPT-5.5 Pro, но пишут, что финальное доказательство все-таки получили самостоятельно.
🫡69❤29👍24🔥15😁3
Data Secrets
Используя идеи ИИ, ученые опровергли известную гипотезу сумм-произведений для действительных чисел Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное…
Ведущий ученый из OpenAI Ноам Браун считает, что ИИ может в целом улучшить математические способности людей
Вот так он прокомментировал новость выше о том, что люди переняли подход ИИ для опровержения известной гипотезы:
Феномен AlphaGo действительно существует: после победы над Ли Седолем люди стали наследовать у нее тактики, а некоторые лучшие игроки вроде Кэ Цзе даже в целом изменили стиль игры. Браун считает, что математиков ждет примерно то же самое: ИИ открывает новые пути, которые люди затем могут переиспользовать в собственных доказательствах (что, собственно, и произошло).
Вот так он прокомментировал новость выше о том, что люди переняли подход ИИ для опровержения известной гипотезы:
"После появления AlphaGo навыки игроков в Go заметно улучшились. Подозреваю, что мы увидим аналогичную закономерность и в математике".
Феномен AlphaGo действительно существует: после победы над Ли Седолем люди стали наследовать у нее тактики, а некоторые лучшие игроки вроде Кэ Цзе даже в целом изменили стиль игры. Браун считает, что математиков ждет примерно то же самое: ИИ открывает новые пути, которые люди затем могут переиспользовать в собственных доказательствах (что, собственно, и произошло).
❤135👏30🐳25🔥18😁9👍7🗿5🤔1
😳Цены на серверы растут снижаются каждую секунду
Selectel проводит аукцион выделенных серверов: скидки доходят до 35%, а иногда появляются СуперЛоты со скидкой до 80%. Если успеете арендовать раньше других, выгодная цена сохранится за вами навсегда 🔥
Почему стоит арендовать выделенный сервер в Selectel?
- Безлимитный бесплатный интернет со скоростью 1 Гбит/сек,
- Защита от DDos атак входит в стоимость аренды,
- Полное соответствие стандартам 152-ФЗ.
➡️Арендуйте выделенный сервер от Selectel со скидкой, пока это не сделал кто-то другой: https://slc.tl/8ihz3
Реклама. АО "Селектел". erid:2W5zFHN8k7s
Selectel проводит аукцион выделенных серверов: скидки доходят до 35%, а иногда появляются СуперЛоты со скидкой до 80%. Если успеете арендовать раньше других, выгодная цена сохранится за вами навсегда 🔥
Почему стоит арендовать выделенный сервер в Selectel?
- Безлимитный бесплатный интернет со скоростью 1 Гбит/сек,
- Защита от DDos атак входит в стоимость аренды,
- Полное соответствие стандартам 152-ФЗ.
➡️Арендуйте выделенный сервер от Selectel со скидкой, пока это не сделал кто-то другой: https://slc.tl/8ihz3
Реклама. АО "Селектел". erid:2W5zFHN8k7s
😁62🤨27🗿19 6🤯2❤1👍1
Data Secrets
Ждем Opus 4.8 сегодня?
Claude Opus 4.8 здесь
Посмотрите на этот невероятный показатель в 69.2% на SWE Pro. Anthropic пишут, что модель еще лучше работает с длинными тасками, в 4 раза чаще замечает и исправляет собственные ошибки и более надежно следует инструкциям.
Кроме того:
– В Claude Code закатили новую фичу dynamic workflows. Теперь агент сможет брать на себя еще более долгие задачи, выполнение которых может занимать дни: он запускает сотни суб-агентов и управляет ими, корректирует план, проверяет все результаты и так далее. Пока в превью (вот тут отдельный блогпост). Оказывается, именно эту фичу использовали для той самой миграции Bun с Zig на Rust.
– В claude.ai и Cowork теперь можно контролировать усилия модели: больше усилий – глубже ризонинг, меньше усилий – быстрые ответы.
– Fast mode для новой модели стал в три раза дешевле.
В целом цена та же, модель уже доступна.
https://www.anthropic.com/news/claude-opus-4-8
Посмотрите на этот невероятный показатель в 69.2% на SWE Pro. Anthropic пишут, что модель еще лучше работает с длинными тасками, в 4 раза чаще замечает и исправляет собственные ошибки и более надежно следует инструкциям.
Кроме того:
– В Claude Code закатили новую фичу dynamic workflows. Теперь агент сможет брать на себя еще более долгие задачи, выполнение которых может занимать дни: он запускает сотни суб-агентов и управляет ими, корректирует план, проверяет все результаты и так далее. Пока в превью (вот тут отдельный блогпост). Оказывается, именно эту фичу использовали для той самой миграции Bun с Zig на Rust.
– В claude.ai и Cowork теперь можно контролировать усилия модели: больше усилий – глубже ризонинг, меньше усилий – быстрые ответы.
– Fast mode для новой модели стал в три раза дешевле.
В целом цена та же, модель уже доступна.
https://www.anthropic.com/news/claude-opus-4-8
2❤141🤯45⚡17👍14🔥5😁5👏2🐳2
Anthropic оценили почти в 1 триллион долларов
Компания официально объявила о раунде H: они привлекли $65 млрд при оценке в $965 млрд (напоминаем, что еще в феврале их оценивали в 380 миллиардов). И, кстати, OpenAI последний раз оценили в 852 миллиарда.
При этом выручка (ARR) Anthropic перешагнула за 47 миллиардов долларов.
Компания официально объявила о раунде H: они привлекли $65 млрд при оценке в $965 млрд (напоминаем, что еще в феврале их оценивали в 380 миллиардов). И, кстати, OpenAI последний раз оценили в 852 миллиарда.
При этом выручка (ARR) Anthropic перешагнула за 47 миллиардов долларов.
❤152🤯76👍26🔥14😁12🦄1
Data Secrets
Anthropic оценили почти в 1 триллион долларов Компания официально объявила о раунде H: они привлекли $65 млрд при оценке в $965 млрд (напоминаем, что еще в феврале их оценивали в 380 миллиардов). И, кстати, OpenAI последний раз оценили в 852 миллиарда. …
Один из корпоративных клиентов Anthropic случайно потратил за месяц 500 миллионов долларов на токены
Вы не ослышались, пол миллиарда долларов.
Об этом изданию Axios рассказал консультант компании (название компании не раскрывалось). Дело в том, что для сотрудников не были установлены лимиты по использованию, и те сожгли дополнительных токенов буквально на миллионы.
Теперь понятно, откуда у Anthropic такой ARR
Вы не ослышались, пол миллиарда долларов.
Об этом изданию Axios рассказал консультант компании (название компании не раскрывалось). Дело в том, что для сотрудников не были установлены лимиты по использованию, и те сожгли дополнительных токенов буквально на миллионы.
Теперь понятно, откуда у Anthropic такой ARR
1😁405🤯78❤18 14 6🗿5🤩4🔥3🕊3👍1
Тем временем в Сан-Франциско шикарные дома продают за акции OpenAI и Anthropic
www.zillow.com/homedetails/160-Noe-St-San-Francisco-CA-94114/461638923_zpid/
www.zillow.com/homedetails/160-Noe-St-San-Francisco-CA-94114/461638923_zpid/
😁190 39👍12🔥7🦄4❤3❤🔥2
Lakehouse будет расти в России быстрее рынка аналитических решений в целом
Речь про архитектуру, которая объединяет Data Lake и классические DWH: данные хранятся отдельно от вычислительных мощностей, из-за чего систему становится проще и дешевле масштабировать на больших объемах.
В интервью «Коммерсанту» руководитель продуктовой архитектуры платформы данных Yandex Cloud Леонид Савченков говорит, что классические DWH начинают заметно «болеть» на объемах свыше 100 ТБ:
«Единственный способ это исправить — докупать серверные мощности. Но в традиционной архитектуре хранение данных и их обработка неразрывно связаны, поэтому расширять приходится сразу все — даже если “узкое место” только одно».
Среди компаний, которые уже двигаются в эту сторону, упоминаются Т-Банк, «Магнит», Lamoda и «Лемана Про». Отдельно отмечается, что Lakehouse удобнее для запуска ИИ-нагрузок: модели и аналитические агенты можно выносить на отдельные вычислительные мощности без влияния на основную систему.
Интересно, что в качестве одного из будущих сценариев отдельно выделяют аналитику на естественном языке — когда бизнес задает вопрос почти «человеческим» языком и получает готовый график или SQL-запрос.
Речь про архитектуру, которая объединяет Data Lake и классические DWH: данные хранятся отдельно от вычислительных мощностей, из-за чего систему становится проще и дешевле масштабировать на больших объемах.
В интервью «Коммерсанту» руководитель продуктовой архитектуры платформы данных Yandex Cloud Леонид Савченков говорит, что классические DWH начинают заметно «болеть» на объемах свыше 100 ТБ:
«Единственный способ это исправить — докупать серверные мощности. Но в традиционной архитектуре хранение данных и их обработка неразрывно связаны, поэтому расширять приходится сразу все — даже если “узкое место” только одно».
Среди компаний, которые уже двигаются в эту сторону, упоминаются Т-Банк, «Магнит», Lamoda и «Лемана Про». Отдельно отмечается, что Lakehouse удобнее для запуска ИИ-нагрузок: модели и аналитические агенты можно выносить на отдельные вычислительные мощности без влияния на основную систему.
Интересно, что в качестве одного из будущих сценариев отдельно выделяют аналитику на естественном языке — когда бизнес задает вопрос почти «человеческим» языком и получает готовый график или SQL-запрос.
🗿44❤24👍13😁13🤯6 5
Nvidia впервые выпускают собственный CPU – NVIDIA Vera
Vera спроектирован специально для ИИ. На агентных задачах выдает ускорение 80% относительно x86.
Внутри 88 ядер Olympus, это первая собственная архитектура NVIDIA. Конечно, основная фишка в сверхтесной связке с GPU. Vera и будущие GPU Rubin связаны через NVLink-C2C с пропускной способностью 1.8 ТБ/с. Это примерно в 7 раз больше, чем PCIe Gen6, то есть очень быстро.
А это значит: дешевле и быстрее обучение и инференс, меньше простоев и выше загрузка кластеров.
По сути, Nvidia теперь продает датацентры под ключ. И GPU, и CPU, и софт, и сеть, и все это как единая система. Дженсен сказал, что первыми клиентами под Vera будут OpenAI, Anthropic и SpaceX.
https://www.nvidia.com/en-us/data-center/vera-cpu/
Vera спроектирован специально для ИИ. На агентных задачах выдает ускорение 80% относительно x86.
Внутри 88 ядер Olympus, это первая собственная архитектура NVIDIA. Конечно, основная фишка в сверхтесной связке с GPU. Vera и будущие GPU Rubin связаны через NVLink-C2C с пропускной способностью 1.8 ТБ/с. Это примерно в 7 раз больше, чем PCIe Gen6, то есть очень быстро.
А это значит: дешевле и быстрее обучение и инференс, меньше простоев и выше загрузка кластеров.
По сути, Nvidia теперь продает датацентры под ключ. И GPU, и CPU, и софт, и сеть, и все это как единая система. Дженсен сказал, что первыми клиентами под Vera будут OpenAI, Anthropic и SpaceX.
https://www.nvidia.com/en-us/data-center/vera-cpu/
🤯128❤39🔥34 11👍9❤🔥3👏3😁3🤔1
Media is too big
VIEW IN TELEGRAM
RTX Spark – новый серьезный конкурент Apple Silicon от Nvidia
Еще один очень яркий релиз с прошедшей вчера Computex 2026, на этот раз уже для потребителей.
RTX Spark – это System-on-Chip для AI-PC и локального запуска ИИ-агентов. Внутри будет 20-ядерный ARM CPU, Blackwell GPU на 6144 CUDA-ядер, Tensor Cores с FP4 и до 128 ГБ объединенной памяти, которая и сделала Apple Silicon таким популярным среди разработчиков.
NVIDIA заявляет до 1 петафлопа AI-производительности. Конечно, речь идет о низких точностях, но тем не менее: еще недавно эта мощность ассоциировалась с серьезными серверными системами. На такое железо будут спокойно влезать модели до 70–120B с квантизацией. Плюс CUDA и весь AI-стек Nvidia из коробки.
При этом ноутбуки будут очень тонкими и легкими, ~ 14мм и 1.3 кг.
Ноутбуки на новом чипе уже готовят Dell, HP, Lenovo, Asus и другие.
www.nvidia.com/en-us/products/rtx-spark/
Еще один очень яркий релиз с прошедшей вчера Computex 2026, на этот раз уже для потребителей.
RTX Spark – это System-on-Chip для AI-PC и локального запуска ИИ-агентов. Внутри будет 20-ядерный ARM CPU, Blackwell GPU на 6144 CUDA-ядер, Tensor Cores с FP4 и до 128 ГБ объединенной памяти, которая и сделала Apple Silicon таким популярным среди разработчиков.
NVIDIA заявляет до 1 петафлопа AI-производительности. Конечно, речь идет о низких точностях, но тем не менее: еще недавно эта мощность ассоциировалась с серьезными серверными системами. На такое железо будут спокойно влезать модели до 70–120B с квантизацией. Плюс CUDA и весь AI-стек Nvidia из коробки.
При этом ноутбуки будут очень тонкими и легкими, ~ 14мм и 1.3 кг.
Ноутбуки на новом чипе уже готовят Dell, HP, Lenovo, Asus и другие.
www.nvidia.com/en-us/products/rtx-spark/
🔥153🤯43❤21😁5👏4👍3🦄2🗿1
Стример PewDiePie выкатил проект для локального запуска ИИ-моделей и агентов
Один из крупнейших в мире блогеров продолжает перевоплощаться в AI-разработчика. Больше 10 лет он снимал летсплеи, прохождения и всякую развлекаловку и был самым подписываемым на YouTube, а потом – заинтересовался ИИ, и пошло-поехало.
В ноябре он объявил, что собрал себе суперкомпьютер для запуска локальных LLM за 20к долларов. Он призывал всех перестать пользоваться ChatGPT и остальными чат-ботами и переходить на локальные модели, чтобы не делиться своими данными с "нечестными" корпорациями и не переплачивать.
Затем он дообучил собственную модель, которая по какому-то бенчмарку даже превосходила фронтиры.
И вот сейчас – выпускает полноценную опенсорсную оболочку Odysseus для локального запуска агентов и моделей: https://youtu.be/rAzT5lcezPs.
Кратко, это попытка сделать полноценный self-hosted ChatGPT, то есть внутри интерфейс, память, инструменты, хранение данных, всякие агенты и тд. Модели можно подключать через Ollama, llama.cpp или vLLM, и давать им доступы на усмотрение.
За день его проект на GitHub набрал почти 18к звезд: github.com/pewdiepie-archdaemon/odysseus.
Ждем, когда уже вайбкодить начнет MrBeast
Один из крупнейших в мире блогеров продолжает перевоплощаться в AI-разработчика. Больше 10 лет он снимал летсплеи, прохождения и всякую развлекаловку и был самым подписываемым на YouTube, а потом – заинтересовался ИИ, и пошло-поехало.
В ноябре он объявил, что собрал себе суперкомпьютер для запуска локальных LLM за 20к долларов. Он призывал всех перестать пользоваться ChatGPT и остальными чат-ботами и переходить на локальные модели, чтобы не делиться своими данными с "нечестными" корпорациями и не переплачивать.
Затем он дообучил собственную модель, которая по какому-то бенчмарку даже превосходила фронтиры.
И вот сейчас – выпускает полноценную опенсорсную оболочку Odysseus для локального запуска агентов и моделей: https://youtu.be/rAzT5lcezPs.
Кратко, это попытка сделать полноценный self-hosted ChatGPT, то есть внутри интерфейс, память, инструменты, хранение данных, всякие агенты и тд. Модели можно подключать через Ollama, llama.cpp или vLLM, и давать им доступы на усмотрение.
За день его проект на GitHub набрал почти 18к звезд: github.com/pewdiepie-archdaemon/odysseus.
Ждем, когда уже вайбкодить начнет MrBeast
😁283👍79❤42🔥17🤯7🗿2 2🆒1
Data Secrets
OpenAI начинает официальный процесс выхода в IPO WSJ пишут, что они планируют подать заявку регулятору буквально сегодня или завтра. Видимо, у них уже все было готово, и они дожидались только окончания суда с Маском. После подачи заявки она будет рассматривать…
Вслед за OpenAI Anthropic тоже подали заявку на IPO
Они объявили об этом сами, вот проект регистрационного заявления.
Теперь обе компании находятся на стадии одобрения заявок регулятором (Securities and Exchange Commission, в данном случае). Так как заявки конфиденциальны, финансовых деталей пока нет.
Формы были поданы стартапами с разницей в неделю, так что гонка за первенство по IPO продолжается
Они объявили об этом сами, вот проект регистрационного заявления.
Теперь обе компании находятся на стадии одобрения заявок регулятором (Securities and Exchange Commission, в данном случае). Так как заявки конфиденциальны, финансовых деталей пока нет.
Формы были поданы стартапами с разницей в неделю, так что гонка за первенство по IPO продолжается
Google будет привлекать инвестиции на ИИ
Да, даже Google не хватает денег на ИИ. Alphabet официально заявила, что спрос на ее ИИ-решения «превышает доступные поставки».
Дефицит мощностей наблюдается даже внутри компании. Недавно внутри Google сформировали специальный комитет по распределению компьюта по департаментам, и получить GPU/TPU для своего проекта теперь не так уж и просто. Мы писали об этом тут.
Короче, им нужно прямо сейчас быстро строить инфраструктуру.
Но Пичаи признал, что на собственные средства такой темп Google не осилит. Так что они вынужденно привлекают срочные инвестиции путем продажи акций.
Пока звучит сумма в 80 миллиардов долларов. А всего на инфраструктуру в 2026 они планируют потратить в районе $175–185 млрд.
Да, даже Google не хватает денег на ИИ. Alphabet официально заявила, что спрос на ее ИИ-решения «превышает доступные поставки».
Дефицит мощностей наблюдается даже внутри компании. Недавно внутри Google сформировали специальный комитет по распределению компьюта по департаментам, и получить GPU/TPU для своего проекта теперь не так уж и просто. Мы писали об этом тут.
Короче, им нужно прямо сейчас быстро строить инфраструктуру.
Но Пичаи признал, что на собственные средства такой темп Google не осилит. Так что они вынужденно привлекают срочные инвестиции путем продажи акций.
Пока звучит сумма в 80 миллиардов долларов. А всего на инфраструктуру в 2026 они планируют потратить в районе $175–185 млрд.
🔥86😁43 26❤14🤯7👍4🦄1
Data Secrets
Google будет привлекать инвестиции на ИИ Да, даже Google не хватает денег на ИИ. Alphabet официально заявила, что спрос на ее ИИ-решения «превышает доступные поставки». Дефицит мощностей наблюдается даже внутри компании. Недавно внутри Google сформировали…
Вам доставка мемов из пузыря
13😁391👍23🔥20 10⚡1🏆1🍓1
Весна выдалась насыщенной на новые open source релизы 😎
Сразу несколько новых моделей начали сокращать разрыв с закрытыми LLM — не только в чатах, но и в production-сценариях.
Среди самых заметных новые китайские модели:
Что особенно интересно:
Сейчас open source LLM все увереннее становятся частью enterprise-инфраструктуры.
Подключить эти и еще 40+ моделей можно в сервисе Evolution Foundation Models от Cloud.ru:
👉 Перейти к сервису👈
Сразу несколько новых моделей начали сокращать разрыв с закрытыми LLM — не только в чатах, но и в production-сценариях.
Среди самых заметных новые китайские модели:
▶️ GLM-5.1▶️ Kimi K2.6▶️ DeepSeek V4 Pro
Что особенно интересно:
GLM-5.1 может автономно выполнять задачи до 8 часов, Kimi K2.6 позволяет управлять целым отрядом субагентов, а DeepSeek V4 Pro содержит гибридную архитектуру внимания, что дает крутой результат для длительного контекста.
Сейчас open source LLM все увереннее становятся частью enterprise-инфраструктуры.
Подключить эти и еще 40+ моделей можно в сервисе Evolution Foundation Models от Cloud.ru:
Вы получаете доступ к популярным open source моделям, которые можно легко адаптировать под задачи бизнеса. Модели уже готовы к использованию — не нужно развертывать инференс и писать код, достаточно подключиться через API, совместимый с OpenAI.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤨32🗿23👍10😁8❤6🤯2🔥1
Data Secrets
Anthropic поделились первыми результатами по проекту Glasswing, в котором Claude Mythos находил баги в коде компаний-партнеров Напоминаем, что проект был запущен всего полтора месяца назад. Но уже на данный момент вместе с примерно 50 партнерами с помощью…
Anthropic продолжают расширять проект Glasswing
Они объявили, что в новой волне доступ получат уже 150 организаций, причем на только из Америки. В частности, после недель переговоров, доступ получает даже агентство ЕС по кибербезопасности.
Anthropic ожидают, что схожие модели уровня Mythos появятся у других компаний в течение 6-12 месяцев (довольно пессимистичный в плане прогресса прогноз, кстати), и хотят успеть помочь компаниям обезопасить свои процессы, пока такие системы не стали общедоступными и дешевыми.
www.anthropic.com/news/expanding-project-glasswing
Они объявили, что в новой волне доступ получат уже 150 организаций, причем на только из Америки. В частности, после недель переговоров, доступ получает даже агентство ЕС по кибербезопасности.
Anthropic ожидают, что схожие модели уровня Mythos появятся у других компаний в течение 6-12 месяцев (довольно пессимистичный в плане прогресса прогноз, кстати), и хотят успеть помочь компаниям обезопасить свои процессы, пока такие системы не стали общедоступными и дешевыми.
www.anthropic.com/news/expanding-project-glasswing
🔥40 30❤11😁9👍8🤨4