Data Secrets
90.2K subscribers
6.93K photos
778 videos
20 files
3.1K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
SoftBank заложил свои акции OpenAI, чтобы купить еще акций OpenAI

Bloomberg выпустили большой отчет про финансирование OpenAI японским конгломератом во главе с Масаяши Сона. На данный момент они являются уже вторым по величине внешним акционером с долей около 13%. Но для них далеко не все гладко.

На данный момент они подарили OpenAI уже ~$64.6 млрд. Фишка в том, что собственных денег SoftBank тут меньше 30%. Все началось с продажи акций Nvidia: SoftBank полностью продал свою долю в гиганте (а там ее было примерно на 6 миллиардов), чтобы вложиться в Альтмана. Но здесь хотя бы обошлось без долгов.

А дальше они залезли в два кредита. В марте взяли первый: мостовой кредит под 8% на 40 миллиардов долларов. Почти все эти деньги тут же отошли стартапу, а выплатить их SoftBank должен уже через год (видимо, надеются на IPO).

Но этого оказалось мало, и сейчас вскрылось, что в конце апреля был взят еще один кредит на $6 млрд, уже под залог. Самое интересное, что заложили SoftBank те же самые акции OpenAI.

Рискуют они по-крупному. Если IPO вдруг перенесется или оценка OpenAI не вырастет, они попадут в дефолт, будут вынуждены продавать свои активы и потеряют очень много денег. Внутри компании уже нарастает беспокойство, но Сона игнорирует консультантов.

Кстати, с SoftBank уже такое случалось в 2019 году. Тогда они вложились в компанию WeWork, а те провалили IPO и обанкротились. В итоге SoftBank потерял около 10 миллиардов. Разница в том, что на OpenAI они поставили уже в 15 раз больше ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1503224👍13🤔12🦄6🤯4🔥3
Яндекс Образование и Томский политех собирают студентов на офлайн-студкемп по компьютерному зрению

Две недели на базе ТПУ, с 10 по 23 августа. Очень много практики, нетворка и лекций от инженеров Яндекса, исследователей университета. Разберетесь с современным стеком CV, будете решать задачи на реальных исследовательских данных и работать над собственным проектом.

Всем, кто пройдет отбор, Яндекс Образование оплатит проезд и проживание. Для тестового пригодятся Python, базовые библиотеки numpy, pandas, PyTorch и OpenCV, понимание линейной алгебры, теории вероятностей и матстата. 

Заявки принимают до 14 июня — успевайте зарегистрироваться по ссылке.
👍165😁5🗿3🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic выпустили новый плагин для Claude Code, который будет проверять код на уязвимости прямо во время редактирования

По сути, это security-хук, который срабатывает при записи и редактировании файлов. Цель состоит в том, чтобы часть проблем отлавливались до PR, и Anthropic пишут, что при конечном ревью количество пойманных проблем действительно сокращается благодаря плагину до 40%.

Помимо отлова явных уязвимостей плагин также умеет сигнализировать о небезопасных паттернах кода в целом, а также следит за тем, чтобы агенты не трогали чувствительные файлы.

Доступно для всех пользователей бесплатно. Команда для установки:

/plugin install security-guidance@anthropics-claude-code

www.claudepluginhub.com/plugins/anthropics-security-guidance-plugins-security-guidance-2
1🔥10622👏12👍83❤‍🔥2🤯2
Boston Dynamics учат робота играть в футбол

В честь начала чемпионата мира 2026 они решили запустить целую кампанию под названием «School of Football». Гуманоида Atlas собираются учить игре end-to-end, от ударов по мячу и работы ног до празднования голов.

Atlas оказался не промах и уже научился бить рабону
🔥118😁251610👍3
Яндекс выпустил Alice AI LLM Flash для бизнеса

Новая языковая модель Alice AI LLM для B2B сегмента оптимизирована под задачи, связанные с обработкой текстов и документов: модерацию контента, техподдержку, поиск по базам знаний и работу с массовыми запросами.

Что известно о модели:


– Она позволяет решать типовые b2b-задачи почти в 5 раз дешевле по сравнению с предыдущими решениями Яндекса;

– По данным компании, в 56% бизнес-сценариев модель показывает результаты лучше, чем GPT-5.4 mini;

– Отдельно отмечаются хорошие результаты в диалогах, структуризации текста и поиске информации по документам;

– Модель ориентирована на high-load сценарии, где важны скорость ответа и низкая стоимость обработки;

– Модель уже доступна бизнесу на платформе Yandex AI Studio.

Кроме того, компания также открыла доступ к DeepSeek V4 Flash — первой доступной в России облачной модели с контекстным окном в 1 млн токенов. Её предлагают использовать для ИИ-агентов, анализа больших документов и сложных многоэтапных задач.
😁128🗿4222👍14🔥4🤔2💯1
Sakana AI предложили способ обучать большие модели по частям

Они выпустили статью про так называемые Diffusion Blocks, в которой показали, как можно обучать модели не целиком, а блоками.

Вообще, в стандартном обучении необходимость гонять данные через все слои сетки и затем гнать обратно градиенты довольно проблематична. В памяти нужно держать промежуточные состояния всех слоев, с углублением модели память сильно разрастается, и это барьер для масштабирования.

Если взглянуть на диффузионные модели, то там все иначе. Они обучаются как бы постепенному очищению шума до нужного ответа, и разные уровни шума (когда модель учится убирать шум при конкретном уровне зашумления) можно обучать относительно независимо.

Ученые из Sakana базируют свою механику как раз на идее диффузии. По сути, прохождение сигнала через блоки сетки тоже можно рассматривать как очищение от шума: каждый слой учится приближать сигнал к ответу.

И тогда получается, что по аналогии с диффузионными моделями мы можем обучать разные маленькие денойзеры отдельно. Технически, сеть делится на несколько блоков, каждому из которых назначают свой диапазон шума. Проще говоря, блок учится проходить определенную часть пути от шума к ответу.

Если в сети N блоков, то при обучении это дает примерно N-кратную экономию памяти. При этом авторы утверждают, что качество на тестах получается сопоставимым с end-to-end обучением.

Большой интерес тут, конечно, представляет файнтюнинг. На практике этот метод был бы невероятно полезен именно для дообучения, но для этого нужно как-то научиться конвертировать большие предобученные модели в DiffusionBlocks. Собственно, исследователи обещают этим заняться.

Блогпост | Статья
👍59🔥2819😁2🤔2🤯1
Используя идеи ИИ, ученые опровергли известную гипотезу сумм-произведений для действительных чисел

Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное решение найдено, но ИИ удалось найти абсолютно новое бесконечное семейство конфигураций, которое опровергло эту версию.

Если хотите почитать подробнее, мы писали об этом здесь: t.me/data_secrets/9265.

Основная фишка решения заключалась в альтернативном подходе, который люди до этого не замечали. Модель связала геометрическую задачу с алгебраической теорией чисел, и использовала в решении башни полей классов.

Ученые сразу обратили внимание на этот трюк. И вот, используя те же башни полей, группа математиков буквально вчера опровергла еще одну известную гипотезу.

Вот их статья: arxiv.org/pdf/2605.28781. В ней они прямо пишут, что "вдохновились на повторное рассмотрение возможности
опровержения гипотезы благодаря изобретенному в OpenAI контрпримеру для задачи о единичных расстояниях".


Кстати, в ходе работы авторы также использовали GPT-5.5 Pro, но пишут, что финальное доказательство все-таки получили самостоятельно.
🫡5926👍19🔥12😁3
Data Secrets
Используя идеи ИИ, ученые опровергли известную гипотезу сумм-произведений для действительных чисел Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное…
Ведущий ученый из OpenAI Ноам Браун считает, что ИИ может в целом улучшить математические способности людей

Вот так он прокомментировал новость выше о том, что люди переняли подход ИИ для опровержения известной гипотезы:

"После появления AlphaGo навыки игроков в Go заметно улучшились. Подозреваю, что мы увидим аналогичную закономерность и в математике".


Феномен AlphaGo действительно существует: после победы над Ли Седолем люди стали наследовать у нее тактики, а некоторые лучшие игроки вроде Кэ Цзе даже в целом изменили стиль игры. Браун считает, что математиков ждет примерно то же самое: ИИ открывает новые пути, которые люди затем могут переиспользовать в собственных доказательствах (что, собственно, и произошло).
120👏25🐳24🔥16😁9👍3🗿3🤔1
😳Цены на серверы растут снижаются каждую секунду

Selectel проводит аукцион выделенных серверов: скидки доходят до 35%, а иногда появляются СуперЛоты со скидкой до 80%. Если успеете арендовать раньше других, выгодная цена сохранится за вами навсегда 🔥

Почему стоит арендовать выделенный сервер в Selectel?
- Безлимитный бесплатный интернет со скоростью 1 Гбит/сек,
- Защита от DDos атак входит в стоимость аренды,
- Полное соответствие стандартам 152-ФЗ.

➡️Арендуйте выделенный сервер от Selectel со скидкой, пока это не сделал кто-то другой: https://slc.tl/8ihz3

Реклама. АО "Селектел". erid:2W5zFHN8k7s
😁57🤨27🗿186🤯21
Ждем Opus 4.8 сегодня?
🤯120😁29178🔥532🤔1
Data Secrets
Ждем Opus 4.8 сегодня?
Claude Opus 4.8 здесь

Посмотрите на этот невероятный показатель в 69.2% на SWE Pro. Anthropic пишут, что модель еще лучше работает с длинными тасками, в 4 раза чаще замечает и исправляет собственные ошибки и более надежно следует инструкциям.

Кроме того:

– В Claude Code закатили новую фичу dynamic workflows. Теперь агент сможет брать на себя еще более долгие задачи, выполнение которых может занимать дни: он запускает сотни суб-агентов и управляет ими, корректирует план, проверяет все результаты и так далее. Пока в превью (вот тут отдельный блогпост). Оказывается, именно эту фичу использовали для той самой миграции Bun с Zig на Rust.

– В claude.ai и Cowork теперь можно контролировать усилия модели: больше усилий – глубже ризонинг, меньше усилий – быстрые ответы.

Fast mode для новой модели стал в три раза дешевле.

В целом цена та же, модель уже доступна.

https://www.anthropic.com/news/claude-opus-4-8
2135🤯4316👍13😁5🔥3👏2🐳1
Anthropic оценили почти в 1 триллион долларов

Компания официально объявила о раунде H: они привлекли $65 млрд при оценке в $965 млрд (напоминаем, что еще в феврале их оценивали в 380 миллиардов). И, кстати, OpenAI последний раз оценили в 852 миллиарда.

При этом выручка (ARR) Anthropic перешагнула за 47 миллиардов долларов.
118🤯54👍20🔥13😁9
Data Secrets
Anthropic оценили почти в 1 триллион долларов Компания официально объявила о раунде H: они привлекли $65 млрд при оценке в $965 млрд (напоминаем, что еще в феврале их оценивали в 380 миллиардов). И, кстати, OpenAI последний раз оценили в 852 миллиарда. …
Один из корпоративных клиентов Anthropic случайно потратил за месяц 500 миллионов долларов на токены

Вы не ослышались, пол миллиарда долларов.

Об этом изданию Axios рассказал консультант компании (название компании не раскрывалось). Дело в том, что для сотрудников не были установлены лимиты по использованию, и те сожгли дополнительных токенов буквально на миллионы.

Теперь понятно, откуда у Anthropic такой ARR
1😁254🤯4614104🔥3🗿3🤩2🕊2