Data Secrets
90.2K subscribers
6.93K photos
778 videos
20 files
3.1K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Microsoft опенсорснули проект SkillOpt для оптимизации способностей агентов

Это фреймворк, который фоново улучшает вашего агента через изменение markdown файлов со скиллами.

Это похоже на классический learning loop, но в текстовом пространстве. То есть агент выполняет задачи с текущей версией условного skill.md (это аналог прямого прохода), система легирует все, что тот делает, отмечает ошибки и успешные ответы, а затем на основе этого предлагает небольшие правки в skill (это уже backward pass).

Новая версия md принимается только после прохождения верификации на отдельном сете задач (его можно задать самостоятельно или взять готовый).

Как и в реальном обучении, тут предусмотрено подобие learning rate: чтобы сразу случайно сильно не испортить файл правками, они могут быть только небольшими и должны соответствовать определенным правилам. Так что попробовать инструмент можно довольно безопасно, даже если боитесь за свои md-шки.

Приросты можно посмотреть в большой таблице наверху. Как видите, абсолютно во всех комбинациях моделей и бенчмарков они положительные и заметные, а в Codex и Claude Code на GPT-5.5 средний gain указан вообще как +21.8 и +18.6 соответственно (!).

Статья, код, овервью и инструкции по использованию – все здесь: https://microsoft.github.io/SkillOpt/
89🤯34👍24🔥8😁4
Предлагаем вам поломать голову над задачей с «Рекурсии по городу» Яндекса, которую далеко не все смогли решить

На станциях было много интересных задач на логику и программирование, но сложнее всего оказалась вот эта головоломка с разогрева ⬆️

Никаких специальных знаний здесь не требуется, только смекалка. Решение оказалось настолько нестандартным, что справились с ним буквально единицы из 500 участников. Цель – каким-то образом расшифровать следующее сообщение:

zev sf tbmjg wxvr khyimb zq cebt qewx rvfhyn rwsfsxv etrv mu zqdtb iyhkhnm qzc tbmut ecbte xwrfs


Предлагаем вам тоже попробовать свои силы. Ответ через сутки выложим в комментарии.

P.S. Ни одна модель, которой мы кормили условия, с задачей не справилась.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4617👍11🗿7🔥4😁3🤯2😎1
Data Secrets
Microsoft запретят сотрудникам использовать Claude Code, потому что не тянут косты В декабре компания заключила сделку с Anthropic и активно призывала своих инженеров использовать Claude Code. Долго уговаривать сотрудников, видимо, не пришлось, и инструмент…
После утренней новости про отказ Microsoft от Claude Code выяснилось, что они в своих идеях не одиноки

Операционный директор Uber только что заявил, что «тяжелые траты на ИИ все сложнее оправдать, так как рост потребления токенов не показывает четкой отдачи в потребительских функциях».

Он добавил, что «возможно» в следующих кварталах ситуация выровняется, но пока что потребление токенов просто растет, а полезность относительно этого статистически не увеличивается. Кстати, Uber при этом потратил годовой бюджет на ИИ за первые 4 месяца года.

А еще за некоторое время до этого VP Nvidia заявлял, что для его команды расходы на вычислительные ресурсы уже намного превышают затраты на сотрудников. То есть ИИ становится дороже человеческого труда.

Комментарии про пузырь в студию ⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁298543116👍8🤯2🗿1
Все, Anthropic в конце концов начали генерировать больше выручки, чем OpenAI

The Information насчитали, что сейчас Anthropic, вероятно, генерирует как минимум на 35% больше выручки по годовому показателю, чем OpenAI. И это при том, что еще в первом квартале OpenAI обгоняли Амодеи почти на миллиард.

К концу года разрыв может увеличиться: темпы роста Anthropic скачут, а у OpenAI, наоборот, наблюдается сокращение роста числа пользователей.

Очень скоро обе компании должны выходить в IPO, и если реверс подтвердится, это может стать переломным моментом (особенно для OpenAI).
🔥1367120😁10🤯97🤔6👍3
МТС и НИУ ВШЭ расширяют сотрудничество в сфере искусственного интеллекта и подготовки инженерных кадров. Компания и вуз будут совместно обучать специалистов, которые смогут применять ИИ в работе с современными сетями связи.

На базе Московского института электроники и математики ВШЭ уже запустили мастерскую «Интеллектуальные решения в сетях связи». Студентов научат использовать машинное обучение, анализ данных и backend-инструменты для разработки интеллектуальных систем в телекоме.

В МТС отмечают, что специалистов, которые одновременно разбираются и в радиосети, и в ML на рынке почти нет. В 2025 году рост спроса на ML-инженеров составил 74%, а в телеком-компаниях было открыто более 20 тыс. вакансий с запросом на знание ML-инструментов..

Ранее в совместных ИИ-проектах МТС и ВШЭ уже приняли участие более 350 студентов.
😁5014🗿10👍2🤨2🔥1
Media is too big
VIEW IN TELEGRAM
Google масштабно обновили Colab в стиле AI-first

developers.googleblog.com/en/fully-reimagined-ai-first-google-colab/

Теперь редактор больше похож на Cursor, то есть Data Science агент на основе Gemini (обновленный, кстати) нативно встроен в интерфейс.

Помимо возможности вызова в ячейке появилась строка вызова внизу тулбара, которая открывает агента в окошке справа. И там уже можно обсуждать и запускать с моделью целые пайплайны. Агент при этом видит в качестве контекста ноутбук целиком, и может автономно создавать и запускать ячейки, анализировать файлы, строить графики, обучать модели и так далее.

Еще из приятного – автоматические предложения исправления ошибок в виде диффов прямо внутри ячейки, выглядит удобно.

В скором времени обещают добавить «больше фичей, интеграций и агентов»
🔥9825👍21👏4
SoftBank заложил свои акции OpenAI, чтобы купить еще акций OpenAI

Bloomberg выпустили большой отчет про финансирование OpenAI японским конгломератом во главе с Масаяши Сона. На данный момент они являются уже вторым по величине внешним акционером с долей около 13%. Но для них далеко не все гладко.

На данный момент они подарили OpenAI уже ~$64.6 млрд. Фишка в том, что собственных денег SoftBank тут меньше 30%. Все началось с продажи акций Nvidia: SoftBank полностью продал свою долю в гиганте (а там ее было примерно на 6 миллиардов), чтобы вложиться в Альтмана. Но здесь хотя бы обошлось без долгов.

А дальше они залезли в два кредита. В марте взяли первый: мостовой кредит под 8% на 40 миллиардов долларов. Почти все эти деньги тут же отошли стартапу, а выплатить их SoftBank должен уже через год (видимо, надеются на IPO).

Но этого оказалось мало, и сейчас вскрылось, что в конце апреля был взят еще один кредит на $6 млрд, уже под залог. Самое интересное, что заложили SoftBank те же самые акции OpenAI.

Рискуют они по-крупному. Если IPO вдруг перенесется или оценка OpenAI не вырастет, они попадут в дефолт, будут вынуждены продавать свои активы и потеряют очень много денег. Внутри компании уже нарастает беспокойство, но Сона игнорирует консультантов.

Кстати, с SoftBank уже такое случалось в 2019 году. Тогда они вложились в компанию WeWork, а те провалили IPO и обанкротились. В итоге SoftBank потерял около 10 миллиардов. Разница в том, что на OpenAI они поставили уже в 15 раз больше ☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1482723🤔12👍11🦄6🤯4🔥3
Яндекс Образование и Томский политех собирают студентов на офлайн-студкемп по компьютерному зрению

Две недели на базе ТПУ, с 10 по 23 августа. Очень много практики, нетворка и лекций от инженеров Яндекса, исследователей университета. Разберетесь с современным стеком CV, будете решать задачи на реальных исследовательских данных и работать над собственным проектом.

Всем, кто пройдет отбор, Яндекс Образование оплатит проезд и проживание. Для тестового пригодятся Python, базовые библиотеки numpy, pandas, PyTorch и OpenCV, понимание линейной алгебры, теории вероятностей и матстата. 

Заявки принимают до 14 июня — успевайте зарегистрироваться по ссылке.
👍155😁5🤯2🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic выпустили новый плагин для Claude Code, который будет проверять код на уязвимости прямо во время редактирования

По сути, это security-хук, который срабатывает при записи и редактировании файлов. Цель состоит в том, чтобы часть проблем отлавливались до PR, и Anthropic пишут, что при конечном ревью количество пойманных проблем действительно сокращается благодаря плагину до 40%.

Помимо отлова явных уязвимостей плагин также умеет сигнализировать о небезопасных паттернах кода в целом, а также следит за тем, чтобы агенты не трогали чувствительные файлы.

Доступно для всех пользователей бесплатно. Команда для установки:

/plugin install security-guidance@anthropics-claude-code

www.claudepluginhub.com/plugins/anthropics-security-guidance-plugins-security-guidance-2
1🔥10321👏12👍73❤‍🔥2🤯2
Boston Dynamics учат робота играть в футбол

В честь начала чемпионата мира 2026 они решили запустить целую кампанию под названием «School of Football». Гуманоида Atlas собираются учить игре end-to-end, от ударов по мячу и работы ног до празднования голов.

Atlas оказался не промах и уже научился бить рабону
🔥106😁241410
Яндекс выпустил Alice AI LLM Flash для бизнеса

Новая языковая модель Alice AI LLM для B2B сегмента оптимизирована под задачи, связанные с обработкой текстов и документов: модерацию контента, техподдержку, поиск по базам знаний и работу с массовыми запросами.

Что известно о модели:


– Она позволяет решать типовые b2b-задачи почти в 5 раз дешевле по сравнению с предыдущими решениями Яндекса;

– По данным компании, в 56% бизнес-сценариев модель показывает результаты лучше, чем GPT-5.4 mini;

– Отдельно отмечаются хорошие результаты в диалогах, структуризации текста и поиске информации по документам;

– Модель ориентирована на high-load сценарии, где важны скорость ответа и низкая стоимость обработки;

– Модель уже доступна бизнесу на платформе Yandex AI Studio.

Кроме того, компания также открыла доступ к DeepSeek V4 Flash — первой доступной в России облачной модели с контекстным окном в 1 млн токенов. Её предлагают использовать для ИИ-агентов, анализа больших документов и сложных многоэтапных задач.
😁117🗿4020👍11🔥4🤔2💯1
Sakana AI предложили способ обучать большие модели по частям

Они выпустили статью про так называемые Diffusion Blocks, в которой показали, как можно обучать модели не целиком, а блоками.

Вообще, в стандартном обучении необходимость гонять данные через все слои сетки и затем гнать обратно градиенты довольно проблематична. В памяти нужно держать промежуточные состояния всех слоев, с углублением модели память сильно разрастается, и это барьер для масштабирования.

Если взглянуть на диффузионные модели, то там все иначе. Они обучаются как бы постепенному очищению шума до нужного ответа, и разные уровни шума (когда модель учится убирать шум при конкретном уровне зашумления) можно обучать относительно независимо.

Ученые из Sakana базируют свою механику как раз на идее диффузии. По сути, прохождение сигнала через блоки сетки тоже можно рассматривать как очищение от шума: каждый слой учится приближать сигнал к ответу.

И тогда получается, что по аналогии с диффузионными моделями мы можем обучать разные маленькие денойзеры отдельно. Технически, сеть делится на несколько блоков, каждому из которых назначают свой диапазон шума. Проще говоря, блок учится проходить определенную часть пути от шума к ответу.

Если в сети N блоков, то при обучении это дает примерно N-кратную экономию памяти. При этом авторы утверждают, что качество на тестах получается сопоставимым с end-to-end обучением.

Большой интерес тут, конечно, представляет файнтюнинг. На практике этот метод был бы невероятно полезен именно для дообучения, но для этого нужно как-то научиться конвертировать большие предобученные модели в DiffusionBlocks. Собственно, исследователи обещают этим заняться.

Блогпост | Статья
👍50🔥2517😁1🤔1🤯1
Используя идеи ИИ, ученые опровергли известную гипотезу сумм-произведений для действительных чисел

Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное решение найдено, но ИИ удалось найти абсолютно новое бесконечное семейство конфигураций, которое опровергло эту версию.

Если хотите почитать подробнее, мы писали об этом здесь: t.me/data_secrets/9265.

Основная фишка решения заключалась в альтернативном подходе, который люди до этого не замечали. Модель связала геометрическую задачу с алгебраической теорией чисел, и использовала в решении башни полей классов.

Ученые сразу обратили внимание на этот трюк. И вот, используя те же башни полей, группа математиков буквально вчера опровергла еще одну известную гипотезу.

Вот их статья: arxiv.org/pdf/2605.28781. В ней они прямо пишут, что "вдохновились на повторное рассмотрение возможности
опровержения гипотезы благодаря изобретенному в OpenAI контрпримеру для задачи о единичных расстояниях".


Кстати, в ходе работы авторы также использовали GPT-5.5 Pro, но пишут, что финальное доказательство все-таки получили самостоятельно.
🫡5021👍13🔥10😁3
Data Secrets
Используя идеи ИИ, ученые опровергли известную гипотезу сумм-произведений для действительных чисел Совсем недавно OpenAI объявили, что их внутренняя модель нашла лучшее решение для известной задачи Эрдеша о единичном расстоянии. Люди 80 лет считали, что оптимальное…
Ведущий ученый из OpenAI Ноам Браун считает, что ИИ может в целом улучшить математические способности людей

Вот так он прокомментировал новость выше о том, что люди переняли подход ИИ для опровержения известной гипотезы:

"После появления AlphaGo навыки игроков в Go заметно улучшились. Подозреваю, что мы увидим аналогичную закономерность и в математике".


Феномен AlphaGo действительно существует: после победы над Ли Седолем люди стали наследовать у нее тактики, а некоторые лучшие игроки вроде Кэ Цзе даже в целом изменили стиль игры. Браун считает, что математиков ждет примерно то же самое: ИИ открывает новые пути, которые люди затем могут переиспользовать в собственных доказательствах (что, собственно, и произошло).
94🐳21👏20🔥16😁8🗿2
😳Цены на серверы растут снижаются каждую секунду

Selectel проводит аукцион выделенных серверов: скидки доходят до 35%, а иногда появляются СуперЛоты со скидкой до 80%. Если успеете арендовать раньше других, выгодная цена сохранится за вами навсегда 🔥

Почему стоит арендовать выделенный сервер в Selectel?
- Безлимитный бесплатный интернет со скоростью 1 Гбит/сек,
- Защита от DDos атак входит в стоимость аренды,
- Полное соответствие стандартам 152-ФЗ.

➡️Арендуйте выделенный сервер от Selectel со скидкой, пока это не сделал кто-то другой: https://slc.tl/8ihz3

Реклама. АО "Селектел". erid:2W5zFHN8k7s
😁52🤨26🗿1451🤯1
Ждем Opus 4.8 сегодня?
🤯95😁2286🔥421🤔1
Data Secrets
Ждем Opus 4.8 сегодня?
Claude Opus 4.8 здесь

Посмотрите на этот невероятный показатель в 69.2% на SWE Pro. Anthropic пишут, что модель еще лучше работает с длинными тасками, в 4 раза чаще замечает и исправляет собственные ошибки и более надежно следует инструкциям.

Кроме того:

– В Claude Code закатили новую фичу dynamic workflows. Теперь агент сможет брать на себя еще более долгие задачи, выполнение которых может занимать дни: он запускает сотни суб-агентов и управляет ими, корректирует план, проверяет все результаты и так далее. Пока в превью (вот тут отдельный блогпост). Оказывается, именно эту фичу использовали для той самой миграции Bun с Zig на Rust.

– В claude.ai и Cowork теперь можно контролировать усилия модели: больше усилий – глубже ризонинг, меньше усилий – быстрые ответы.

Fast mode для новой модели стал в три раза дешевле.

В целом цена та же, модель уже доступна.

https://www.anthropic.com/news/claude-opus-4-8
165🤯209👍4😁3🔥1👏1👨‍💻1