Data Secrets
89.8K subscribers
6.84K photos
753 videos
20 files
3.05K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
В Москве пройдет большой офлайн-квест для разработчиков, где нужно будет «починить» сломанную реальность

23 мая Яндекс запускает «Рекурсию по городу» – CTF-приключение прямо на улицах Москвы.

Вы с командой находите архив с кодом большого проекта и дневником неизвестного разработчика. Оказывается, что релиз сломан, и система ушла в бесконечную рекурсию. Ваша цель – решить загадку этого бага и собрать рабочую версию, решая задачки на разных локациях.

30+ локаций с задачами по всей Москве: где-то угадываете ключи к серверу, где-то ищете геопозицию с помощью команд в терминале, где-то едете ловить специального агента по видео из Телемоста. Тем интереснее, что маршрут и стратегию вы определяете сами (оптимизация пути – часть квеста). При этом все локации выбраны так, чтобы познакомить (или вызывать ностальгию) участников с инженерной культурой Москвы: от офиса «Демоса», первого массового интернет-провайдера России, до Красной Розы и Политехнического музея.

Можно просто кайфануть вечером в городе, и при этом порешать что-то нетривиальное. На финише вас ждет финальный merge и награждение победителей, а после – вечеринка.

Старт – 23 мая в 17:00. Команды 2–5 человек: если у вас нет своей, вам помогут сформировать её на старте.Участие бесплатное, но нужно зарегистрироваться. Не пропускайте, будет весело 💃
😁4222🗿19🤯6👾321🔥1😎11
Data Secrets
OpenAI изобрели способ отвоевать у Anthropic хотя бы часть enterprise рынка Сейчас Anthropic максимально быстро отъедает долю у OpenAI. Пишут, что они забирают более 70% бюджетов компаний, которые впервые закупают AI‑инструменты. Поэтому OpenAI пошли на рискованный…
OpenAI и Anthropic одновременно запустили крупные совместные предприятия (joint ventures) для привлечения enterprise клиентов

Примерно в конце марта мы писали о том, что и OpenAI, и Anthropic ведут переговоры с PE фондами по созданию так называемых joint ventures. В общем, вели они, вели, и буквально в один день открыли каждый свой JV-проект.

Суть в обоих случаях в том, что фонд вкладывается в организованное совместное предприятие, и в его рамках стартап разворачивает свое решение в портфельных компаниях фонда.

При этом фонд получает доходность и долю в юрлице (плюс приоритетный доступ к новым разработкам стартапа). А стартап – новых корпоративных клиентов и инвестиции.

Различие между подходами OpenAI и Anthropic – только в условиях для инвесторов (ну и в самих инвесторах).

OpenAI, так как им нужно очень активно осваивать корпоративный рынок и буквально зубами его вырывать у Anthropic, предлагают более жирные условия: аж 17.5% гарантированной минимальной доходности. Они планируют получить 4 миллиарда от 19 инвесторов при оценке JV в 10 миллиардов.

Осталось им с Anthropic еще об IPO объявить в один день. Кстати, ради IPO вся эта JV история и затевается, в обоих случаях.
2😁7628👍105🔥21
Сооснователь Anthropic Джек Кларк утверждает, что само-развивающийся ИИ с 60% вероятностью появится уже к концу 2028 года

Другими словами, по его мнению, ИИ системы совсем скоро смогут рекурсивно создавать и улучшать самих себя.

Статья: importai.substack.com/p/import-ai-455-automating-ai-research

Это не просто догадка: его оценка основана в большей степени на анализе прогресса на бенчмарках.

Например, на CORE-bench, где нужно имплементировать научные статьи (а из подобной работы и рождается основной прогресс в AI рисерче), агенты уже выбивают >95%. Или MLE-bench, где нужно решать ML-задачи с Kaggle и обучать модели для конкретных задач, – решен на 65%.

Параллельно растет продолжительность задач, которые модели могут выполнять автономно + количество индустриальных проектов, где ИИ уже неплохо выполняет какие-то крупные задачи AI-инжиниринга, типа проектирования чипов.

Учитывая темпы развития, совсем скоро есть шанс перейти к тому, что автор называет «end-to-end автоматизацией». ИИ перестанет быть инструментом для отдельных задач, и будет сам ставить цели, дизайнить эксперименты и действовать. Короче говоря, возьмет на себя R&D полностью.

Мне трудно осознать масштаб происходящего. Я делюсь этим, потому что, трезво проанализировав данные, пришел к выводу: то, что десятилетиями казалось научной фантастикой, становится реальностью. Вероятно, мы на пороге фундаментальных перемен, к которым общество может быть попросту не готово.
295👍32😁24🤔20🔥1010🗿9🦄4👌1
Дмитрий Ушанов - новый руководитель AI-центра Т-Банка. В команде он уже более 2,5 лет: пришёл на позицию Head of ML и отвечал за сквозное внедрение машинного обучения в продукты компании.

За это время Дмитрий вместе с командой дообучил и запустил семейство open-source LLM моделей, адаптированных для русского языка, улучшил ML-скоринг в системе антифрода и усилил рекомендации и поиск в разделе «Шопинг».

Теперь команда сосредоточится на создании общей AI-инфраструктуры и построении внутренней LLM-платформы — чтобы любой сотрудник Компании мог создавать новые инструменты на единой технологической базе.

Вторая ключевая задача — разработка внешних AI-продуктов, включая AI-ассистентов, которые будут работать и за пределами экосистемы компании, и предназначаться не только её клиентам.

В компании считают, что ИИ — это не отдельная функция, а способ работать. Желаем Дмитрию успехов на новой позиции.
2107👍63🗿61😁23🤨18🔥6🤔4🤯111
Мы?
😁349🔥3422💯11🤔9👍721
Маск пообещал сделать Альтмана и Брокмана «самыми ненавидимыми людьми в Америке»

Так он ответил Брокману после того как тот накануне суда предложил ему взаимный отказ от претензий:

К концу этой недели вы с Сэмом станете самыми ненавидимыми людьми в Америке. Если вы будете настаивать, так и случится.


Это произошло в личной переписке за несколько дней до суда. А теперь OpenAI приобщают эту переписку к делу в федеральном суде. Их юристы используют ее как доказательство того, что преследования Маска сводятся к личной обиде на Альтмана и Брокмана, и он организует масштабную публичную компанию против них, а не просто суд.
165😁32🤩2115🔥4🍓2👍1🤓1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
Wildberries & Russ проведет Inside AI Meetup 20 мая в Москве и онлайн

Будут реальные кейсы:
— Высоконагруженная модерация с векторным поиском
— AIOps-подходы к управлению ML-сервисами
— Практики построения RAG-систем
— Тонкости реранкинга
— Реальные этапы запуска LLM-продуктов и еще многое другое.

Среди спикеров эксперты Wildberries & Russ, MWS, Avito, Сбера, Альфа-Банка, red_mad_robot.

Советуем ивент для senior ML/AI инженеров, MLE, DS, инженеров платформ и для всех, кто строит или масштабирует AI-системы в продакшене.

Регистрация и прочие подробности — по ссылке. Приглашайте коллег.
🗿489🤔9😁8🔥3🤯3👍2👨‍💻1
Создатели SWE-bench представили новый бенчмарк по программированию, на котором абсолютно все современные модели выбивают ровно 0%

Он называется ProgramBench, и суть его проста: агент получает только скомпилированный исполняемый бинарник и документацию, и его задача – спроектировать код, который при сборке будет полностью соответствовать поведению исходного файла (без доступа к Интернету).

При этом агент должен самостоятельно определиться с архитектурой и выбрать структуру проекта. Собственно, здесь сложности и начинаются: LLM хорошо умеют писать плоский код в одном файле, а вот с многофайловыми проектами, где нужна низкоуровневая логика, работают плохо.

Итог: даже результат Claude Opus 4.7 и GPT-5.4 – это полный ноль.

Кажется, у нас новый претендент на звание самого интересного бенчмарка.

https://programbench.com/
🔥306😁102👍5121🗿12🕊2🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
Калистеника от Boston Dynamics

Новое вирусное видео робота Atlas они выложили с подписью:

Балансировать коммерческие цели и исследования в робототехнике непросто, но с Atlas мы заставляем это работать.


Кстати, вполне возможно, что экземпляр на видео уже работает но основе Gemini Robotics от Google. Компании заключили партнерство в начале года, и теперь совместно работают над новым поколением гуманоидов.
🔥13031🤯207😁5👏4👍3
14 мая Газпромбанк.Тех проведет технологическую конференцию ГПБ КОНФ!

На одной площадке встретятся представители ИТ, инноваций, науки и обсудят, как сегодня запускать и масштабировать сложные решения в финтехе.

Что ждет участников?

Два трека программы:
- Как Акселератор Газпромбанк.Тех становится агентом технологических изменений
- Какие инженерные решения создаются внутри банка

Реальные кейсы:
- Как стартапу зайти в пилот с крупным банком
- Что отличает «демо» от промышленного внедрения
- Какие требования по безопасности, данным и масштабированию у корпоративного заказчика

А еще нетворкинг по делу: возможность пообщаться с командами акселератора и экспертами банка и презентовать свои проекты.

Когда: 14 мая 2026 в 12:00
Где: Москва, Конгресс-центр Connect

Регистрация открыта по ссылке

Реклама. Рекламодатель «Газпромбанк» (Акционерное общество)
ИНН: 7744001497
🗿207😁6🔥5🤯53👍2🤨2
Стартап Subquadratic анонсировал языковую модель SubQ с контекстным окном 12М токенов

Это не все: она также выдает невероятную скорость в 150 токенов/сек, обгоняет Claude Opus 4.6 на SWE-bench, и при этом ее стоимость составляет 5% от стоимости Opus (прочитайте это снова).

Секрет SubQ, как говорят создатели, в архитектуре. А точнее, в использовании нового вида механизма внимания – sub-quadratic sparse-attention. Идея в том, чтобы вычислять внимание только по разреженному набору наиболее важных связей, а не по всей матрице целиком.

Метод позволяет достичь линейной (!!!) вычислительной сложности относительно длины контекста и на длинных контекстных окнах достигает ускорения в 52 раза относительно FlashAttention.

Звучит как полный прорыв в экономике инференса. Но, как обычно, есть нюанс: пока все эти громкие заявления живут только на словах.

Проект находится в закрытой бете, техрепорта нет, доступов нет. Пока выложили только небольшой блог и разбор их механизма внимания.

Посмотрим, что из этого выйдет
😁13375🤯43189🤔8👍2🤩1👨‍💻1
Nvidia и один из крупнейших застройщиков США PulteGroup в сотрудничестве со стартапом Span будут устанавливать мини-датацентры на стены новых домов

Чего только не придумаешь, когда нужен компьют для ИИ. Кто-то предлагает строить датацентры в космосе, а вот в стартапе Span придумали концепцию распределенного дата‑центра, расбросанного по тысячам жилых домов.

В партнерстве с Nvidia и PulteGroup они прямо сейчас тестируют XFRA – небольшие вычислительные узлы, которые размещаются снаружи домов и состоят из ~ 16 GPU Blackwell. Умный электрощит Span следит, сколько энергии потребляет дом, и остаточную свободную мощность отдает XFRA на ИИ-нагрузки.

При этом владелец будет получать огромную скидку на тарифы электричества (и, вероятно, платить даже меньше, чем без XFRA) + дополнительный доход.

Фишка в том, что установить много таких ящичков – быстрее и дешевле, чем строить огромный датацентр (по расчетам Span, примерно в 5-6 раз). Так что идея неплохая, не считая рисков, стоимости обслуживания и, конечно, необходимости сложной инфры под все это дело.

К 2027 году Span с этим проектом планирует выйти на гигаваттный масштаб.
👍121👏25🔥15😁108🤯7😎621
DeepSeek ведет переговоры о первом раунде внешнего финансирования

Компания планирует привлечь $3–4 млрд при оценке до $50 млрд, как сообщает Reuters.

Правда, большинство денег, скорее всего, все равно вложит государство. А точнее, Китайский национальный фонд искусственного интеллекта. Кроме того, принять участие в раунде может Tencent Holdings.

Напоминаем, что DeepSeek ранее отказывался от внешних инвестиций, но теперь, судя по всему, меняет стратегию.
61👍22🔥13😁7
This media is not supported in your browser
VIEW IN TELEGRAM
Yandex ML Challenge — новое соревнование с задачами по ИИ и финалом на Young Con 2026

Кого ждем:

Студентов, выпускников и учеников 11-х классов — тех, кто любит решать соревнования по машинному обучению

Что нужно знать:
На длинном онлайн-туре вас ждут 3 задачи: CV (компьютерное зрение), LLM (большие языковые модели) и RL (обучение с подкреплением).
Регистрируйтесь сейчас и приступайте к задачам 21 мая в 16:00 мск

Таймлайн:
С 21 по 31 мая — длинный онлайн-тур, где определим топ-100 финалистов с самым высоким суммарным рейтингом

25 июня состоится очный финал на Young Con 2026: масштабном фестивале о технологиях и старте карьеры в IT

Победителю соревнования достанется приз в размере 1 млн рублей.
А топ-15 финалистов получат набор умных устройств от Яндекса.

Регистрация открыта
🗿25😁22👍5🤯32🔥1
Gemma-4 теперь умеет предсказывать токены не по одному, а партиями

Google только что выпустили Multi-Token Prediction (MTP) драфтеры. Это штука, которая позволяет Gemma-4 предсказывать сразу несколько токенов вперед.

Обычно LLM генерируют строго по одному токену за шаг, и это одна из главных проблем архитектуры трансформеров, потому что работает медленно.

Что сделали Google:

– Они взяли еще одну модель, крошечную, обучили ее на задаче multi-token prediction, и поставили на роль drafter. Называется так, потому что эта модель пишет черновики, то есть пытается угадать действия большой модели на несколько токенов вперед.

– Батч черновых токенов проверяет основная модель. Фишка в том, что на проверку нужен всего один проход (вместо нескольких, если бы модель генерировала все эти токены сама).

– Если в черновой последовательности попадается ошибка, то: (1) этот токен заменяется на тот, который большая модель считает верным; (2) проверка прерывается и дальше драфтер предсказывает новую партию с этого места.

Например, мы сгенерировали 5 черновых токенов. Три перых совпало, четвертый заменили. Всего сэкономили три прохода большой модели.

Итог: MTP ускоряет генерацию примерно в 3 раза вообще без потерь в качестве. Все драфтеры выложили, так что уже можно попробовать погенерить что-нибудь в таком режиме.

blog.google/innovation-and-ai/technology/developers-tools/multi-token-prediction-gemma-4/
5👍137🔥5419🤔5🤯5😁3