Data Secrets

Директор робостартапа Figure AI объявил, что они произвели столько роботов, что их количество превзошло количество людей в компании 😐

Интересно, они Терминатора вообще смотрели?

Please open Telegram to view this post

VIEW IN TELEGRAM

195😁122🗿17❤11🔥7👍6🍓33💯2☃1

24.2K views07:48

Data Secrets

Феномен GLM-5.2

Кажется, Z.ai – это новый DeepSeek. По крайней мере, их свежая модель GLM-5.2 навела не меньше шума, чем R1 в свое время.

Это реально опенсорс нового уровня: на арене модель обошла Opus 4.8 на кодинге, а на Design Arena (приготовьтесь) забрала первое место у Claude Fable 5.

Плюсом контекст до 1М токенов и отличные показатели при работе с длинными многошаговыми задачами.

Три варианта, как попробовать модель:

1. Если вдруг вы – обладатель 8хH100, то можете запустить локально, веса лежат вот тут под лицензией MIT.

2. В чате chat.z.ai, но только по подписке GLM Coding Plan.

3. Самый простой и дешевый вариант: в API. В нашем сервисе DS Lab API цена на GPM-5.2 прямо сейчас снижена в два раза, до 25 июня она ниже, чем у официального провайдера. Пользуйтесь: dslab.tech/ai/models/llm/glm-5.2

❤150🔥67🤯33👍17🗿13😁10😎7🤔6🎄4⚡2😍1

23.1K viewsedited 15:13

Data Secrets

Sakana AI выпустили в общий доступ систему оркестрации агентов Fugu. В некоторых конфигурациях она превосходит Fable 5.

Sakana Fugu была анонсирована еще в апреле, мы подробно о ней писали вот тут: t.me/data_secrets/9104. Два месяца система провела в бете, и вот, наконец, ей можно свободно пользоваться.

https://sakana.ai/fugu/

Сама по себе Fugu является небольшой языковой моделью, которая обучена вызывать другие LLM. То есть вместо того чтобы вручную прописывать механизмы, роли и рабочие процессы моделей (как это обычно делают), Sakana обучили модельку, которая хорошо умеет решать, кого вызвать, в какой роли и с какими подзадачами – и делает это адаптивно под конкретный запрос. Если интересно закопаться в механику, то почитайте вот эти две статьи: Trinity и Conductor.

По поводу оплаты. Если вы используете обычный Fugu, то платите только за одну используемую топовую модель, . Fugu Ultra – тот самый, который обгоняет Fable и Mythos – стоит $5/$30 за миллион input/output. Плюс есть подписки.

В общем-то, довольно демократично. Ну и бенчмарки красивые. Надо пробовать.

❤78👍34🔥15😁8🍾3🗿3⚡22🤯1💯11

21.9K views07:13

Data Secrets

Потокенмаксили и хватит?

😁27338😎15🔥9❤5🕊2🍓2😍1💯1

21K views11:05

Data Secrets

⚡️ Обновления в DS Lab API: Fugu Ultra и новые цены

➖ Добавили Sakana Fugu Ultra. Модели пока нет даже на OpenRouter. Цена: 500 ₽ / 3000 ₽ за 1M входных и выходных токенов.

➖ Снизили цены на DeepSeek V4 Pro. Теперь 43 ₽ / 87 ₽ вместо 191 ₽ / 382 ₽ за 1M входных и выходных токенов.

➖ До 1 июля DeepSeek V4 Flash доступна на 50% дешевле официальных цен. Стоимость составляет 4 ₽ / 8 ₽ за 1M входных и выходных токенов.

Пробуйте: dslab.tech/ai

Please open Telegram to view this post

VIEW IN TELEGRAM

❤50👍28🤯10🔥9🤨7🗿5🤩2🕊1🎄1

19.6K views15:03

Data Secrets

Интересно. Google DeepMind заключили партнерство с киностудией A24

Это та студия, которая выпустила «Марти Великолепный», «Все везде и сразу» и «Закулисье реальности».

Google вкладывают в них 75 миллионов долларов и объявили, что будут вместе заниматься разработкой ИИ-технологий для всех этапов производства кино.

Ждем Gemini Omni Pro…

2❤118👍31🔥22🗿8🤯4☃3🍾2🆒1

20.4K viewsedited 17:56

Data Secrets

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Два твита == минус 250 миллиардов долларов

После того, как о своем уходе из DeepMind в OpenAI и Anthropic объявили два ключевых сотрудника (Ноам Шазир и Джон Джампер) акции компании упали аж на 6%. Это один из худших дней акций Alphabet за последний год.

F 😐

Please open Telegram to view this post

VIEW IN TELEGRAM

😁15274🤯15❤14🐳5🔥3💯3😎32🏆1

19.1K views06:45

Data Secrets

Выбираем железо для обучения и инференса моделей 🔝

Простая формула: чем больше у модели параметров, тем более мощное железо нужно для ее инференса. Найти решение для нейросетей разного масштаба можно в Selectel.

Более 15 моделей видеокарт — от RTX 4090 до B300 — доступны к аренде в облаке и на выделенных серверах. Облачные серверы подойдут для тех, кому нужна гибкость и быстрая масштабируемость, а выделенные — когда необходима физическая изоляция инфраструктуры, а нагрузки стабильные. Видеокарты в облаке можно арендовать даже на час, цена стартует от 5 рублей.

Выбирайте оптимальный сервер с GPU и арендуйте его от 5 рублей в час: https://slc.tl/aitoq

Реклама. АО "Селектел". erid:2W5zFJumeY9

❤12🤨6🔥4🐳4🗿3😁1🏆1🍓1😎1

18.8K views08:02

Data Secrets

Обновленная GPT‑5.5‑Cyber обошла Mythos на поиске уязвимостей в коде

openai.com/index/daybreak-securing-the-world/

OpenAI объявили, что выводят модель из превью, и теперь партнерам и отдельным кибербезопасникам будет доступна полная версия GPT-5.5-Cyber.

На CyberGym – основном крупном бенче по работе с уязвимостями – модель набрала 85.6%. Mythos на нем же набирает 83.8%.

Самое интересное, что в списке партнеров, которым предоставляется модель, фигурируют не только американские компании. Наверное, правительство США должно это ограничить, как и в случае с Anthropic. Правда? Правда же?…

😁319🤯32🔥19👍9❤6☃4👌44🍾2🍓1🤗1

21.4K views09:19

Data Secrets

Мы

Не отрицайте

😁516❤76🔥30💯1717👍3🫡3☃2🤯2🍾2🆒1

20.8K views13:32

Data Secrets

Почему AI не ускорил разработку в 10 раз

Последние два года все обсуждают, как агенты пишут код. Но в реальных больших продуктах выясняется неожиданная вещь: даже после массового внедрения AI ускорение часто составляет не иксы, а только десятки процентов. Встает вопрос: почему?

Вот тут нашли совсем свежий интересный доклад на эту тему. Выступает Артур Василов, руководитель мобильной разработки Яндекс Браузера. Он рассказал, что они разными способами измеряли эффекты от ИИ, и увидели похожую картину: да, разработчики действительно работают быстрее, но нет, революции пока не произошло.

Причина в том, что кодинг – лишь одна часть большого конвейера. Помимо него есть менеджеры, дизайн, тестирование, кодревью, релизы и множество других этапов. Если ускорить только написание кода, узкое место просто смещается дальше по цепочке.

Поэтому глобально новый тренд в бигтехах, в том числе в Яндексе, не столько на ИИ-агентов как ассистентов, сколько на автоматизацию целых процессов. Команда выделяет повторяющиеся инженерные задачи, которые раньше никто не автоматизировал из-за высокой стоимости разработки, и автоматизирует их с помощью ИИ.

Например, в Яндексе куча людей работают над конфликтами и ошибками при выходе новых версий Chromium. Раньше почти вся эта работа выполнялась вручную. Теперь для таких сценариев строятся специализированные AI-пайплайны, которые помогают разбирать и исправлять подобные проблемы автоматически.

Именно в автоматизации вот таких больших кусков инженерной рутины и лежит основной резерв для ускорения разработки, и это уже действительно будет ускорение в разы.

🤔93❤28🗿26👍23💯6🤨5🤯3🔥2☃1🕊1🆒1

20K views16:12

Data Secrets

Ходят слухи, что Anthropic собираются выпускать новую модель

Пару дней назад какие-то инсайдеры говорили, что у них якобы уже готов Mythos 5.1 и соответствующая версия Fable, но по понятным причинам эти модели пока будут жить только внутри стартапа.

Теперь пишут, что на этой неделе антропики собираются выпускать Sonnet 5: модель уже заметили в логах у некоторых провайдеров. Ожидаем 1М контекста, хорошие показатели в кодинге и выгодное соотношение цена/качество.

Решили долго не горевать, дистиллировать Fable в "Sonnet 5" и выпустить заново 👨‍🦯

Please open Telegram to view this post

VIEW IN TELEGRAM

😁267❤54👍2414😎3🤔2👌1💯1🎄1

19.7K viewsedited 17:16

Anthropic выпустили Claude Tag, и Андрей Карпаты назвал это третьим мощным редизайном UX в истории LLM

Теперь Claude можно добавить как члена команды в канал Slack, вызывать его через @ и делегировать ему задачи.

Он тут же пойдет выполнять таску и вернется с результатами в тот же чат, где можно продолжить диалог и смерджить готовый код, не отрываясь от основной переписки с коллегами. Причем разговор с Claude может перехватить любой человек из канала. Пример ⬆️

Обновление создано для более проактивного и бесшовного стиля работы агента. По словам Anthropic, теперь 65% кода внутри стартапа создается именно благодаря внутренней версии Claude Tag.

www.anthropic.com/news/introducing-claude-tag

А Андрей Карпаты написал про Claude Tag следующее:

Это новая парадигма для взаимодействия с Claude. Имхо, это 3-й крупный редизайн LLM UIUX. Первый заключался в том, что LLM - это веб-сайт, на который вы заходите; второй – в том, что это приложение, которое вы загружаете на свой компьютер. Третий же про то, что это автономная, стойкая, асинхронная сущность с общеорганизационными инструментами и контекстом, работающая вместе с командами людей. Понимание этого займет некоторое время, но это работает, и это потрясающе.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥141❤52🤯20🔥18😁12🤔9👍84⚡3🎉1🦄1

20.6K viewsedited 07:09

Data Secrets

Многие ML-инженеры (инженеры машинного обучения) сталкиваются с одной и той же ситуацией: опыта становится больше, задачи — сложнее, а следующий карьерный шаг так и не происходит

Специалист уверенно работает с моделями, строит пайплайны (конвейер обработки данных), участвует в экспериментах, решает задачи своей команды. Но вакансии уровня ведущего специалиста или руководителя команды требуют опыта с системами и направлениями, которых в текущем проекте просто нет.

Поэтому многие делают ставку на дальнейшую специализацию: изучают новые архитектуры, глубже погружаются в модели и совершенствуют текущие навыки.

Но проблема в том, что переход на следующий профессиональный уровень часто связан не столько с углублением существующих компетенций, сколько с их расширением.

На более высоких позициях ценится не только умение обучать модели, но и понимание прикладных ML-систем: рекомендательные системы, ранжирование, эксперименты, MLOps (сопровождение машинного обучения), динамическое ценообразование и другие прикладные задачи, напрямую влияющие на продукт и бизнес.

Поэтому дополнительное обучение для опытных специалистов часто становится способом получить опыт в областях, до которых сложно дотянуться в рамках текущего проекта.

Этой задаче посвящен курс Валерия Бабушкина «Продвинутое машинное обучение» от karpovꓸcourses. Его особенность в том, что программу не обязательно проходить целиком. Можно выбрать только те блоки, которые нужны именно сейчас: рекомендательные системы, ранжирование, MLOps, A/B-тестирование, uplift-моделирование (моделирование прироста эффекта) или динамическое ценообразование.

Такой формат позволяет изучать только те компетенции, которые действительно нужны для следующего карьерного шага, экономя и время, и ресурсы на лишние учебные блоки.

Выберите направления, которых сейчас не хватает для интересующих вас ролей, а по промокоду JUNML15 получите скидку 15%: https://clc.to/erid_2W5zFJD9PUm

Реклама. ООО «КАРПОВ КУРСЫ». ИНН 7811764627. erid: 2W5zFJD9PUm

😁56❤15🤨14🗿1065👍4🦄33🔥2🆒1

15.5K views10:42

Data Secrets

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

GLM-5.2 теперь можно запустить локально

Unsloth сделали отличные GGUF 2-bit и 4-bit. Модель 2-bit сохраняет ~82% точности модели и при этом уменьшает потребление памяти на 84%. Запускается на 256GB Mac.

Можно взять даже 1-bit, и все равно будет норм. На простом примере по сравнению с Claude 4.8 Opus и GPT-5.5 модель ведет себя удивительно хорошо ⬆️

huggingface.co/unsloth/GLM-5.2-GGUF

Инструкция по запуску

Please open Telegram to view this post

VIEW IN TELEGRAM

🕊86❤48👍28🔥21😁7🤨6🤔4🍾3☃1💯1🫡1

17K views11:48

Data Secrets

Топовая работа для инженера 🥰✋🤚

😁106🍓22🔥64❤3👍1😍1🆒1

13.7K views14:04

Data Secrets

⚡️

OpenAI сделали собственный чип

Архитектура разработана с нуля вместе с Broadcom, а назвали чип Jalapeño. Предназначен халапеньо специально для инференса LLM и соответсвующих систем а-ля Codex.

Сейчас чип проходит стадию тестирования, но ранние внутренние замеры уже показали, что он перформит лучше текущей SOTA на целый ватт.

openai.com/index/openai-broadcom-jalapeno-inference-chip/

Please open Telegram to view this post

VIEW IN TELEGRAM

2❤75🤯23👍12😁10👏2🍾2🔥1😎1

12.2K viewsedited 15:05

Data Secrets

Авито открыли набор на две магистратуры по ML, разработанные совместно с МФТИ и ВШЭ

Самые интересные образовательные программы получаются, когда бигтех приходит в университет не только с финансированием, а еще и с собственными задачами, данными и экспертами. И это как раз случай Авито.

Прямо сейчас открылась отличная возможность поступить в их магистратуры на ML-программы «Прикладное машинное обучение и анализ данных» с МФТИ и «Машинное обучение в цифровом продукте» с ФКН ВШЭ. В основе программ – реальные кейсы компании, а часть занятий будут вести действующие специалисты Авито. Всего в подготовке материалов участвовали более 300 сотрудников.

Стек довольно широкий: это и классический ML, и компьютерное зрение, и рекомендательные системы, и аналитика, и генеративный ИИ. При этом речь идет не про абстрактное изучение алгоритмов, а про применение всего, что вы проходите, в продуктовой среде.

Отдельный плюс: поступать можно из любого региона России. Ждут всех, кто готов всерьез погружаться в ML и перенимать знания из первых рук, от практикующих специалистов.

Подробнее о программах:
– «Машинное обучение (ML) в цифровом продукте» в ФКН НИУ ВШЭ
– «Прикладное машинное обучение и анализ данных» в МФТИ

😁28🗿12❤7👍4🤯3🤨2⚡1🔥1🎉1🆒1

10.7K views16:02

Data Secrets

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Когда языковые модели читают текст, они не просто обрабатывают токен за токеном. В каком-то смысле они испытывают от чтения эмоции.

www.goodfire.ai/research/stories-in-space#

Рисерчеры из GoodFire продолжают исследовать так называемую геометрию LLM. Некоторое время назад они показали, что мысли моделей организованы в виде определенных форм. Например, числа – это окружности, и складывая одно число с другим, LLM на самом деле суммируют множество бубликов: t.me/data_secrets/9223.

Теперь они обнаружили новые любопытные детали. Оказывается, внутри моделей существует целый ландшафт эмоциональных состояний.

Ученые взяли LLama, давали ей читать рассказы и наблюдали за состоянием активаций. Так вот по мере чтения модель как бы перемещается по некоторому многомерному пространству состояний, "испытвая" те или иные эмоции в зависимости от того, что происходит в тексте в данный момент.

Причем если визуализировать соответствующие разным эмоциям состояния модели, то получается структура, очень похожая на классическую психологическую модель эмоций человека. Например, радость находится рядом с интересом, страх и гнев имеют схожую высокую интенсивность и тд.

Еще по этой карте можно предсказывать дальнейшие ответы модели. И если искусственно подталкивать активации в направлении определенной эмоции, настроение и суть генераций меняется.

Красиво

❤117❤‍🔥34🤯28🗿9😁77🤨5🤝3🆒3😍1🐳1

9.71K views17:03

About

Blog

Apps

Platform