Data Secrets

Обновленная GPT‑5.5‑Cyber обошла Mythos на поиске уязвимостей в коде

openai.com/index/daybreak-securing-the-world/

OpenAI объявили, что выводят модель из превью, и теперь партнерам и отдельным кибербезопасникам будет доступна полная версия GPT-5.5-Cyber.

На CyberGym – основном крупном бенче по работе с уязвимостями – модель набрала 85.6%. Mythos на нем же набирает 83.8%.

Самое интересное, что в списке партнеров, которым предоставляется модель, фигурируют не только американские компании. Наверное, правительство США должно это ограничить, как и в случае с Anthropic. Правда? Правда же?…

😁319🤯32🔥19👍9❤6☃4👌44🍾2🍓1🤗1

21.5K views09:19

Data Secrets

Мы

Не отрицайте

😁517❤77🔥30💯1717👍3🫡3☃2🤯2🍾2🆒1

20.9K views13:32

Data Secrets

Почему AI не ускорил разработку в 10 раз

Последние два года все обсуждают, как агенты пишут код. Но в реальных больших продуктах выясняется неожиданная вещь: даже после массового внедрения AI ускорение часто составляет не иксы, а только десятки процентов. Встает вопрос: почему?

Вот тут нашли совсем свежий интересный доклад на эту тему. Выступает Артур Василов, руководитель мобильной разработки Яндекс Браузера. Он рассказал, что они разными способами измеряли эффекты от ИИ, и увидели похожую картину: да, разработчики действительно работают быстрее, но нет, революции пока не произошло.

Причина в том, что кодинг – лишь одна часть большого конвейера. Помимо него есть менеджеры, дизайн, тестирование, кодревью, релизы и множество других этапов. Если ускорить только написание кода, узкое место просто смещается дальше по цепочке.

Поэтому глобально новый тренд в бигтехах, в том числе в Яндексе, не столько на ИИ-агентов как ассистентов, сколько на автоматизацию целых процессов. Команда выделяет повторяющиеся инженерные задачи, которые раньше никто не автоматизировал из-за высокой стоимости разработки, и автоматизирует их с помощью ИИ.

Например, в Яндексе куча людей работают над конфликтами и ошибками при выходе новых версий Chromium. Раньше почти вся эта работа выполнялась вручную. Теперь для таких сценариев строятся специализированные AI-пайплайны, которые помогают разбирать и исправлять подобные проблемы автоматически.

Именно в автоматизации вот таких больших кусков инженерной рутины и лежит основной резерв для ускорения разработки, и это уже действительно будет ускорение в разы.

🤔93❤28🗿27👍23💯6🤨5🤯3🔥2☃1🕊1🆒1

20.1K views16:12

Data Secrets

Ходят слухи, что Anthropic собираются выпускать новую модель

Пару дней назад какие-то инсайдеры говорили, что у них якобы уже готов Mythos 5.1 и соответствующая версия Fable, но по понятным причинам эти модели пока будут жить только внутри стартапа.

Теперь пишут, что на этой неделе антропики собираются выпускать Sonnet 5: модель уже заметили в логах у некоторых провайдеров. Ожидаем 1М контекста, хорошие показатели в кодинге и выгодное соотношение цена/качество.

Решили долго не горевать, дистиллировать Fable в "Sonnet 5" и выпустить заново 👨‍🦯

Please open Telegram to view this post

VIEW IN TELEGRAM

😁268❤54👍2414😎3🤔2👌1💯1🎄1

19.8K viewsedited 17:16

Anthropic выпустили Claude Tag, и Андрей Карпаты назвал это третьим мощным редизайном UX в истории LLM

Теперь Claude можно добавить как члена команды в канал Slack, вызывать его через @ и делегировать ему задачи.

Он тут же пойдет выполнять таску и вернется с результатами в тот же чат, где можно продолжить диалог и смерджить готовый код, не отрываясь от основной переписки с коллегами. Причем разговор с Claude может перехватить любой человек из канала. Пример ⬆️

Обновление создано для более проактивного и бесшовного стиля работы агента. По словам Anthropic, теперь 65% кода внутри стартапа создается именно благодаря внутренней версии Claude Tag.

www.anthropic.com/news/introducing-claude-tag

А Андрей Карпаты написал про Claude Tag следующее:

Это новая парадигма для взаимодействия с Claude. Имхо, это 3-й крупный редизайн LLM UIUX. Первый заключался в том, что LLM - это веб-сайт, на который вы заходите; второй – в том, что это приложение, которое вы загружаете на свой компьютер. Третий же про то, что это автономная, стойкая, асинхронная сущность с общеорганизационными инструментами и контекстом, работающая вместе с командами людей. Понимание этого займет некоторое время, но это работает, и это потрясающе.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥142❤52🤯20🔥19😁14🤔10👍85⚡3🎉1🦄1

21K viewsedited 07:09

Data Secrets

Многие ML-инженеры (инженеры машинного обучения) сталкиваются с одной и той же ситуацией: опыта становится больше, задачи — сложнее, а следующий карьерный шаг так и не происходит

Специалист уверенно работает с моделями, строит пайплайны (конвейер обработки данных), участвует в экспериментах, решает задачи своей команды. Но вакансии уровня ведущего специалиста или руководителя команды требуют опыта с системами и направлениями, которых в текущем проекте просто нет.

Поэтому многие делают ставку на дальнейшую специализацию: изучают новые архитектуры, глубже погружаются в модели и совершенствуют текущие навыки.

Но проблема в том, что переход на следующий профессиональный уровень часто связан не столько с углублением существующих компетенций, сколько с их расширением.

На более высоких позициях ценится не только умение обучать модели, но и понимание прикладных ML-систем: рекомендательные системы, ранжирование, эксперименты, MLOps (сопровождение машинного обучения), динамическое ценообразование и другие прикладные задачи, напрямую влияющие на продукт и бизнес.

Поэтому дополнительное обучение для опытных специалистов часто становится способом получить опыт в областях, до которых сложно дотянуться в рамках текущего проекта.

Этой задаче посвящен курс Валерия Бабушкина «Продвинутое машинное обучение» от karpovꓸcourses. Его особенность в том, что программу не обязательно проходить целиком. Можно выбрать только те блоки, которые нужны именно сейчас: рекомендательные системы, ранжирование, MLOps, A/B-тестирование, uplift-моделирование (моделирование прироста эффекта) или динамическое ценообразование.

Такой формат позволяет изучать только те компетенции, которые действительно нужны для следующего карьерного шага, экономя и время, и ресурсы на лишние учебные блоки.

Выберите направления, которых сейчас не хватает для интересующих вас ролей, а по промокоду JUNML15 получите скидку 15%: https://clc.to/erid_2W5zFJD9PUm

Реклама. ООО «КАРПОВ КУРСЫ». ИНН 7811764627. erid: 2W5zFJD9PUm

😁57❤17🤨14🗿1165👍4🦄33🔥2🆒1

15.9K views10:42

Data Secrets

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

GLM-5.2 теперь можно запустить локально

Unsloth сделали отличные GGUF 2-bit и 4-bit. Модель 2-bit сохраняет ~82% точности модели и при этом уменьшает потребление памяти на 84%. Запускается на 256GB Mac.

Можно взять даже 1-bit, и все равно будет норм. На простом примере по сравнению с Claude 4.8 Opus и GPT-5.5 модель ведет себя удивительно хорошо ⬆️

huggingface.co/unsloth/GLM-5.2-GGUF

Инструкция по запуску

Please open Telegram to view this post

VIEW IN TELEGRAM

🕊88❤48👍29🔥21😁7🤨6🤔4🍾3☃1💯1🫡1

17.6K views11:48

Data Secrets

Топовая работа для инженера 🥰✋🤚

😁110🍓22🔥64❤3👍1😍1🆒1

14.4K views14:04

Data Secrets

⚡️

OpenAI сделали собственный чип

Архитектура разработана с нуля вместе с Broadcom, а назвали чип Jalapeño. Предназначен халапеньо специально для инференса LLM и соответсвующих систем а-ля Codex.

Сейчас чип проходит стадию тестирования, но ранние внутренние замеры уже показали, что он перформит лучше текущей SOTA на целый ватт.

openai.com/index/openai-broadcom-jalapeno-inference-chip/

Please open Telegram to view this post

VIEW IN TELEGRAM

2❤77🤯23👍13😁10🍾3👏2🔥1😎1

13.2K viewsedited 15:05

Data Secrets

Авито открыли набор на две магистратуры по ML, разработанные совместно с МФТИ и ВШЭ

Самые интересные образовательные программы получаются, когда бигтех приходит в университет не только с финансированием, а еще и с собственными задачами, данными и экспертами. И это как раз случай Авито.

Прямо сейчас открылась отличная возможность поступить в их магистратуры на ML-программы «Прикладное машинное обучение и анализ данных» с МФТИ и «Машинное обучение в цифровом продукте» с ФКН ВШЭ. В основе программ – реальные кейсы компании, а часть занятий будут вести действующие специалисты Авито. Всего в подготовке материалов участвовали более 300 сотрудников.

Стек довольно широкий: это и классический ML, и компьютерное зрение, и рекомендательные системы, и аналитика, и генеративный ИИ. При этом речь идет не про абстрактное изучение алгоритмов, а про применение всего, что вы проходите, в продуктовой среде.

Отдельный плюс: поступать можно из любого региона России. Ждут всех, кто готов всерьез погружаться в ML и перенимать знания из первых рук, от практикующих специалистов.

Подробнее о программах:
– «Машинное обучение (ML) в цифровом продукте» в ФКН НИУ ВШЭ
– «Прикладное машинное обучение и анализ данных» в МФТИ

😁28🗿13❤7👍5🤯4🤨2⚡1🔥1🎉1🆒1

11.9K views16:02

Data Secrets

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Когда языковые модели читают текст, они не просто обрабатывают токен за токеном. В каком-то смысле они испытывают от чтения эмоции.

www.goodfire.ai/research/stories-in-space#

Рисерчеры из GoodFire продолжают исследовать так называемую геометрию LLM. Некоторое время назад они показали, что мысли моделей организованы в виде определенных форм. Например, числа – это окружности, и складывая одно число с другим, LLM на самом деле суммируют множество бубликов: t.me/data_secrets/9223.

Теперь они обнаружили новые любопытные детали. Оказывается, внутри моделей существует целый ландшафт эмоциональных состояний.

Ученые взяли LLama, давали ей читать рассказы и наблюдали за состоянием активаций. Так вот по мере чтения модель как бы перемещается по некоторому многомерному пространству состояний, "испытвая" те или иные эмоции в зависимости от того, что происходит в тексте в данный момент.

Причем если визуализировать соответствующие разным эмоциям состояния модели, то получается структура, очень похожая на классическую психологическую модель эмоций человека. Например, радость находится рядом с интересом, страх и гнев имеют схожую высокую интенсивность и тд.

Еще по этой карте можно предсказывать дальнейшие ответы модели. И если искусственно подталкивать активации в направлении определенной эмоции, настроение и суть генераций меняется.

Красиво

1❤132❤‍🔥37🤯3011😁9🗿9🤨6🤝3🆒3😍1🐳1

11.4K views17:03

About

Blog

Apps

Platform