Data Secrets
90.9K subscribers
7.04K photos
794 videos
20 files
3.18K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
GitVerse × GigaCode: ваш персональный ИИ-напарник

Запустили ранний доступ к ИИ-чату внутри GitVerse. Чат — часть GigaCode, агентного ИИ-ассистента, который умеет самостоятельно работать с файлами, анализировать кодовую базу и генерировать тесты.

Как чат упрощает жизнь:
· Разбор ошибок. Кидаете запрос — он изучает логи и объясняет, что пошло не так.
· Навигация по платформе. Мгновенно находит нужные инструкции и подсказывает, как всё работает.
· Помощь с кодом. Объяснит незнакомый фрагмент и предложит решение.

Запросить ранний доступ и протестировать
1😁8828🗿207🔥75🫡3🎉2💯2🤨2🎄2
Media is too big
VIEW IN TELEGRAM
Дарио Амодеи заявил, что опенсорс в ИИ – это «отвлекающий маневр»

Он сказал, что на самом деле это не тот опенсорс, к которому мы привыкли:

«Вы все равно не можете видеть внутренности модели, и основные плюсы опенсорса вроде коллективной доработки работают с сфере ИИ иначе»


Основной аргумент:

«В итоге вам все равно придется хостить ее в облаке»


В довершении CEO Anthropic заявил, что для конкуренции важнее способности модели и ее эффективность на инференсе, а не «ярлык» опенсорса и лицензия.

Мнения? 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
3🗿284😁125601916👍9🔥53🤨2🕊1😎1
This media is not supported in your browser
VIEW IN TELEGRAM
Чтение мыслей 2.0 от Meta*: компания выпустила Brain2Qwerty v2

В компании сделали модель, которая может с большой точностью восстанавливать текст, который человек молча печатает на клавиатуре. И, кажется, они впервые доказали, что неинвазивные методы могут приближаться к качеству, которое раньше считалось достижимым только после операции на мозге аля Neuralink.

Итак, Brain2Qwerty v2:

– Система основана на Brain2Qwerty v1. Но, в отличие от первой версии, v2 восстанавливает текст без знания момента каждого нажатия клавиши. Она получает непрерывный поток мозговой активности и сразу генерирует предложение целиком.

– Внутри задача разбита на три уровня: есть энкодер, который преобразовывает сырые сигналы MEG в отдельные символы. Дальше эту последовательность обрабатывает Aligner: он пытается понять, где начинаются и заканчиваются слова и строит их эмбеддинги. Далее эти эмбеддинги вместе с исходными сигналами отправляются в LLM, и она уже правит все в конечный вид.

– Выглядит это все как огромная установка стоимостью в миллионы долларов.

Точность относительно предыдущих методов, можно сказать, зашкаливает. Заявляется 61% word accuracy в среднем (около 70% на лучших участниках). При этом система может допускать больше символьных ошибок, чем первая версия, потому что не знает времени нажатия клавиш, но смысл оказывается намного ближе к оригиналу.

И да, это все еще слишком низкая точность для массового применения. НО (и это самое интересное!) исследователи открыли почти идеальный scaling law. Качество продолжает улучшаться почти логарифмически с увеличением объема данных, и насыщения пока не видно.

Так что возможно все, что нужно для очень точного неинвазивного чтения мыслей – это больше данных. В удивительное время живем.

facebookresearch.github.io/brain2qwerty/
2🤯163🔥5221👍8👏3😁333💯1🤗1
Новый дроп в опенсорс от Сбера: выложили токенизатор KVAE-Audio

Фундаментально эта модель решает давнюю проблему обучения диффузионных систем. Им требуется максимально качественное сжатое представление данных, от которого напрямую зависит верхний предел возможностей создания нового контента. Разработчики закрыли эту потребность, представив третью часть семейства KVAE. Ранее команда уже публиковала схожие алгоритмы для работы с видео и картинками, а теперь очередь дошла до аудио формата.

Система способна переваривать треки на частоте 48 кГц, охватывая весь спектр человеческого слуха. Во время обработки алгоритм уплотняет временную шкалу в 960 раз. На выходе получается сверхкомпактное пространство, состоящее из 64 каналов. Такие скромные размерности сильно упрощают жизнь при тренировке генеративных архитектур.

Главный инженерный вызов здесь заключался в адаптации выходных данных именно под диффузию. Классические подходы часто показывают отличные цифры при воссоздании исходного аудио, но плохо справляются с созданием оригинального материала. Чтобы сбалансировать результаты в обеих задачах, авторы применили уникальный метод регуляризации.

Если посмотреть на бенчмарки, новинка уверенно обходит MMAudio от Sony абсолютно по всем фронтам. При сравнении с DACVAE от Meta и SAME-L от Stability AI разработка выигрывает в качестве генерации и держит паритет в реконструкции, при этом обладая значительно меньшим весом.
Код и веса под свободной лицензией MIT уже лежат на GitHub и Hugging Face.

Habr
84🔥36🗿31👍21😁72🤔2💯2🏆1
В будущем не будет продактов, инженеров и дизайнеров: создатель Claude Code Борис Черный сказал, что нас ждет всего 5 архетипов

1. Prototyper: генератор множества идей, только некоторые из которых будут реализованы.

2. Builder: быстро превращает прототипы и идеи в продукт.

3. Sweeper: чистит UX, упрощает код, оптимизирует систему.

4. Grower: берет продукт и итеративно улучшает его с точки зрения Product-Market Fit.

5. Maintainer: владеет зрелой системой и следит за ее безопасностью, надежностью и эффективностью.


При этом эти архетипы не будут зависеть от домена или специфического стека, как большинство современных ролей, и один человек сможет объединять в себе до трех статусов.

В новой системе не нашлось места только эйчарам 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3😁33856👍4211🗿5👨‍💻4🤯2🕊2🫡2🍓1🍾1
Media is too big
VIEW IN TELEGRAM
VP of Engineering из Spotify дал интервью Борису Черному и случайно стал мемом

Он заявил, что в его компании делается 4500 PR ежедневно, из них 73% – с помощью агентов.

Пользователи в комментариях не поняли, откуда взялись такие огромные цифры:

«Это они добавляют каждую новую песню в git или что-то в таком роде?»

«Наглядное пособие по созданию ИИ-пузыря»

«Зачем? Последняя новая фича в Spotify появлялась 15 лет назад»


Главное, что KPI по токенмаксингу выполнили
😁297😎3824🍓2🫡21🤯1
⚡️ Anthropic выпустили Sonnet 5

Метрики близки к Opus 4.8, но цена ниже. Пишут, что новая версия способна выполнять более длинные задачи и качественнее перепроверять себя.

До конца лета в API модель будет по скидке: $2/million input и $10/million output.

https://www.anthropic.com/news/claude-sonnet-5
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔115🔥72😁22👍85🆒3🎄2🗿2💯1🍓1
Data Secrets
⚡️ Anthropic выпустили Sonnet 5 Метрики близки к Opus 4.8, но цена ниже. Пишут, что новая версия способна выполнять более длинные задачи и качественнее перепроверять себя. До конца лета в API модель будет по скидке: $2/million input и $10/million output.…
Модель уже доступна в нашем API-сервисе DS Lab

https://dslab.tech/ai/models/llm/claude-sonnet-5

Цены: 200р/м input, 1000р/м output.

Без VPN и иностранных карт. Подключайтесь в один клик и пользуйтесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🗿93😁36👍2510🤨5🤯42🔥2🕊1🏆1🎄1
Проснулись улыбнулись: Fable 5 возвращают для всех!

https://www.anthropic.com/news/redeploying-fable-5

Никакой верификации гражданства пока не будет, но в модель добавили еще больше фильтров и защит, поэтому, как пишут сами Anthropic, даже некоторые рутинные задачи по кодингу или дебаггингу с большой долей вероятности будут перекидываться на Opus 4.8.

Не разгуляешься, в общем, но хотя бы так.

Также антропики вынуждены расширить сотрудничество с правительством. Им будут давать предварительные доступы к новым моделям «для оценки безопасности» + будут проводиться некие «совместные исследования».

Mythos, кстати, тоже возвращают. Но только для части организаций в США, которые были одобрены государством.
310431😁26🕊2416🤨117🤔5🍓3🤝2🎄1
📣 Чтобы LLM-система рассуждала, проверяла ответы, работала с внешними знаниями и меньше ошибалась, нужна продуманная архитектура. Именно она отличает полезное решение от чат-бота, который отвечает неточно.

📆 23 июля в 20:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM».

На занятии разберём:
как ReAct помогает модели совмещать рассуждение и действия;
зачем нужен Reflection для проверки и улучшения ответов;
как RAG подключает LLM к внешним источникам знаний и снижает риск фактических ошибок.

❗️ Урок подойдёт DS-, ML- и NLP-специалистам, а также ИТ-специалистам, которые хотят проектировать более надёжные LLM-решения для рабочих сценариев.

Зарегистрируйтесь и разберитесь, как комбинировать ReAct, Reflection и RAG в архитектуре LLM-систем: https://otus.pw/tvIBW/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
😁1462🤨2🗿2👍1👏1😍1💘1
Media is too big
VIEW IN TELEGRAM
Еще одна интересная новинка от Anthropic: Claude Science

Это агент для рисерча, буквально Claude Code для исследователей.

Разработчики описывают Claude Science как полноценную ИИ-инфраструктуру для рисерча end-to-end. То есть это поиск литературы, анализ данных, вычисления, визуализация и подготовка статей в одном интерфейсе.

В комплекте уже идет база скиллов для агента + есть всякие приятные визуализации и отображения артефактов, посмотрите видео.

Пока в бете, попробовать можно в виде приложения на MacOS или Linux.

https://www.anthropic.com/news/claude-science-ai-workbench
1🔥10527👍13😎3🤔2🏆2🫡21
Хотите не просто пользоваться нейросетями, а создавать их? Тогда есть повод присмотреться - МТС и НИУ ВШЭ объявили набор на третий поток магистратуры «Исследования и предпринимательство в искусственном интеллекте».

Для студентов предусмотрено 30 оплачиваемых мест. В программе — генеративный ИИ, большие языковые модели, агентные системы, машинное обучение, видеоаналитика и реальные кейсы МТС Web Services.

«За время обучения ребята получили хорошую базу для карьеры в сфере ИИ: работали с индустриальными задачами, использовали виртуальную инфраструктуру MWS Cloud и ресурсы GPU, учились создавать и масштабировать ИИ-решения в бизнес-среде», – заявил гендиректор МТС Web Services Павел Воронин.


Лучших студентов пригласят на стажировку или сразу предложат работу в МТС Web Services. Кстати, первый выпуск уже состоялся — дипломы получили 25 человек.

Оставить заявку можно по ссылке.
😁43🗿1915👍2🔥2🎄2👏1
Забавно: новый Sonnet 5 на деле оказывается дороже Fable

Посмотрите на замеры Artificial Analysis Intelligence Index:

– Первая картинка: общая стоимость решения всего бенчмарка. Fable потратил ~5600$, а Sonnet 5 – больше 6к.

– Вторая картинка: собственно, причина происходящего. Sonnet 5 просто тратит ОЧЕНЬ много токенов. Примерно в два раза больше Fable и намного больше Opus 4.8.

– Третья картинка: средняя цена на задачу. Учитывая, что разница в стоимости большая, в среднем на задачу Fable все равно тратит немного больше, но на масштабе Sonnet начинает перевешивать (см первый пункт). А Opus 4.8 остается дешевле даже здесь.

Вот вам и хваленная экономия
😁1633695👍4👏3🤨2🤗21
Все, Fable вернулся

До 7 июля модель будет включена в подписку, и на нее можно потратить до 50% вашей квоты. После этого модель будет доступна только за почку дополнительные кредиты.

https://support.claude.com/en/articles/15424964-claude-fable-5-promotional-access

Пойдем пробовать, насколько все плохо с новыми защитными ограничениями
1🔥89😁59👍125🕊2🏆1🎄1
OpenAI может подарить правительству США 5% акций

По данным FT, Альтман уже давно предлагает эту идею и говорит, что это «лучший способ разделить выгоды от развития ИИ», то есть дать государству и гражданам долю и финансовый интерес в успехе компании. Трамп некоторое время назад также публично поддерживал такую модель.

По понятным причинам обсуждение обострилось именно сейчас, когда надо срочно откупиться снизить политическое давление Вашингтона.

Самое интересное, что если так сделают OpenAI, то придется, видимо, жертвовать своими акциями и остальным. Амодеи будет очень доволен 😧
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁17238🫡123👏2🗿21🦄1😎1