This media is not supported in your browser
VIEW IN TELEGRAM
Чтение мыслей 2.0 от Meta*: компания выпустила Brain2Qwerty v2
В компании сделали модель, которая может с большой точностью восстанавливать текст, который человек молча печатает на клавиатуре. И, кажется, они впервые доказали, что неинвазивные методы могут приближаться к качеству, которое раньше считалось достижимым только после операции на мозге аля Neuralink.
Итак, Brain2Qwerty v2:
– Система основана на Brain2Qwerty v1. Но, в отличие от первой версии, v2 восстанавливает текст без знания момента каждого нажатия клавиши. Она получает непрерывный поток мозговой активности и сразу генерирует предложение целиком.
– Внутри задача разбита на три уровня: есть энкодер, который преобразовывает сырые сигналы MEG в отдельные символы. Дальше эту последовательность обрабатывает Aligner: он пытается понять, где начинаются и заканчиваются слова и строит их эмбеддинги. Далее эти эмбеддинги вместе с исходными сигналами отправляются в LLM, и она уже правит все в конечный вид.
– Выглядит это все как огромная установка стоимостью в миллионы долларов.
Точность относительно предыдущих методов, можно сказать, зашкаливает. Заявляется 61% word accuracy в среднем (около 70% на лучших участниках). При этом система может допускать больше символьных ошибок, чем первая версия, потому что не знает времени нажатия клавиш, но смысл оказывается намного ближе к оригиналу.
И да, это все еще слишком низкая точность для массового применения. НО (и это самое интересное!) исследователи открыли почти идеальный scaling law. Качество продолжает улучшаться почти логарифмически с увеличением объема данных, и насыщения пока не видно.
Так что возможно все, что нужно для очень точного неинвазивного чтения мыслей – это больше данных. В удивительное время живем.
facebookresearch.github.io/brain2qwerty/
В компании сделали модель, которая может с большой точностью восстанавливать текст, который человек молча печатает на клавиатуре. И, кажется, они впервые доказали, что неинвазивные методы могут приближаться к качеству, которое раньше считалось достижимым только после операции на мозге аля Neuralink.
Итак, Brain2Qwerty v2:
– Система основана на Brain2Qwerty v1. Но, в отличие от первой версии, v2 восстанавливает текст без знания момента каждого нажатия клавиши. Она получает непрерывный поток мозговой активности и сразу генерирует предложение целиком.
– Внутри задача разбита на три уровня: есть энкодер, который преобразовывает сырые сигналы MEG в отдельные символы. Дальше эту последовательность обрабатывает Aligner: он пытается понять, где начинаются и заканчиваются слова и строит их эмбеддинги. Далее эти эмбеддинги вместе с исходными сигналами отправляются в LLM, и она уже правит все в конечный вид.
– Выглядит это все как огромная установка стоимостью в миллионы долларов.
Точность относительно предыдущих методов, можно сказать, зашкаливает. Заявляется 61% word accuracy в среднем (около 70% на лучших участниках). При этом система может допускать больше символьных ошибок, чем первая версия, потому что не знает времени нажатия клавиш, но смысл оказывается намного ближе к оригиналу.
И да, это все еще слишком низкая точность для массового применения. НО (и это самое интересное!) исследователи открыли почти идеальный scaling law. Качество продолжает улучшаться почти логарифмически с увеличением объема данных, и насыщения пока не видно.
Так что возможно все, что нужно для очень точного неинвазивного чтения мыслей – это больше данных. В удивительное время живем.
facebookresearch.github.io/brain2qwerty/
2🤯163🔥51❤21👍8👏3😁3 3 3💯1🤗1
Новый дроп в опенсорс от Сбера: выложили токенизатор KVAE-Audio
Фундаментально эта модель решает давнюю проблему обучения диффузионных систем. Им требуется максимально качественное сжатое представление данных, от которого напрямую зависит верхний предел возможностей создания нового контента. Разработчики закрыли эту потребность, представив третью часть семейства KVAE. Ранее команда уже публиковала схожие алгоритмы для работы с видео и картинками, а теперь очередь дошла до аудио формата.
Система способна переваривать треки на частоте 48 кГц, охватывая весь спектр человеческого слуха. Во время обработки алгоритм уплотняет временную шкалу в 960 раз. На выходе получается сверхкомпактное пространство, состоящее из 64 каналов. Такие скромные размерности сильно упрощают жизнь при тренировке генеративных архитектур.
Главный инженерный вызов здесь заключался в адаптации выходных данных именно под диффузию. Классические подходы часто показывают отличные цифры при воссоздании исходного аудио, но плохо справляются с созданием оригинального материала. Чтобы сбалансировать результаты в обеих задачах, авторы применили уникальный метод регуляризации.
Если посмотреть на бенчмарки, новинка уверенно обходит MMAudio от Sony абсолютно по всем фронтам. При сравнении с DACVAE от Meta и SAME-L от Stability AI разработка выигрывает в качестве генерации и держит паритет в реконструкции, при этом обладая значительно меньшим весом.
Код и веса под свободной лицензией MIT уже лежат на GitHub и Hugging Face.
Habr
Фундаментально эта модель решает давнюю проблему обучения диффузионных систем. Им требуется максимально качественное сжатое представление данных, от которого напрямую зависит верхний предел возможностей создания нового контента. Разработчики закрыли эту потребность, представив третью часть семейства KVAE. Ранее команда уже публиковала схожие алгоритмы для работы с видео и картинками, а теперь очередь дошла до аудио формата.
Система способна переваривать треки на частоте 48 кГц, охватывая весь спектр человеческого слуха. Во время обработки алгоритм уплотняет временную шкалу в 960 раз. На выходе получается сверхкомпактное пространство, состоящее из 64 каналов. Такие скромные размерности сильно упрощают жизнь при тренировке генеративных архитектур.
Главный инженерный вызов здесь заключался в адаптации выходных данных именно под диффузию. Классические подходы часто показывают отличные цифры при воссоздании исходного аудио, но плохо справляются с созданием оригинального материала. Чтобы сбалансировать результаты в обеих задачах, авторы применили уникальный метод регуляризации.
Если посмотреть на бенчмарки, новинка уверенно обходит MMAudio от Sony абсолютно по всем фронтам. При сравнении с DACVAE от Meta и SAME-L от Stability AI разработка выигрывает в качестве генерации и держит паритет в реконструкции, при этом обладая значительно меньшим весом.
Код и веса под свободной лицензией MIT уже лежат на GitHub и Hugging Face.
Habr
❤84🔥35🗿31👍21😁7☃2🤔2💯2🏆1
В будущем не будет продактов, инженеров и дизайнеров: создатель Claude Code Борис Черный сказал, что нас ждет всего 5 архетипов
При этом эти архетипы не будут зависеть от домена или специфического стека, как большинство современных ролей, и один человек сможет объединять в себе до трех статусов.
В новой системе не нашлось места только эйчарам🤷♂️
1. Prototyper: генератор множества идей, только некоторые из которых будут реализованы.
2. Builder: быстро превращает прототипы и идеи в продукт.
3. Sweeper: чистит UX, упрощает код, оптимизирует систему.
4. Grower: берет продукт и итеративно улучшает его с точки зрения Product-Market Fit.
5. Maintainer: владеет зрелой системой и следит за ее безопасностью, надежностью и эффективностью.
При этом эти архетипы не будут зависеть от домена или специфического стека, как большинство современных ролей, и один человек сможет объединять в себе до трех статусов.
В новой системе не нашлось места только эйчарам
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3😁338❤56👍42 11🗿5👨💻4🤯2🕊2🫡2🍓1🍾1
Media is too big
VIEW IN TELEGRAM
VP of Engineering из Spotify дал интервью Борису Черному и случайно стал мемом
Он заявил, что в его компании делается 4500 PR ежедневно, из них 73% – с помощью агентов.
Пользователи в комментариях не поняли, откуда взялись такие огромные цифры:
Главное, что KPI по токенмаксингу выполнили
Он заявил, что в его компании делается 4500 PR ежедневно, из них 73% – с помощью агентов.
Пользователи в комментариях не поняли, откуда взялись такие огромные цифры:
«Это они добавляют каждую новую песню в git или что-то в таком роде?»
«Наглядное пособие по созданию ИИ-пузыря»
«Зачем? Последняя новая фича в Spotify появлялась 15 лет назад»
Главное, что KPI по токенмаксингу выполнили
😁296😎38❤24🍓2🫡2☃1🤯1
Метрики близки к Opus 4.8, но цена ниже. Пишут, что новая версия способна выполнять более длинные задачи и качественнее перепроверять себя.
До конца лета в API модель будет по скидке: $2/million input и $10/million output.
https://www.anthropic.com/news/claude-sonnet-5
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔115🔥72😁22👍8❤5🆒3🎄2🗿2💯1🍓1
Data Secrets
https://dslab.tech/ai/models/llm/claude-sonnet-5
Цены: 200р/м input, 1000р/м output.
Без VPN и иностранных карт. Подключайтесь в один клик и пользуйтесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🗿92😁36👍25❤10🤨5🤯4⚡2🔥2🕊1🏆1🎄1
Проснулись улыбнулись: Fable 5 возвращают для всех!
https://www.anthropic.com/news/redeploying-fable-5
Никакой верификации гражданства пока не будет, но в модель добавили еще больше фильтров и защит, поэтому, как пишут сами Anthropic, даже некоторые рутинные задачи по кодингу или дебаггингу с большой долей вероятности будут перекидываться на Opus 4.8.
Не разгуляешься, в общем, но хотя бы так.
Также антропики вынуждены расширить сотрудничество с правительством. Им будут давать предварительные доступы к новым моделям «для оценки безопасности» + будут проводиться некие «совместные исследования».
Mythos, кстати, тоже возвращают. Но только для части организаций в США, которые были одобрены государством.
https://www.anthropic.com/news/redeploying-fable-5
Никакой верификации гражданства пока не будет, но в модель добавили еще больше фильтров и защит, поэтому, как пишут сами Anthropic, даже некоторые рутинные задачи по кодингу или дебаггингу с большой долей вероятности будут перекидываться на Opus 4.8.
Не разгуляешься, в общем, но хотя бы так.
Также антропики вынуждены расширить сотрудничество с правительством. Им будут давать предварительные доступы к новым моделям «для оценки безопасности» + будут проводиться некие «совместные исследования».
Mythos, кстати, тоже возвращают. Но только для части организаций в США, которые были одобрены государством.
3⚡103❤31😁26🕊24 16🤨11 7🤔5🍓3🤝2🎄1
Data Secrets
Проснулись улыбнулись: Fable 5 возвращают для всех! https://www.anthropic.com/news/redeploying-fable-5 Никакой верификации гражданства пока не будет, но в модель добавили еще больше фильтров и защит, поэтому, как пишут сами Anthropic, даже некоторые рутинные…
Коротко о возвращении Fable
1😁355❤33🤔11🐳6👌2⚡1🔥1🍓1🤝1😎1
📣 Чтобы LLM-система рассуждала, проверяла ответы, работала с внешними знаниями и меньше ошибалась, нужна продуманная архитектура. Именно она отличает полезное решение от чат-бота, который отвечает неточно.
📆 23 июля в 20:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM».
На занятии разберём:
➖ как ReAct помогает модели совмещать рассуждение и действия;
➖ зачем нужен Reflection для проверки и улучшения ответов;
➖ как RAG подключает LLM к внешним источникам знаний и снижает риск фактических ошибок.
❗️ Урок подойдёт DS-, ML- и NLP-специалистам, а также ИТ-специалистам, которые хотят проектировать более надёжные LLM-решения для рабочих сценариев.
Зарегистрируйтесь и разберитесь, как комбинировать ReAct, Reflection и RAG в архитектуре LLM-систем: https://otus.pw/tvIBW/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
📆 23 июля в 20:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM».
На занятии разберём:
➖ как ReAct помогает модели совмещать рассуждение и действия;
➖ зачем нужен Reflection для проверки и улучшения ответов;
➖ как RAG подключает LLM к внешним источникам знаний и снижает риск фактических ошибок.
❗️ Урок подойдёт DS-, ML- и NLP-специалистам, а также ИТ-специалистам, которые хотят проектировать более надёжные LLM-решения для рабочих сценариев.
Зарегистрируйтесь и разберитесь, как комбинировать ReAct, Reflection и RAG в архитектуре LLM-систем: https://otus.pw/tvIBW/
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
😁14❤6☃2🤨2🗿2👍1👏1😍1💘1
Media is too big
VIEW IN TELEGRAM
Еще одна интересная новинка от Anthropic: Claude Science
Это агент для рисерча, буквально Claude Code для исследователей.
Разработчики описывают Claude Science как полноценную ИИ-инфраструктуру для рисерча end-to-end. То есть это поиск литературы, анализ данных, вычисления, визуализация и подготовка статей в одном интерфейсе.
В комплекте уже идет база скиллов для агента + есть всякие приятные визуализации и отображения артефактов, посмотрите видео.
Пока в бете, попробовать можно в виде приложения на MacOS или Linux.
https://www.anthropic.com/news/claude-science-ai-workbench
Это агент для рисерча, буквально Claude Code для исследователей.
Разработчики описывают Claude Science как полноценную ИИ-инфраструктуру для рисерча end-to-end. То есть это поиск литературы, анализ данных, вычисления, визуализация и подготовка статей в одном интерфейсе.
В комплекте уже идет база скиллов для агента + есть всякие приятные визуализации и отображения артефактов, посмотрите видео.
Пока в бете, попробовать можно в виде приложения на MacOS или Linux.
https://www.anthropic.com/news/claude-science-ai-workbench
1🔥103❤27👍13😎3🤔2🏆2🫡2 1
Хотите не просто пользоваться нейросетями, а создавать их? Тогда есть повод присмотреться - МТС и НИУ ВШЭ объявили набор на третий поток магистратуры «Исследования и предпринимательство в искусственном интеллекте».
Для студентов предусмотрено 30 оплачиваемых мест. В программе — генеративный ИИ, большие языковые модели, агентные системы, машинное обучение, видеоаналитика и реальные кейсы МТС Web Services.
Лучших студентов пригласят на стажировку или сразу предложат работу в МТС Web Services. Кстати, первый выпуск уже состоялся — дипломы получили 25 человек.
Оставить заявку можно по ссылке.
Для студентов предусмотрено 30 оплачиваемых мест. В программе — генеративный ИИ, большие языковые модели, агентные системы, машинное обучение, видеоаналитика и реальные кейсы МТС Web Services.
«За время обучения ребята получили хорошую базу для карьеры в сфере ИИ: работали с индустриальными задачами, использовали виртуальную инфраструктуру MWS Cloud и ресурсы GPU, учились создавать и масштабировать ИИ-решения в бизнес-среде», – заявил гендиректор МТС Web Services Павел Воронин.
Лучших студентов пригласят на стажировку или сразу предложат работу в МТС Web Services. Кстати, первый выпуск уже состоялся — дипломы получили 25 человек.
Оставить заявку можно по ссылке.
😁43🗿19❤15👍2🔥2🎄2👏1
Забавно: новый Sonnet 5 на деле оказывается дороже Fable
Посмотрите на замеры Artificial Analysis Intelligence Index:
– Первая картинка: общая стоимость решения всего бенчмарка. Fable потратил ~5600$, а Sonnet 5 – больше 6к.
– Вторая картинка: собственно, причина происходящего. Sonnet 5 просто тратит ОЧЕНЬ много токенов. Примерно в два раза больше Fable и намного больше Opus 4.8.
– Третья картинка: средняя цена на задачу. Учитывая, что разница в стоимости большая, в среднем на задачу Fable все равно тратит немного больше, но на масштабе Sonnet начинает перевешивать (см первый пункт). А Opus 4.8 остается дешевле даже здесь.
Вот вам и хваленная экономия
Посмотрите на замеры Artificial Analysis Intelligence Index:
– Первая картинка: общая стоимость решения всего бенчмарка. Fable потратил ~5600$, а Sonnet 5 – больше 6к.
– Вторая картинка: собственно, причина происходящего. Sonnet 5 просто тратит ОЧЕНЬ много токенов. Примерно в два раза больше Fable и намного больше Opus 4.8.
– Третья картинка: средняя цена на задачу. Учитывая, что разница в стоимости большая, в среднем на задачу Fable все равно тратит немного больше, но на масштабе Sonnet начинает перевешивать (см первый пункт). А Opus 4.8 остается дешевле даже здесь.
Вот вам и хваленная экономия
😁161 36⚡9❤5👍3👏3🤨2🤗2 1
Все, Fable вернулся
До 7 июля модель будет включена в подписку, и на нее можно потратить до 50% вашей квоты. После этого модель будет доступна только започку дополнительные кредиты.
https://support.claude.com/en/articles/15424964-claude-fable-5-promotional-access
Пойдем пробовать, насколько все плохо с новыми защитными ограничениями
До 7 июля модель будет включена в подписку, и на нее можно потратить до 50% вашей квоты. После этого модель будет доступна только за
https://support.claude.com/en/articles/15424964-claude-fable-5-promotional-access
Пойдем пробовать, насколько все плохо с новыми защитными ограничениями
1🔥88😁58👍12❤5🕊2🏆1🎄1
OpenAI может подарить правительству США 5% акций
По данным FT, Альтман уже давно предлагает эту идею и говорит, что это «лучший способ разделить выгоды от развития ИИ», то есть дать государству и гражданам долю и финансовый интерес в успехе компании. Трамп некоторое время назад также публично поддерживал такую модель.
По понятным причинам обсуждение обострилось именно сейчас, когда надо срочнооткупиться снизить политическое давление Вашингтона.
Самое интересное, что если так сделают OpenAI, то придется, видимо, жертвовать своими акциями и остальным. Амодеи будет очень доволен😧
По данным FT, Альтман уже давно предлагает эту идею и говорит, что это «лучший способ разделить выгоды от развития ИИ», то есть дать государству и гражданам долю и финансовый интерес в успехе компании. Трамп некоторое время назад также публично поддерживал такую модель.
По понятным причинам обсуждение обострилось именно сейчас, когда надо срочно
Самое интересное, что если так сделают OpenAI, то придется, видимо, жертвовать своими акциями и остальным. Амодеи будет очень доволен
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁170 38🫡12❤3👏2🗿2☃1🦄1😎1
Есть один вопрос, который редко задают вслух при запуске ИИ-проекта: кто именно отвечает за оценку его финансового результата?
Чаще всего — та же команда, которая его строила. Это структурная проблема. Не потому что люди нечестные, а потому что у них нет инструмента, нет общего стандарта и нет независимой точки проверки. В итоге каждый считает так, как умеет и как удобно.
Именно это — одна из причин, почему компаниям сложно масштабировать ИИ. Не технология тормозит, а отсутствие внутренней культуры оценки.
Методология, которую Альянс в сфере ИИ и Ассоциация ФинТех выпустили в ноябре, устроена в том числе как система ответственности. Она определяет не только то, как считать, но и кто считает, кто проверяет и кто подтверждает цифры.
В зависимости от сложности проекта к оценке подключаются разные роли: бизнес-юнит, финансовая валидация, техническая валидация, аудит, ИИ-стратегия. Это не бюрократия — это гарантия того, что результат, который попадает в отчётность или инвестиционную модель, можно защитить.
Для компаний, которые хотят выстроить зрелый процесс работы с ИИ, такой стандарт — это не внешний документ, а внутренний инструмент управления. С ним разговор об инвестициях в ИИ перестаёт быть разговором на доверии и становится разговором на цифрах.
Как именно лидеры рынка считают этот эффект — на конкретных кейсах и формулах разобрано в статье Никиты Худова, заместителя генерального директора Альянса ИИ.
Методология доступна на сайте Альянса — с формулами, кейсами и калькуляторами.
Реклама. Альянс в сфере ИИ, ИНН 9725034035
Чаще всего — та же команда, которая его строила. Это структурная проблема. Не потому что люди нечестные, а потому что у них нет инструмента, нет общего стандарта и нет независимой точки проверки. В итоге каждый считает так, как умеет и как удобно.
Именно это — одна из причин, почему компаниям сложно масштабировать ИИ. Не технология тормозит, а отсутствие внутренней культуры оценки.
Методология, которую Альянс в сфере ИИ и Ассоциация ФинТех выпустили в ноябре, устроена в том числе как система ответственности. Она определяет не только то, как считать, но и кто считает, кто проверяет и кто подтверждает цифры.
В зависимости от сложности проекта к оценке подключаются разные роли: бизнес-юнит, финансовая валидация, техническая валидация, аудит, ИИ-стратегия. Это не бюрократия — это гарантия того, что результат, который попадает в отчётность или инвестиционную модель, можно защитить.
Для компаний, которые хотят выстроить зрелый процесс работы с ИИ, такой стандарт — это не внешний документ, а внутренний инструмент управления. С ним разговор об инвестициях в ИИ перестаёт быть разговором на доверии и становится разговором на цифрах.
Как именно лидеры рынка считают этот эффект — на конкретных кейсах и формулах разобрано в статье Никиты Худова, заместителя генерального директора Альянса ИИ.
Методология доступна на сайте Альянса — с формулами, кейсами и калькуляторами.
Реклама. Альянс в сфере ИИ, ИНН 9725034035
1❤16🤨16🗿12😁7🔥5👍3 2👏1🍾1 1
В сети набирает популярность плагин Caveman, который заставляет LLM говорить как пещерный человек ради экономии токенов
Он делает так, чтобы модель убирала из ответа приветствия, вежливости, длинные переходы, определения для чайников и прочие вводные фразы, и оставляла только очень сухую выжимку.
Как заявляет автор, экономится при этом до 75% токенов без потери качества (если что, есть разные режими сжатия, от лайтового до ультра телеграфного).
На GitHub проект (github.com/JuliusBrussee/caveman) набрал уже почти 80к звезд. Сначала это был просто скилл для Claude Code, но теперь автор уже сделал из Caveman отдельный плагин и даже выпустил полноценного кодинг-агента Caveman Code.
Автор пишет, что скилл используют даже сотрудники OpenAI, Nvidia, GitHub и пр. А в компании Legrand сотрудникам якобы напрямую рекомендуют использовать Caveman, чтобы не вылетать за лимиты по токенам.
Кстати, проект поддержал технический директор OpenAI Шейн Суини. Он лично законтрибьютил в репозиторий, добавив поддержку Codex.
Он делает так, чтобы модель убирала из ответа приветствия, вежливости, длинные переходы, определения для чайников и прочие вводные фразы, и оставляла только очень сухую выжимку.
Как заявляет автор, экономится при этом до 75% токенов без потери качества (если что, есть разные режими сжатия, от лайтового до ультра телеграфного).
На GitHub проект (github.com/JuliusBrussee/caveman) набрал уже почти 80к звезд. Сначала это был просто скилл для Claude Code, но теперь автор уже сделал из Caveman отдельный плагин и даже выпустил полноценного кодинг-агента Caveman Code.
Автор пишет, что скилл используют даже сотрудники OpenAI, Nvidia, GitHub и пр. А в компании Legrand сотрудникам якобы напрямую рекомендуют использовать Caveman, чтобы не вылетать за лимиты по токенам.
Кстати, проект поддержал технический директор OpenAI Шейн Суини. Он лично законтрибьютил в репозиторий, добавив поддержку Codex.
2🗿204❤76🤯19🤗6😍4😁3👍2🫡1 1