Data Secrets
90.9K subscribers
7.04K photos
794 videos
20 files
3.17K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Проснулись улыбнулись: Fable 5 возвращают для всех!

https://www.anthropic.com/news/redeploying-fable-5

Никакой верификации гражданства пока не будет, но в модель добавили еще больше фильтров и защит, поэтому, как пишут сами Anthropic, даже некоторые рутинные задачи по кодингу или дебаггингу с большой долей вероятности будут перекидываться на Opus 4.8.

Не разгуляешься, в общем, но хотя бы так.

Также антропики вынуждены расширить сотрудничество с правительством. Им будут давать предварительные доступы к новым моделям «для оценки безопасности» + будут проводиться некие «совместные исследования».

Mythos, кстати, тоже возвращают. Но только для части организаций в США, которые были одобрены государством.
310331😁26🕊2416🤨117🤔5🍓3🤝2🎄1
📣 Чтобы LLM-система рассуждала, проверяла ответы, работала с внешними знаниями и меньше ошибалась, нужна продуманная архитектура. Именно она отличает полезное решение от чат-бота, который отвечает неточно.

📆 23 июля в 20:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM».

На занятии разберём:
как ReAct помогает модели совмещать рассуждение и действия;
зачем нужен Reflection для проверки и улучшения ответов;
как RAG подключает LLM к внешним источникам знаний и снижает риск фактических ошибок.

❗️ Урок подойдёт DS-, ML- и NLP-специалистам, а также ИТ-специалистам, которые хотят проектировать более надёжные LLM-решения для рабочих сценариев.

Зарегистрируйтесь и разберитесь, как комбинировать ReAct, Reflection и RAG в архитектуре LLM-систем: https://otus.pw/tvIBW/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
😁1452🤨2🗿2👍1👏1😍1💘1
Media is too big
VIEW IN TELEGRAM
Еще одна интересная новинка от Anthropic: Claude Science

Это агент для рисерча, буквально Claude Code для исследователей.

Разработчики описывают Claude Science как полноценную ИИ-инфраструктуру для рисерча end-to-end. То есть это поиск литературы, анализ данных, вычисления, визуализация и подготовка статей в одном интерфейсе.

В комплекте уже идет база скиллов для агента + есть всякие приятные визуализации и отображения артефактов, посмотрите видео.

Пока в бете, попробовать можно в виде приложения на MacOS или Linux.

https://www.anthropic.com/news/claude-science-ai-workbench
1🔥10225👍13😎3🤔2🏆2🫡2
Хотите не просто пользоваться нейросетями, а создавать их? Тогда есть повод присмотреться - МТС и НИУ ВШЭ объявили набор на третий поток магистратуры «Исследования и предпринимательство в искусственном интеллекте».

Для студентов предусмотрено 30 оплачиваемых мест. В программе — генеративный ИИ, большие языковые модели, агентные системы, машинное обучение, видеоаналитика и реальные кейсы МТС Web Services.

«За время обучения ребята получили хорошую базу для карьеры в сфере ИИ: работали с индустриальными задачами, использовали виртуальную инфраструктуру MWS Cloud и ресурсы GPU, учились создавать и масштабировать ИИ-решения в бизнес-среде», – заявил гендиректор МТС Web Services Павел Воронин.


Лучших студентов пригласят на стажировку или сразу предложат работу в МТС Web Services. Кстати, первый выпуск уже состоялся — дипломы получили 25 человек.

Оставить заявку можно по ссылке.
😁42🗿1812👍2🔥2🎄2👏1
Забавно: новый Sonnet 5 на деле оказывается дороже Fable

Посмотрите на замеры Artificial Analysis Intelligence Index:

– Первая картинка: общая стоимость решения всего бенчмарка. Fable потратил ~5600$, а Sonnet 5 – больше 6к.

– Вторая картинка: собственно, причина происходящего. Sonnet 5 просто тратит ОЧЕНЬ много токенов. Примерно в два раза больше Fable и намного больше Opus 4.8.

– Третья картинка: средняя цена на задачу. Учитывая, что разница в стоимости большая, в среднем на задачу Fable все равно тратит немного больше, но на масштабе Sonnet начинает перевешивать (см первый пункт). А Opus 4.8 остается дешевле даже здесь.

Вот вам и хваленная экономия
😁1563485👍3👏3🤨2🤗21
Все, Fable вернулся

До 7 июля модель будет включена в подписку, и на нее можно потратить до 50% вашей квоты. После этого модель будет доступна только за почку дополнительные кредиты.

https://support.claude.com/en/articles/15424964-claude-fable-5-promotional-access

Пойдем пробовать, насколько все плохо с новыми защитными ограничениями
1🔥81😁55👍115🕊2🏆1🎄1
OpenAI может подарить правительству США 5% акций

По данным FT, Альтман уже давно предлагает эту идею и говорит, что это «лучший способ разделить выгоды от развития ИИ», то есть дать государству и гражданам долю и финансовый интерес в успехе компании. Трамп некоторое время назад также публично поддерживал такую модель.

По понятным причинам обсуждение обострилось именно сейчас, когда надо срочно откупиться снизить политическое давление Вашингтона.

Самое интересное, что если так сделают OpenAI, то придется, видимо, жертвовать своими акциями и остальным. Амодеи будет очень доволен 😧
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁16135🫡10👏2🗿211🦄1😎1
Есть один вопрос, который редко задают вслух при запуске ИИ-проекта: кто именно отвечает за оценку его финансового результата?

Чаще всего — та же команда, которая его строила. Это структурная проблема. Не потому что люди нечестные, а потому что у них нет инструмента, нет общего стандарта и нет независимой точки проверки. В итоге каждый считает так, как умеет и как удобно.

Именно это — одна из причин, почему компаниям сложно масштабировать ИИ. Не технология тормозит, а отсутствие внутренней культуры оценки.

Методология, которую Альянс в сфере ИИ и Ассоциация ФинТех выпустили в ноябре, устроена в том числе как система ответственности. Она определяет не только то, как считать, но и кто считает, кто проверяет и кто подтверждает цифры.

В зависимости от сложности проекта к оценке подключаются разные роли: бизнес-юнит, финансовая валидация, техническая валидация, аудит, ИИ-стратегия. Это не бюрократия — это гарантия того, что результат, который попадает в отчётность или инвестиционную модель, можно защитить.

Для компаний, которые хотят выстроить зрелый процесс работы с ИИ, такой стандарт — это не внешний документ, а внутренний инструмент управления. С ним разговор об инвестициях в ИИ перестаёт быть разговором на доверии и становится разговором на цифрах.

Как именно лидеры рынка считают этот эффект — на конкретных кейсах и формулах разобрано в статье Никиты Худова, заместителя генерального директора Альянса ИИ.


Методология доступна на сайте Альянса — с формулами, кейсами и калькуляторами.

Реклама. Альянс в сфере ИИ, ИНН 9725034035
115🤨13🗿7😁6🔥5👍32👏1🍾11
В сети набирает популярность плагин Caveman, который заставляет LLM говорить как пещерный человек ради экономии токенов

Он делает так, чтобы модель убирала из ответа приветствия, вежливости, длинные переходы, определения для чайников и прочие вводные фразы, и оставляла только очень сухую выжимку.

Как заявляет автор, экономится при этом до 75% токенов без потери качества (если что, есть разные режими сжатия, от лайтового до ультра телеграфного).

На GitHub проект (github.com/JuliusBrussee/caveman) набрал уже почти 80к звезд. Сначала это был просто скилл для Claude Code, но теперь автор уже сделал из Caveman отдельный плагин и даже выпустил полноценного кодинг-агента Caveman Code.

Автор пишет, что скилл используют даже сотрудники OpenAI, Nvidia, GitHub и пр. А в компании Legrand сотрудникам якобы напрямую рекомендуют использовать Caveman, чтобы не вылетать за лимиты по токенам.

Кстати, проект поддержал технический директор OpenAI Шейн Суини. Он лично законтрибьютил в репозиторий, добавив поддержку Codex.
2🗿17568🤯16🤗6😍4😁2👍1🫡1
Коротко о новых safe guards в Fable 5
1😁22519🤯16🗿4🐳2🍓2🎉1🫡1😎1
Cloud.ru выкатили в общий доступ управляемый сервис для OpenClaw и других ИИ-агентов

Агентные системы выходят из стадии экспериментов и становятся полноценным инструментом для бизнеса. Только что на рынке появился EvoClaw – управляемый сервис для запуска OpenClaw и других ИИ-агентов с готовой инфраструктурой и поддержкой от провайдера.

Вы получаете самые популярные агентные системы из коробки. Добавлена изоляция среды, политики безопасности по Zero Trust, мониторинг, логирование, хранение секретов. Решение работает по протоколу A2A для взаимодействия между агентами.

Для запуска агентов можно использовать модель из каталога LLM Foundation Models или инференс модели через сервис ML Inference. Также пользователь EvoClaw может заранее выбрать уникальную специализацию, навыки и тон общения ассистента.

Вот так агенты продолжают обрастать инфраструктурой. И именно такие продукты как EvoClaw – это следующий необходимый шаг развития ИИ и ускорения разработки в компаниях.
1🗿21🔥1754👍2😁2💯1🤗1🎄1