В Claude Code агент теперь сам решает, какие действия можно выполнять 👇
Раньше было два режима:
- либо он постоянно спрашивает разрешение
- либо
Первое раздражает.
Второе - рискованно.
Теперь появился auto mode.
В этом режиме Claude:
- сам принимает решения о доступах
- оценивает каждое действие
- безопасные - выполняет сразу
- рискованные - блокирует или ищет альтернативу
По сути:
• это тот же
🧠 Под капотом - классификатор, который анализирует каждый шаг агента
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
Раньше было два режима:
- либо он постоянно спрашивает разрешение
- либо
skip permissions - делает всё без спроса Первое раздражает.
Второе - рискованно.
Теперь появился auto mode.
В этом режиме Claude:
- сам принимает решения о доступах
- оценивает каждое действие
- безопасные - выполняет сразу
- рискованные - блокирует или ищет альтернативу
По сути:
• это тот же
skip permissions, но с встроенной проверкой на потенциальный вред 🧠 Под капотом - классификатор, который анализирует каждый шаг агента
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
👍15❤5🔥3🤣1
⚡️ MWS Cloud выпустил сервис по работе с большими языковыми моделями.
MWS GPT Model Hub — облачный сервис, который предоставляет доступ к LLM внутри MWS Cloud Platform. Развертывание занимает секунды, модели подключаются через OpenAI‑совместимый API.
Сейчас в сервисе 10 моделей, включая DeepSeek, Google, Alibaba, Zhipu AI. До конца года добавят еще десяток — с поддержкой преобразования текста в речь и аудио в текст.
Что можно делать с помощью MWS GPT Model Hub:
• запускать AI‑ассистентов без настройки инфраструктуры;
• обрабатывать большие объемы текстовых данных;
• создавать внутренние AI‑сервисы для сотрудников;
• сокращать time‑to‑market вдвое за счет быстрого прототипирования;
• внедрять интеллектуальный поиск в продукты.
К плюшкам: встроенные инструменты биллинга и учета ресурсов отслеживают расходы на AI‑функции по проектам и командам.
MWS GPT Model Hub — облачный сервис, который предоставляет доступ к LLM внутри MWS Cloud Platform. Развертывание занимает секунды, модели подключаются через OpenAI‑совместимый API.
Сейчас в сервисе 10 моделей, включая DeepSeek, Google, Alibaba, Zhipu AI. До конца года добавят еще десяток — с поддержкой преобразования текста в речь и аудио в текст.
Что можно делать с помощью MWS GPT Model Hub:
• запускать AI‑ассистентов без настройки инфраструктуры;
• обрабатывать большие объемы текстовых данных;
• создавать внутренние AI‑сервисы для сотрудников;
• сокращать time‑to‑market вдвое за счет быстрого прототипирования;
• внедрять интеллектуальный поиск в продукты.
К плюшкам: встроенные инструменты биллинга и учета ресурсов отслеживают расходы на AI‑функции по проектам и командам.
❤3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
The AI Scientist официально вышел в Nature - и это уже не просто эксперимент.
Речь про систему, которая способна автоматизировать весь цикл научного исследования:
- генерировать идеи
- писать код
- запускать эксперименты
- оформлять научную статью
Обновлённая версия AI Scientist-v2 уже сгенерировала первую полностью AI-сгенерированную научную работу,
которая прошла полноценное рецензирование людьми.
Теперь вышла публикация в Nature,
где подробно разобрана архитектура системы и показано, как всё это работает на практике.
В ИИ-систему добавили Automated Reviewer - AI-рецензента, который оценивает статьи
на уровне человека и даже стабильнее, чем сами люди.
Исследователями обнаружен прямой закон масштабирования науки -
чем сильнее базовая модель,
тем выше качество научных работ, которые она генерирует.
Это означает простую вещь:
По мере роста моделей и удешевления вычислений
качество AI-науки будет расти автоматически.
Фактически мы подошли к точке, где исследования можно масштабировать так же, как сегодня масштабируют код или контент.
• Nature: https://nature.com/articles/s41586-026-10265-5
• Blog: https://sakana.ai/ai-scientist-nature
@data_analysis_ml
Речь про систему, которая способна автоматизировать весь цикл научного исследования:
- генерировать идеи
- писать код
- запускать эксперименты
- оформлять научную статью
Обновлённая версия AI Scientist-v2 уже сгенерировала первую полностью AI-сгенерированную научную работу,
которая прошла полноценное рецензирование людьми.
Теперь вышла публикация в Nature,
где подробно разобрана архитектура системы и показано, как всё это работает на практике.
В ИИ-систему добавили Automated Reviewer - AI-рецензента, который оценивает статьи
на уровне человека и даже стабильнее, чем сами люди.
Исследователями обнаружен прямой закон масштабирования науки -
чем сильнее базовая модель,
тем выше качество научных работ, которые она генерирует.
Это означает простую вещь:
По мере роста моделей и удешевления вычислений
качество AI-науки будет расти автоматически.
Фактически мы подошли к точке, где исследования можно масштабировать так же, как сегодня масштабируют код или контент.
• Nature: https://nature.com/articles/s41586-026-10265-5
• Blog: https://sakana.ai/ai-scientist-nature
@data_analysis_ml
🔥9👍5❤3
ARC-AGI-3 - бенчмарк,показал неприятную для всей индустрии вещь: даже топовые frontier-модели сейчас набирают меньше 1%.
Лучшие результаты на старте такие:
- Gemini 3.1 Pro Preview - 0.37%
- GPT-5.4 High - 0.26%
- Opus 4.6 Max - 0.25%
И это, пожалуй, главный вывод.
ARC-AGI-3 - это уже не набор статичных головоломок, как в прошлых версиях ARC. Теперь это интерактивные игровые миры, где агенту нужно самому разбираться, что вообще происходит.
Что именно проверяет новый тест:
- исследование незнакомой среды с нуля
- поиск целей и правил без текстовых инструкций
- построение своей модели мира по ходу задачи
- длинное планирование на много шагов вперёд
- обучение на опыте, а не по шаблону
- пересмотр гипотез, если первые догадки оказались неверными
То есть здесь уже мало просто "хорошо рассуждать в чате".
Нужно адаптироваться в реальном времени, помнить прошлые действия, извлекать сигналы из слабой обратной связи и не скатываться в перебор.
Внутри ARC-AGI-3:
- 150+ новых интерактивных окружений
- почти 1 000 уровней
- replay-сессии, где можно смотреть весь таймлайн решений агента
Скоринг считает не только факт решения, а то, насколько эффективно модель осваивает навык по сравнению с человеком.
Именно поэтому результаты выглядят настолько жёстко.
По сути, ARC Prize говорит прямо:
пока между человеком и ИИ есть такой разрыв в освоении новых задач, говорить о настоящем AGI рано.
И это, возможно, один из самых честных тестов за последнее время.
Не потому что модели "слабые".
А потому что реальная универсальная адаптация всё ещё не решена.
https://arcprize.org/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
Лучшие результаты на старте такие:
- Gemini 3.1 Pro Preview - 0.37%
- GPT-5.4 High - 0.26%
- Opus 4.6 Max - 0.25%
И это, пожалуй, главный вывод.
ARC-AGI-3 - это уже не набор статичных головоломок, как в прошлых версиях ARC. Теперь это интерактивные игровые миры, где агенту нужно самому разбираться, что вообще происходит.
Что именно проверяет новый тест:
- исследование незнакомой среды с нуля
- поиск целей и правил без текстовых инструкций
- построение своей модели мира по ходу задачи
- длинное планирование на много шагов вперёд
- обучение на опыте, а не по шаблону
- пересмотр гипотез, если первые догадки оказались неверными
То есть здесь уже мало просто "хорошо рассуждать в чате".
Нужно адаптироваться в реальном времени, помнить прошлые действия, извлекать сигналы из слабой обратной связи и не скатываться в перебор.
Внутри ARC-AGI-3:
- 150+ новых интерактивных окружений
- почти 1 000 уровней
- replay-сессии, где можно смотреть весь таймлайн решений агента
Скоринг считает не только факт решения, а то, насколько эффективно модель осваивает навык по сравнению с человеком.
Именно поэтому результаты выглядят настолько жёстко.
По сути, ARC Prize говорит прямо:
пока между человеком и ИИ есть такой разрыв в освоении новых задач, говорить о настоящем AGI рано.
И это, возможно, один из самых честных тестов за последнее время.
Не потому что модели "слабые".
А потому что реальная универсальная адаптация всё ещё не решена.
https://arcprize.org/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
👍24❤6🔥6🙏2
Для специалистов по анализу данных ключевой вопрос — как быстро и эффективно извлечь нужную информацию из разных источников. Для этого необходим универсальный инструмент. Например, таким может выступать File Search — встроенный инструмент, доступный на платформе Yandex AI Studio. Инструмент работает на базе RAG-подхода и позволяет большим языковым моделям обогащать контекст данными из корпоративной базы знаний.
🚀Недавно платформа представила обновление инструмента и добавила новые возможности:
- Поддержка таблиц CSV и Excel — поиск по структурированным данным теперь встроен, что упрощает работу с финансовыми, маркетинговыми и операционными отчетами.
- Мультимедиа — видео и аудио можно анализировать через специализированный пайплайн, извлекая ценные инсайты из нестандартных источников.
File Search позволяет аналитикам быстрее находить ответы на вопросы, формируя их на основе загруженных корпоративных данных, а не только общих знаний модели о мире, и упрощает интеграцию в существующие BI- и аналитические процессы.
🚀Недавно платформа представила обновление инструмента и добавила новые возможности:
- Поддержка таблиц CSV и Excel — поиск по структурированным данным теперь встроен, что упрощает работу с финансовыми, маркетинговыми и операционными отчетами.
- Мультимедиа — видео и аудио можно анализировать через специализированный пайплайн, извлекая ценные инсайты из нестандартных источников.
File Search позволяет аналитикам быстрее находить ответы на вопросы, формируя их на основе загруженных корпоративных данных, а не только общих знаний модели о мире, и упрощает интеграцию в существующие BI- и аналитические процессы.
❤6👍3🔥1🌭1
В Claude Code уже 93 команды.
Но чтобы получить 80% пользы, тебе хватит вот этих 16 👇
→ создаёт
→ сначала думает, потом пишет код
→ показывает, что именно съедает твои токены
→ очищает контекст прямо в середине сессии
→ сбрасывает состояние между задачами
→ переключает модели: Opus / Sonnet / Haiku
→ позволяет задать побочный вопрос, не ломая основной поток работы
→ откатывает назад, если всё пошло не туда
→ запускает несколько суб-агентов параллельно
→ управляет браузером: клик, ввод, навигация
→ прогоняет промпты по кругу, удобно для мониторинга
→ 3 агента вместе ревьюят твой код
→ заранее разрешает безопасные действия
→ полностью автоматический режим, без лишних подтверждений
→ мгновенное переключение режимов
→ максимальная глубина рассуждения
Большинство используют Claude Code как обычный чат-бот.
Поэтому и упираются в потолок.
Продвинутые пользователи работают с ним как с целой системой.
Но чтобы получить 80% пользы, тебе хватит вот этих 16 👇
/init→ создаёт
CLAUDE.md - память проекта и репозитория/plan→ сначала думает, потом пишет код
/context→ показывает, что именно съедает твои токены
/compact→ очищает контекст прямо в середине сессии
/clear→ сбрасывает состояние между задачами
/model→ переключает модели: Opus / Sonnet / Haiku
/btw→ позволяет задать побочный вопрос, не ломая основной поток работы
/rewind→ откатывает назад, если всё пошло не туда
/agents→ запускает несколько суб-агентов параллельно
/chrome→ управляет браузером: клик, ввод, навигация
/loop→ прогоняет промпты по кругу, удобно для мониторинга
/simplify→ 3 агента вместе ревьюят твой код
/permissions→ заранее разрешает безопасные действия
--dangerously-skip-permissions→ полностью автоматический режим, без лишних подтверждений
Shift + Tab→ мгновенное переключение режимов
ultra think→ максимальная глубина рассуждения
Большинство используют Claude Code как обычный чат-бот.
Поэтому и упираются в потолок.
Продвинутые пользователи работают с ним как с целой системой.
👍21❤8🔥6
Forwarded from AI VK Hub
Рекомендательные системы — один из ключевых механизмов, на которых держатся современные продукты. Они помогают пользователям находить контент, товары и сервисы, а бизнесу — повышать вовлеченность и качество пользовательского опыта. Вместе с Владимиром Байкаловым, ведущим исследователем AI VK, разбираем главные тренды в рекомендациях и последние значимые работы.
🔗 Список статей
#aivk #recsys
Масштабирование🟣 Действия говорят громче слов: последовательные преобразователи с триллионом параметров для генеративных рекомендаций🟣 Масштабирование трансформеров для рекомендательных систем до одного миллиарда параметров🟣 LLaTTE: законы масштабирования для многоэтапного моделирования последовательностей в крупномасштабных рекламных рекомендательных системах
Lifelong Recommendations🟣 TransAct V2: моделирование последовательностей действий пользователя на протяжении всей жизни в рекомендациях Pinterest🟣 TWIN V2: расширение моделирования ультра‑длинных последовательностей поведения пользователя для улучшения CTR‑предсказания в Kuaishou🟣 LONGER: повышение эффективности моделирования длинных последовательностей в промышленных рекомендательных системах🟣 Укрощение ультра-длинных последовательностей пользовательского поведения в генеративных рекомендациях на уровне сессий
Generative Retrieval🟣 Память трансформера как дифференцируемый поисковый индекс🟣 Рекомендательные системы с генеративным поиском🟣 Sparse Meets Dense: унифицированные генеративные рекомендации с каскадными разреженно-плотными представлениями
Semantic IDs🟣 Повышение стабильности эмбеддингов в рекомендательных системах с помощью Semantic ID🟣 ActionPiece: контекстная токенизация последовательностей действий для генеративных рекомендаций🟣 Обучаемая токенизация объектов для генеративных рекомендаций🟣 Semantic ID переменной длины для рекомендательных систем
End to End Рекомендации🟣 OneRec: объединение retrieval и ranking в генеративной рекомендательной модели с итеративным выравниванием предпочтений🟣 OxygenREC: генеративный фреймворк, следующий инструкциям, для рекомендаций в электронной коммерции🟣 EGA: унифицированный end-to-end генеративный фреймворк для промышленных рекламных систем
LLMxRecSys🟣 PLUM: адаптация предварительно обученных языковых моделей для генеративных рекомендаций промышленного масштаба🟣 OneRec‑Think: рассуждение в тексте для генеративной рекомендации🟣 ReaSeq: использование мировых знаний через рассуждение для последовательного моделирования
#aivk #recsys
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍2🐳2
🚀 Tencent выкатывает Covo-Audio (7B) - новый уровень голосовых AI.
Это уже не просто “распознал → ответил → озвучил”.
Модель умеет говорить и слушать одновременно.
Что внутри:
• Qwen2.5-7B + Whisper
• 8 млн часов аудио обучения
• full-duplex — диалог без пауз
Главное отличие:
Нет отдельных пайплайнов ASR и TTS.
→ всё работает как единая модель
Что это даёт:
• можно перебивать (barge-in)
• естественный разговор, как с человеком
• меньше задержек
• меньше костылей в архитектуре
Отдельно:
Разделение интеллекта и голоса
→ проще делать voice cloning
→ гибкость под разные сценарии
Тренд очевиден:
AI переходит от “голосовых интерфейсов”
→ к полноценному живому диалогу
Скоро кнопка “нажми и говори” исчезнет совсем.
Модель: https://huggingface.co/tencent/Covo-Audio-Chat
Это уже не просто “распознал → ответил → озвучил”.
Модель умеет говорить и слушать одновременно.
Что внутри:
• Qwen2.5-7B + Whisper
• 8 млн часов аудио обучения
• full-duplex — диалог без пауз
Главное отличие:
Нет отдельных пайплайнов ASR и TTS.
→ всё работает как единая модель
Что это даёт:
• можно перебивать (barge-in)
• естественный разговор, как с человеком
• меньше задержек
• меньше костылей в архитектуре
Отдельно:
Разделение интеллекта и голоса
→ проще делать voice cloning
→ гибкость под разные сценарии
Тренд очевиден:
AI переходит от “голосовых интерфейсов”
→ к полноценному живому диалогу
Скоро кнопка “нажми и говори” исчезнет совсем.
Модель: https://huggingface.co/tencent/Covo-Audio-Chat
👍11❤8🔥4
Здесь говорят о том, как работать с данными в 2026 году ↗️
Узнайте на GoCloud 2026
9 апреля в Москве пройдет GoCloud 2026 – большая конференция про ИИ и облака от команды Cloud.ru.
Отдельный трек будет посвящен данным и аналитике: доклады о технологических трендах, простых инструментах и экономически эффективном управлении данными.
Вы узнаете:
А еще вас ждут демо сервисов, практические воркшопы, нетворкинг и афтерпати.
👉 Успейте зарегистрироваться👈
Узнайте на GoCloud 2026
9 апреля в Москве пройдет GoCloud 2026 – большая конференция про ИИ и облака от команды Cloud.ru.
Отдельный трек будет посвящен данным и аналитике: доклады о технологических трендах, простых инструментах и экономически эффективном управлении данными.
Вы узнаете:
▶️ какие подходы к работе с данными станут стандартом в 2026 году▶️ как управлять разными-дата сервисами на одной платформе▶️ как быстро обрабатывать real-time данные▶️ почему ML-системы начинаются не с моделей, а с дата-инфраструктуры▶️ какие возможности дает интеграция ИИ и Spark
А еще вас ждут демо сервисов, практические воркшопы, нетворкинг и афтерпати.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5🥱4❤2👍1
🚨 У ANTHROPIC утечка: Новая мощная МОДЕЛЬ
Anthropic случайно оставила черновики блог-постов в публично доступном кэше данных. Их нашли исследователи кибербезопасности:
- новая модель под названием "Claude Mythos"
- также упоминается как "Capybara"
- это новый уровень моделей
- больше и умнее, чем Opus
Anthropic подтвердила, что это не фейк:
- «качественный скачок»
- «самая мощная модель, которую мы когда-либо создавали»
- «значительно лучше в программировании, логике и кибербезопасности»
- «сильно опережает любые другие AI-модели в кибер-возможностях»
И они сами этим обеспокоены:
- «Модель предвещает волну ИИ, способных находить и эксплуатировать уязвимости гораздо быстрее, чем защитники успевают реагировать»
https://m1astra-mythos.pages.dev/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
Anthropic случайно оставила черновики блог-постов в публично доступном кэше данных. Их нашли исследователи кибербезопасности:
- новая модель под названием "Claude Mythos"
- также упоминается как "Capybara"
- это новый уровень моделей
- больше и умнее, чем Opus
Anthropic подтвердила, что это не фейк:
- «качественный скачок»
- «самая мощная модель, которую мы когда-либо создавали»
- «значительно лучше в программировании, логике и кибербезопасности»
- «сильно опережает любые другие AI-модели в кибер-возможностях»
И они сами этим обеспокоены:
- «Модель предвещает волну ИИ, способных находить и эксплуатировать уязвимости гораздо быстрее, чем защитники успевают реагировать»
https://m1astra-mythos.pages.dev/
🐍 полезные ресурсы 🚀Max
@data_analysis_ml
❤13🔥7👍4😁2
Forwarded from Bogatyrev Aleksei
Как я стал дата инженером с ЗП 800к
Без удачи и связей
💀 💀 💀
После очередной пьянки я понял, что надо что-то менять. Я решил стать дата инженером
Составил резюме на коленке. Чудом получил свою первую работу с зп 50к в месяц😎
Отработал 4 месяца и захотел больше. Ну и погнал дальше: собесы, отказы, новые офферы
В прошлом году я пробил 800к рублей за один месяц
Я выгорал, увольнялся, снова загорался и опять шел на собесы
Задумался над своими ошибками...
Как можно избежать их? Снял на эту тему видео, в котором рассказал:
Это разбор реального пути: как с нуля дойти до первой работы дата инженером с хорошей зарплатой.
Без булшита по типу "вкатись в ДЕ за месяц"😏
👉 Смотри видео в закрепе моего канала
Без удачи и связей
5 лет назад я работал в техподдержке с графиком 2/2 и жестко бухал
После очередной пьянки я понял, что надо что-то менять. Я решил стать дата инженером
Составил резюме на коленке. Чудом получил свою первую работу с зп 50к в месяц
Отработал 4 месяца и захотел больше. Ну и погнал дальше: собесы, отказы, новые офферы
В прошлом году я пробил 800к рублей за один месяц
Я выгорал, увольнялся, снова загорался и опять шел на собесы
Задумался над своими ошибками...
Как можно избежать их? Снял на эту тему видео, в котором рассказал:
- мой путь из техподдержки до техлида с зп 800к
- какие ошибки я совершил и как их обойти
- как выглядит типичный день ДЕ
Это разбор реального пути: как с нуля дойти до первой работы дата инженером с хорошей зарплатой.
Без булшита по типу "вкатись в ДЕ за месяц"
👉 Смотри видео в закрепе моего канала
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣57🥱21🥴5🌚4❤2😁2🤯2🌭1