Machinelearning

Anthropic выкатила Claude Sonnet 5 - мощнейший «агентный» Sonnet в линейке.

Модель теперь лучше планирует, пользуется инструментами, браузером, терминалом и может дольше вести сложные задачи без постоянного контроля.

По словам Anthropic, Sonnet 5 приблизился к Opus 4.8 по агентным задачам, но стоит дешевле. Особенно упор сделали на кодинг, tool use, reasoning и работу с многошаговыми процессами.

Модель уже доступна во всех планах Claude, включая Free и Pro, а также в Claude Code и API.

Цена для разработчиков до 31 августа 2026:

• $2 за 1 млн input tokens
• $10 за 1 млн output tokens

Потом стандартная цена:

• $3 за input
• $15 за output

Интересный момент: Anthropic отдельно пишет, что Sonnet 5 безопаснее Sonnet 4.6 в агентных сценариях, лучше отказывается от вредных запросов и устойчивее к prompt injection.

По сути, это попытка сделать «рабочую лошадку» для AI-агентов: не самую дорогую, но достаточно сильную, чтобы закрывать кодинг, автоматизацию, браузерные задачи и долгие пайплайны.

https://www.anthropic.com/news/claude-sonnet-5

1👍107🤩35❤26👏12🥱8🔥3🥰3🤔3❤‍🔥1

31.2K viewsedited 18:04

Machinelearning

0:00

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Власти США сняли экспортные ограничения на Fable 5 и Mythos 5

Минторг США официально отменил ограничения, наложенные ранее на Claude Fable 5 и Mythos 5.

В Anthropic подтвердили, что полноценный доступ к моделям для будет открыт уже завтра.

Создатели поблагодарили аудиторию за терпение в период вынужденной приостановки сервисов, а также выразили признательность всем специалистам, помогавшим в повторном развертывании систем.

Ожидается, что в ближайшее время Anthropic выпустит патчноуты с дополнительной информацией и раскроет дальнейшие планы по развитию линейки.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍92⚡41😁20❤13👏7🔥4🎉4🌭4🙉3🤨2🤝1

23.9K views06:25

✔️

OpenAI анонсировала клавиатуру под Codex

Создатель ChatGPT cовместно с производителем периферии Work Louder выпустит клавиатуру Codex для разработчиков. Официальная презентация и публикация характеристик запланированы на 15 июля.

Судя по тизеру, контроллер базируется на мини-клавиатуре Creator Micro 2. В базовой версии девайс оснащен 13 механическими переключателями, аналоговым джойстиком и сенсорными панелями для настройки макросов и быстрых команд.

Ожидается, что устройство получит аппаратную интеграцию с моделями OpenAI для генерации кода и вызова ИИ-ассистентов в одно нажатие.
OpenAI Developers в сети Х

✔️

Anthropic представила среду для научных вычислений

Claude Science - ИИ-среда для научных исследований, в которой представлены более 60 настроенных навыков для геномики, протеомики и хемоинформатики.

Платформа интегрирована с Nvidia BioNeMo и дает доступ к моделям Evo 2, Boltz-2 и OpenFold3. Среда позволяет анализировать литературу, визуализировать данные и писать черновики статей, а встроенный агент верификации проверяет точность расчетов и цитирований.

Приложение запускается локально на macOS или Linux и подключается к удаленным серверам. Чувствительные данные остаются во внутренней инфраструктуре, облачной модели передается только необходимый контекст. Нагрузка масштабируется от одного до сотен GPU.

Бета-версия доступна на тарифах Pro, Max, Team и Enterprise. До 15 июля Anthropic распределит до 50 грантов по 30 000 долларов в виде вычислительных кредитов.
anthropic.com

✔️

Релиз LongCat-2.0: первая LLM, обученная на китайских чипах

Китайская компания Meituan представила модель на 1,6 трлн параметров с контекстом 1 млн токенов. Полный цикл претрейна и инференса прошел на кластере из 50 тыс отечественных ASIC.

Поставщик ускорителей не назван, но использование библиотеки HCCL указывает на архитектуру Huawei. Ранее локальное железо массово применяли преимущественно для инференса, а обучение оставалось слабым местом.

По тестам LongCat-2.0 обходит Gemini 3.1 Pro в кодинге и агентных сценариях на Terminal-Bench 2.1 и SWE-Bench Pro. Модель пока уступает GPT-5.5 и Claude 4.8 Opus.

LongCat-2.0 доступна через API Meituan и OpenRouter. Веса ожидаются на Hugging Face.
longcatai.org

✔️

Генерация изображений в Gemini стала бесплатной для пользователей США

Google открыла базовым аккаунтам из США бесплатный доступ к персонализированной генерации изображений в Gemini. Ранее инструмент на базе движка Nano Banana был доступен только в тарифах Plus, Pro и Ultra.

Для формирования контекста Gemini анализирует данные из Gmail, YouTube, истории поиска и Google Фото. Система напрямую подтягивает снимки пользователя из облака, заменяя ручную загрузку исходников.

Функция работает в рамках инструмента Personal Intelligence, развертывание которого идет с весны. Доступ к данным определяет пользователь, он сам выбирает приложения для интеграции с ассистентом.
blog.google

✔️

Ford вернул в штат 300 инженеров после неудачного внедрения ИИ

Автопроизводитель вернул в штат QA-инженеров после неудачного внедрения автоматизированного контроля качества. Ранее компания установила сотни CV-камер для проверки производственных деталей на соответствие проектным требованиям.

Системам машинного зрения не хватило данных о специфических и реальных дефектах. Большинство опытных специалистов покинули Ford до того, как их экспертизу формализовали и перенесли в обучающие датасеты.

Сейчас вернувшиеся занимаются сбором данных, дообучением CV-алгоритмов и менторством младшего персонала.
bbc.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣47❤14🔥7👍5🙏2

18.7K views08:55

Machinelearning

⚡️ Инженеры AI VK выкатили нейропоиск Discovery AI.

Это не банальный чат-бот, а движок для рекомендаций, который ищет ответы строго внутри контентной базы продуктов VK.
Система учитывает интересы пользователя внутри сервисов, обрабатывает до 3 000 поисковых запросов в секунду и выдает релевантный ответ меньше чем за полсекунды.

Внутри — собственная LLM и целая цепочка ML-моделей, которые обучили на миллиардах примеров пользовательских запросов. Движок работает на единой Discovery-платформе и позволит усилить персонализацию контента с учетом данных из разных сервисов VK.

Технологию можно адаптировать под разные сценарии. Например, в дейтинге для поиска потенциальных мэтчей по определенному запросу или в рекомендациях контентных сервисов: подобрать музыкальный плейлист или выбрать фильм на вечер. Обновление поэтапно появится в VK Видео, Медиапроектах Mail и других продуктах VK.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

😁66🤣61❤15👍8🔥6🙈4🌚3🗿3🍾2💅1

15K views14:48

Machinelearning

✔️

Cognition разработала архитектуру, которая снижает затраты на программирование на 35%

Американская лаборатория прикладного ИИ представила гибридную архитектуру Devin Fusion для автоматизации кодинга.

На бенчмарке FrontierCode система снижает затраты на генерацию кода на 35% без падения качества.

Devin Fusion использует динамическую маршрутизацию и концепцию напарника. Система оценивает сложность задачи в реальном времени и переключает запросы между моделями с применением сжатия контекста.

Тяжелая LLM планирует архитектуру, уточняет требования и проводит ревью. Легкий агент пишет базовый код, тесты и валидирует результаты. Для предотвращения конфликтов модели используют независимые кэши контекста.

В связке с GPT-5.5 и Claude 4.8 Opus архитектура экономит больше трети ресурсов, с Fable 5 - до 41%.

Внутри Cognition гибридная маршрутизация уже закрывает 88% успешных PR.

Главное ограничение системы в кейсах со сложной бизнес-логикой (например, в связке React/Redux).

Избыточное делегирование кросс-файловых задач младшей модели снижает результативность почти в 2 раза.

Devin Fusion доступен только на платформе Cognition.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤28👍16🔥6😁4🤣3💯1

14.1K views16:05

Machinelearning

https://t.me/ai_machinelearning_big_data

✔️

МТС и НИУ ВШЭ открыли набор на третий поток магистратуры по ИИ

МТС и факультет компьютерных наук НИУ ВШЭ объявили о старте набора на третий поток магистерской программы «Исследования и предпринимательство в искусственном интеллекте». Обучение пройдет в московском кампусе ВШЭ, для студентов предусмотрено 30 оплачиваемых мест от компании.

Программу обновили с учетом запросов рынка. В нее вошли курсы по генеративному ИИ, интеллектуальным агентным системам, проектированию ML-систем, а также дисциплины по большим языковым моделям, машинному обучению и видеоаналитике.

Лучшие студенты смогут получить приглашение на стажировку или работу в МТС Web Services еще во время обучения. Заявки можно оставить по ссылке.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🤣24👍9❤5🔥1🙊1

13.7K views17:15

Machinelearning

📌

Claude Code более автономен, чем чат-бот

На выходных Anthropic опубликовала свежий отчёт Economic Index об использовании своих моделей.

Компания выпускает его нерегулярно (раз в 2-3 месяца), по мере накопления значимых изменений в методологии или данных. Предыдущая публикация была в марте.

Главный инсайт: то, сколько решений мы готовы отдавать ИИ, зависит не от самой модели, а от того, как именно запакован продукт.

Степень автономии, которую мы даем Claude в обычном веб-чате (или Cowork) и в Claude Code замеряли по шкале от 1 до 5, где 1- это почти никакой самостоятельности, а 5 - экстремальная.

Результат определил, что характер работы над одинаковыми задачами кардинально меняется. Например, чтобы написать статью или пост в чате, требуется медианно 13 раундов диалогового пинг-понга с моделью. В Claude Code на ту же задачу уходит ровно один промпт.

Логично списать это на то, что в Code 54% сессий обслуживает Opus (против 10% в чате). Но нет, это не просто фича большей модели - на Sonnet картина такая же.

🟡

Цифры

+0.37 балла - средний отрыв в уровне автономии в пользу Claude Code по всем задачам;

+0.53 балла - отрыв конкретно для кодинга. В 26 из 31 категории результатов агентный интерфейс бьёт обычный чат.

Отчёт, кстати, построен на новой телеметрии, которая собирает данные ежечасно, а не семидневными выборками, как раньше.

Это позволило впервые увидеть и недельные, и суточные ритмы использования: всплеск личных запросов на выходных, пик просьб о рецептах в шесть вечера, запросы о сне под утро.

Отдельная часть отчёта - первые результаты опроса пользователей Claude, в котором участвовали около 9700 респондентов.

Он показал, что люди, которые делегируют ИИ задачи целиком, смотрят на свои перспективы оптимистичнее остальных и чаще ожидают роста зарплаты или сохранения работы, а не наоборот, как можно было бы предположить.

Гендерный факт.

У женщин доля сессий в Claude Code существенно ниже. Они используют Claude более итеративно, как партнера-собеседника, и проводят в чате больше активного времени, тогда как мужчины чаще пытаются скинуть задачу целиком и забыть.

🟡

Автономия пока стоит дорого

Корреляция между делегированием и сожженными токенами очень сильная (r = 0,68). Чем дороже и ценнее профессия/задача, тем больше токенов она потребляет.

Причём полная передача руля не значит, что вы будете лежать на диване. В высокоценных задачах люди сами делают больше запросов и регулярно включают расширенный ризонинг у модели.

@ai_machinelearning_big_data

#AI #ML #Research #EconomicIndex #Anthropic

Please open Telegram to view this post

VIEW IN TELEGRAM

❤21🤣20👍10🔥2

13.2K views18:22

Machinelearning

Forwarded from Анализ данных (Data analysis)

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Fable 5 снова вернулась в Claude

Модель снова доступна спустя почти три недели после отключения. Ограничения с Anthropic сняли: ранее их вводили из-за формулировки про «угрозу нацбезопасности».

До 7 июля Fable 5 можно использовать в подписках Pro, Team, Max и Premium Enterprise. На неё разрешено тратить до 50% недельных лимитов.

После 7 июля бесплатный доступ закончится, останется только оплата по токенам.

https://claude.ai/

⚡52👍28🔥26😎14❤8👏7😁5

12.2K views20:14

Machinelearning

⚡️

Z.ai выкатила ZCode 3.0

Это AI-native IDE под разработку с агентами, глубоко заточенная под GLM-5.2.

Что внутри:

• интеграция с GLM-5.2 и multi-agent режимом
• автономные задачи: планирование, кодинг, проверка
• ревью кода и помощь с деплоем
• удалённое управление через Telegram, WeChat и Feishu
• версии для macOS, Windows и Linux
• платные планы от $18 в месяц

Z.ai явно хочет догнать западных конкурентов в AI-coding инструментах.

http://zcode.z.ai/en

Please open Telegram to view this post

VIEW IN TELEGRAM

❤59⚡42🔥19🤔18👍14👏9🎉7😁3

13.6K views20:31

Machinelearning

📌

Метка в коде и геолокация в письмах: к Anthropic есть вопросы

Разработчик под ником Thereallo опубликовал на днях подробный анализ, который показывал, что Claude Code незаметно помечал часть пользователей из Китая по цифровым отпечаткам их программного окружения.

Инженер команды Claude Code, Тарик Шихипар, отреагировал на публикацию постом в сети Х и признал, что в марте в продукт был встроен экспериментальный механизм.

Он срабатывал только при использовании нестандартного адреса API и проверял несколько признаков: часовой пояс системы, совпадение имени прокси-хоста со списком китайских реселлеров и наличие определённых ключевых слов, и с помощью особой пунктуации внедрял скрытую метку в системные инструкции методом стеганографии.

Цель, по словам Тарика, состояла в том, чтобы помешать неавторизованным реселлерам злоупотреблять аккаунтами и заниматься дистилляцией модели.

Он добавил, что команда давно собиралась отключить этот механизм, правки внесены, а полное удаление ожидается в ближайшем обновлении.

В сети восприняли объяснение скептически

Критики отмечали, что механизм действовал с марта, а его свёртывание началось лишь после огласки, и упрекали компанию в том, что она сообщила о практике только после обнаружения, не уведомив пользователей заранее.

Для Anthropic, которая позиционирует себя как одного из лидеров в вопросах безопасности и этики ИИ, такой эпизод, по их оценке, особенно чувствителен.

Этот спор наложился на на более раннюю историю о том, как Claude определяет, откуда заходит пользователь.

Пользователи замечали, что письма с кодами подтверждения и уведомлениями о входе содержат примерную геолокацию: страну, регион или город.

Эти данные обычно вычисляются по IP-адресу, параметрам сети и устройства, поэтому при использовании виртуальных или корпоративных сетей, а также прокси, указанное место может не совпадать с реальным.

Справедливости ради - в политике конфиденциальности Anthropic сказано, что компания собирает IP-адреса, сведения об устройстве и соединении, а также определяемое по IP местоположение для безопасности, борьбы с мошенничеством и контроля за соблюдением условий сервиса.

Обе истории острее всего восприняли в китайском сегменте. Доступ к продуктам Anthropic в стране закрыт, поэтому там распространены зарубежные аккаунты, трансграничный доступ и сторонние сервисы-посредники.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤3

2.36K views06:31

About

Blog

Apps

Platform