Анализ данных (Data analysis)
50.3K subscribers
3.31K photos
411 videos
1 file
2.73K links
Data science, наука о данных.

@haarrp - админ

РКН: clck.ru/3FmyAp
Download Telegram
Anthropic начала возвращать доступ к Claude Mythos 5, но пока не всем.

Компания заявила, что с 12 июня работала с правительством США, чтобы восстановить доступ к Claude Mythos 5 и Fable 5.

Теперь власти разрешили снова развернуть Mythos 5 для части американских организаций, которые занимаются эксплуатацией и защитой критической инфраструктуры.

Anthropic называет Mythos 5 своей самой сильной моделью для кибербезопасности.

То есть доступ возвращают не глобально, а сначала тем структурам, которые работают с инфраструктурой, безопасностью и защитой систем.

Параллельно компания продолжает переговоры с правительством, чтобы расширить доступ к Mythos 5 и снова сделать Fable 5 доступной для общего использования.

Ситуация хорошо показывает новый режим для frontier-моделей: релиз уже зависит не только от самой лаборатории, но и от согласований с государством.

https://x.com/AnthropicAI/status/2070665903440871779
10👍6🌭4😁2🔥1
США снова открыли доступ к Claude Mythos 5 от Anthropic для более чем 100 одобренных организаций.

Теперь доступ к Mythos 5 получат более 100 компаний и институтов, включая многие компании из Fortune 500.

«Я определил, что необходимые меры безопасности соблюдены, чтобы разрешить отдельным доверенным партнёрам доступ к модели Claude Mythos 5», - написал министр торговли Говард Латник в пятницу Тому Брауну, chief compute officer Anthropic.

Точный список Annex A не был опубликован.

Ранее публичная founding group Project Glasswing включала AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks.

Но этот публичный список партнёров не является тем же самым, что секретный список Annex A.

Похоже, правительство делает приоритет на институтах, где defensive upside выше, а риск misuse проще контролировать: cloud providers, chip-компании, vendors операционных систем, security-компании, банки, операторы инфраструктуры и федеральные агентства.

https://www.semafor.com/article/06/27/2026/us-releases-powerful-anthropic-model-mythos-to-some-us-companies
5👍2🤨2
BrowserBC - новый open-source проект от команды ViDA, который исследует более эффективный способ запускать web agents.

Вместо того чтобы использовать frontier-модель на каждом шаге agent workflow, BrowserBC один раз записывает человеческий web flow с помощью более сильной модели, превращает его в переиспользуемый skill, а затем отдаёт выполнение меньшей и более дешёвой модели.

Результаты выглядят заметно: на WebArena-Hard число tool calls падает на 27%, а success rate растёт с 60% до 81%.

https://github.com/Einsia/Browser-BC
🔥87👍4
✔️ Fine-tuning больших LLM больше не обязан быть мучительно медленным.

4 open-source библиотеки, которые ускоряют обучение моделей:

1. Unsloth AI
Ускоряет fine-tuning Qwen, Llama, Gemma и других моделей, снижает расход VRAM, подходит даже для consumer GPU и Colab/Kaggle.
https://github.com/unslothai/unsloth

2. LLaMA Factory
Удобный CLI и WebUI для fine-tuning 100+ моделей. Поддерживает LoRA, QLoRA, full/frozen tuning и разные режимы квантования.
https://github.com/hiyouga/LLaMA-Factory

3. DeepSpeed
Фреймворк для масштабного distributed training: ZeRO, FSDP, multi-GPU, multi-node и продвинутая оптимизация памяти.
https://github.com/deepspeedai/DeepSpeed

4. Axolotl
Yaml-based пайплайн для LoRA/QLoRA, DPO, GRPO и multimodal fine-tuning. Хорошо дружит с Hugging Face.
https://github.com/axolotl-ai-cloud/axolotl
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥3
FT: Apple просит Вашингтон разрешить закупку DRAM у CXMT, китайского поставщика из чёрного списка, потому что спрос на AI-серверы сделал обычную память для устройств болезненно дорогой.

DRAM - это краткосрочная рабочая память внутри iPhone, Mac и iPad. HBM - более быстрая многослойная версия памяти для AI-ускорителей. Из-за AI-бума производственные мощности всё сильнее уходят в серверы, а не в потребительские устройства.

Проблема Apple в давлении поставщиков. Компания в основном зависит от Micron, Samsung и SK Hynix, тогда как CXMT могла бы дать более дешёвую поставку из китайской программы развития памяти, поддержанной государством.

Но CXMT находится в списке Chinese Military Company у Пентагона. Сам по себе он не запрещает Apple покупать у компании, но сигнализирует о риске для нацбезопасности. Ситуация станет куда серьёзнее, если Минторг США добавит CXMT в Entity List.

Потеря Apple $263 млрд рыночной стоимости была связана с давлением цен на память, из-за которого пришлось поднимать цены на MacBook и iPad. Это показывает, как спрос на AI-инфраструктуру уже повышает себестоимость обычных потребительских устройств.

https://www.ft.com/content/d72a25e2-7bde-4aa9-bd8d-0c4f3d6cb2cb?syn-25a6b1a6=1
👍72🔥1
🖥 NVIDIA показала HORIZON для agentic hardware design

У NVIDIA вышла работа про HORIZON - систему, где агентное программирование переносится в дизайн железа.

Идея интересная: hardware design рассматривается не как разовая генерация Verilog-кода, а как эволюция целого репозитория. Markdown harness превращается в project pack: внутри доменные знания, исполняемый evaluator, критерий приёмки и правила работы с git.

Дальше агент не просто пишет кусок кода, а меняет изолированное worktree, запускает проверки и двигается по результатам verifier harness.

Для железа это особенно важно. Здесь мало красивого ответа в чате: дизайн должен проходить исполняемые тесты, симуляции и формальные ограничения. Поэтому verifier становится настоящим интерфейсом между агентом и задачей.

В статье заявляют 100% benchmark completion на нескольких наборах задач по hardware design. Даже если вы не работаете с EDA, за этим стоит следить: agentic coding начинает заходить туда, где ошибка стоит намного дороже, чем сломанный unit test.

Paper: https://arxiv.org/abs/2606.28279
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍3😍1
❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️

Как научить ИИ искать информацию, управлять контекстом и автоматизировать сложные процессы?

Ответы на эти вопросы разберут на событии Yandex AI Studio Series Summer Edition, которое стартует 16 июля и продлится до 30 июля.

Событие объединит экспертов Яндекса и специалистов, которые создают современные ИИ-продукты и хотят глубже разобраться в архитектуре агентных систем и возможностях Yandex AI Studio.

Для кого:
— backend- и fullstack-разработчиков;
— ML/ИИ-инженеров;
— продуктовых менеджеров;
— бизнес-аналитиков, интеграторов и ИИ-стартапов.

Присоединяйтесь к Yandex AI Studio Series, чтобы узнать, как применять ИИ-инструменты в реальных задачах, а не только экспериментировать с ними.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🙏1🍌1
Команда LongCat представила LongCat-2.0 - полную модель, которая стоит за Owl Alpha на OpenRouter.

Это MoE-модель на 1.6T параметров, примерно с 48B активных параметров и контекстом до 1M токенов. Основной фокус - agentic coding и длинные задачи, где модели нужно не просто отвечать, а работать с репозиторием, терминалом, поиском и большим объёмом контекста.

В архитектуре есть несколько важных решений. LongCat Sparse Attention отвечает за эффективную работу с 1M-context. Zero-Compute Experts динамически активируют от 33B до 56B параметров на токен, не тратя вычисления на лишние эксперты. MOPD делит экспертизу на три группы: Agent, Reasoning и Interaction, а gate выбирает нужный маршрут под задачу.

По заявленным результатам модель выглядит сильной именно в агентных сценариях: 70.8 на Terminal-Bench 2.1, 59.5 на SWE-bench Pro, 77.3 на SWE-bench Multilingual, 73.2 на FORTE, 78.8 на RWSearch и 79.9 на BrowseComp.

Tech Blog: https://longcat.chat/blog/longcat-2.0/
4👍1🔥1
Fable 5 может потребовать верификацию личности

* Новые строки из утечки приложения Claude намекают, что Fable 5 могут вынести в отдельную систему usage credits, с оплатой вне обычной подписки.

* В том же обновлении упоминается проверка личности: «Ваши кредиты будут добавлены после подтверждения вашей личности». Это появилось рядом с изменениями по кредитам для Fable 5, хотя Anthropic раньше говорила, что ID-проверки не связаны с Fable.

* Похоже, Fable 5 может выйти с верификацией личности, более строгим доступом и отдельной оплатой по использованию.
7🥱4👍3🔥2🤯1💔1
⚡️ Google открыла Nano Banana 2 Lite и Gemini Omni Flash

Google выкатила два новых инструмента для генеративных медиа: Nano Banana 2 Lite для быстрых изображений и Gemini Omni Flash для видео и conversational editing.

Nano Banana 2 Lite - самая быстрая и дешёвая image-модель в линейке Nano Banana. Она рассчитана на high-throughput пайплайны, прототипирование и массовую генерацию, где важны скорость и цена. Google заявляет около 4 секунд на text-to-image и цену $0.034 за 1K image. При этом модель сохраняет нормальное следование промпту, стабильность персонажей и читаемый текст внутри изображения.

Gemini Omni Flash - модель для генерации и редактирования видео через текст, изображения и видео-референсы. Её можно использовать для natural language video editing, мультимодальных сцен, синхронизации текста с действием и быстрых итераций. Цена заявлена на уровне $0.10 за секунду видео, как у Veo 3.1 Fast.

Сначала Nano Banana 2 Lite быстро генерирует изображение, потом Omni Flash превращает его в видео. Через Interactions API можно сохранять историю сессии и делать до трёх последовательных правок.

Ограничения у Omni Flash пока есть: генерация до 10 секунд, audio references и scene extension в API ещё не поддерживаются, а длинные video references пока обрабатываются неидеально.

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni-flash-nano-banana-2-lite/

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍2🔥2