Про AI: Лучшие cтатьи и исследования

Топ обсуждений в AI-сообществе сегодня:

Anthropic заявляет о масштабных «атаках дистилляцией» со стороны DeepSeek, Moonshot AI и MiniMax
Компания Anthropic предупреждает, что DeepSeek, Moonshot AI и MiniMax использовали её модели для промышленной дистилляции знаний в свои системы.

Руководство по обучению и дистилляции моделей Llama
Сборник советов от сообщества, охватывающий использование LoRA, QLoRA, MoE, чекпоинтов и требования к GPU.

Claude Sonnet-4.6 выдает себя за DeepSeek-V3 при запросах на китайском языке
Пользователи заметили, что при общении на китайском языке модель от Anthropic утверждает, будто она является разработкой DeepSeek.

Обсуждение локального запуска OpenClaw
В сообществе иронизируют над возможностью локального запуска OpenClaw, ссылаясь на уведомления безопасности Meta и общие вопросы обучения Llama.

Anthropic критикуют за отсутствие open source моделей
Отмечается, что в отличие от Google и OpenAI, компания Anthropic никогда не выпускала свои модели или токенизаторы в открытый доступ.

LocoOperator-4B: агентная модель для вызова инструментов
Модель на 4 миллиарда параметров, обученная методом дистилляции на основе трейсов инференса Qwen3-Coder-Next.

Steerling: интерпретируемые каузальные диффузионные языковые модели
Проект по созданию языковых моделей на базе диффузионных методов для повышения прозрачности их работы.

Набор задач для проверки пределов вычислительных систем
Репозиторий с различными челленджами по программированию, предназначенными для тестирования возможностей современных систем.

Солвер ARC-AGI-2 от Confluence Labs
Передовое решение для прохождения бенчмарка ARC-AGI-2, демонстрирующее современные результаты в задачах на логику.

Qwen3.5-397B-A17B в формате FP8
Выход масштабной модели от Alibaba в квантованном формате для более эффективного инференса.

From the LocalLLaMA community on Reddit: Anthropic: "We’ve identified industrial-scale distillation attacks on our models by DeepSeek…

Explore this post and more from the LocalLLaMA community

👍2❤1

579 views05:00