Топ обсуждений в AI-сообществе сегодня:
Anthropic заявляет о масштабных «атаках дистилляцией» со стороны DeepSeek, Moonshot AI и MiniMax
Компания Anthropic предупреждает, что DeepSeek, Moonshot AI и MiniMax использовали её модели для промышленной дистилляции знаний в свои системы.
Руководство по обучению и дистилляции моделей Llama
Сборник советов от сообщества, охватывающий использование LoRA, QLoRA, MoE, чекпоинтов и требования к GPU.
Claude Sonnet-4.6 выдает себя за DeepSeek-V3 при запросах на китайском языке
Пользователи заметили, что при общении на китайском языке модель от Anthropic утверждает, будто она является разработкой DeepSeek.
Обсуждение локального запуска OpenClaw
В сообществе иронизируют над возможностью локального запуска OpenClaw, ссылаясь на уведомления безопасности Meta и общие вопросы обучения Llama.
Anthropic критикуют за отсутствие open source моделей
Отмечается, что в отличие от Google и OpenAI, компания Anthropic никогда не выпускала свои модели или токенизаторы в открытый доступ.
LocoOperator-4B: агентная модель для вызова инструментов
Модель на 4 миллиарда параметров, обученная методом дистилляции на основе трейсов инференса Qwen3-Coder-Next.
Steerling: интерпретируемые каузальные диффузионные языковые модели
Проект по созданию языковых моделей на базе диффузионных методов для повышения прозрачности их работы.
Набор задач для проверки пределов вычислительных систем
Репозиторий с различными челленджами по программированию, предназначенными для тестирования возможностей современных систем.
Солвер ARC-AGI-2 от Confluence Labs
Передовое решение для прохождения бенчмарка ARC-AGI-2, демонстрирующее современные результаты в задачах на логику.
Qwen3.5-397B-A17B в формате FP8
Выход масштабной модели от Alibaba в квантованном формате для более эффективного инференса.
Anthropic заявляет о масштабных «атаках дистилляцией» со стороны DeepSeek, Moonshot AI и MiniMax
Компания Anthropic предупреждает, что DeepSeek, Moonshot AI и MiniMax использовали её модели для промышленной дистилляции знаний в свои системы.
Руководство по обучению и дистилляции моделей Llama
Сборник советов от сообщества, охватывающий использование LoRA, QLoRA, MoE, чекпоинтов и требования к GPU.
Claude Sonnet-4.6 выдает себя за DeepSeek-V3 при запросах на китайском языке
Пользователи заметили, что при общении на китайском языке модель от Anthropic утверждает, будто она является разработкой DeepSeek.
Обсуждение локального запуска OpenClaw
В сообществе иронизируют над возможностью локального запуска OpenClaw, ссылаясь на уведомления безопасности Meta и общие вопросы обучения Llama.
Anthropic критикуют за отсутствие open source моделей
Отмечается, что в отличие от Google и OpenAI, компания Anthropic никогда не выпускала свои модели или токенизаторы в открытый доступ.
LocoOperator-4B: агентная модель для вызова инструментов
Модель на 4 миллиарда параметров, обученная методом дистилляции на основе трейсов инференса Qwen3-Coder-Next.
Steerling: интерпретируемые каузальные диффузионные языковые модели
Проект по созданию языковых моделей на базе диффузионных методов для повышения прозрачности их работы.
Набор задач для проверки пределов вычислительных систем
Репозиторий с различными челленджами по программированию, предназначенными для тестирования возможностей современных систем.
Солвер ARC-AGI-2 от Confluence Labs
Передовое решение для прохождения бенчмарка ARC-AGI-2, демонстрирующее современные результаты в задачах на логику.
Qwen3.5-397B-A17B в формате FP8
Выход масштабной модели от Alibaba в квантованном формате для более эффективного инференса.
Reddit
From the LocalLLaMA community on Reddit: Anthropic: "We’ve identified industrial-scale distillation attacks on our models by DeepSeek…
Explore this post and more from the LocalLLaMA community
👍2❤1
Модель выбора персоны
Почему ИИ-ассистенты ведут себя по-человечески? Anthropic предлагает теорию «модели выбора персоны», объясняющую, как обучение формирует человекоподобное поведение ИИ и какие последствия это имеет для разработки.
Читать статью
Почему ИИ-ассистенты ведут себя по-человечески? Anthropic предлагает теорию «модели выбора персоны», объясняющую, как обучение формирует человекоподобное поведение ИИ и какие последствия это имеет для разработки.
Читать статью
Вайб-кодинг — это новый продакт-менеджмент
Naval Ravikant о том, как Claude Code и подобные инструменты превращают обычных людей в создателей приложений, и почему это изменит всё.
Читать статью
Naval Ravikant о том, как Claude Code и подобные инструменты превращают обычных людей в создателей приложений, и почему это изменит всё.
Читать статью
🔥1🤯1
Ого, нас почти 1000!
Я создал этот канал, чтобы делиться с друзьями и коллегами статьями про AI, которые я сам каждый день читаю.
Каким-то невероятным образом (и явно благодаря рекомендациям @RationalAnswer) нас уже 978, а график роста канала подозрительно похож на динамику развития AI.
Если вам (вдруг) захочется поделиться статьями этого канала со своими друзьями и коллегами, вот самые популярные посты:
Какой ИИ использовать в эпоху агентов: руководство
https://t.me/ai_longreads/265
Пять уровней интеграции разработки с AI
https://t.me/ai_longreads/241
Ещё восемь месяцев с агентами
https://t.me/ai_longreads/214
Изнутри Felix: ИИ на OpenClaw, зарабатывающий тысячи долларов в неделю
https://t.me/ai_longreads/266
Происходит что-то большое
https://t.me/ai_longreads/213
Я создал этот канал, чтобы делиться с друзьями и коллегами статьями про AI, которые я сам каждый день читаю.
Каким-то невероятным образом (и явно благодаря рекомендациям @RationalAnswer) нас уже 978, а график роста канала подозрительно похож на динамику развития AI.
Если вам (вдруг) захочется поделиться статьями этого канала со своими друзьями и коллегами, вот самые популярные посты:
Какой ИИ использовать в эпоху агентов: руководство
https://t.me/ai_longreads/265
Пять уровней интеграции разработки с AI
https://t.me/ai_longreads/241
Ещё восемь месяцев с агентами
https://t.me/ai_longreads/214
Изнутри Felix: ИИ на OpenClaw, зарабатывающий тысячи долларов в неделю
https://t.me/ai_longreads/266
Происходит что-то большое
https://t.me/ai_longreads/213
❤12👍6⚡3
Эффективность токенов в OpenClaw: пусть скрипты делают тяжёлую работу
Практическое руководство по оптимизации затрат на токены: замена «умного опроса» на «простые скрипты + умные триггеры».
Читать статью
Практическое руководство по оптимизации затрат на токены: замена «умного опроса» на «простые скрипты + умные триггеры».
Читать статью
👍6
Minions: агенты для кодинга в Stripe, которые решают задачи от начала до конца за один проход
В Stripe создали собственных coding-агентов под названием Minions, которые полностью автономно пишут код — от получения задачи до готового pull request. Каждую неделю они создают более тысячи PR, которые проходят ревью и мержатся без единой строчки кода от человека.
Читать статью
В Stripe создали собственных coding-агентов под названием Minions, которые полностью автономно пишут код — от получения задачи до готового pull request. Каждую неделю они создают более тысячи PR, которые проходят ревью и мержатся без единой строчки кода от человека.
Читать статью
👍2
Агент-ориентированная разработка
Как перестроить инженерную организацию вокруг AI-агентов как основных исполнителей, а не вокруг инженеров — и почему это отличает 1x-разработчиков от 100x-разработчиков.
Читать статью
Как перестроить инженерную организацию вокруг AI-агентов как основных исполнителей, а не вокруг инженеров — и почему это отличает 1x-разработчиков от 100x-разработчиков.
Читать статью
👍1
Язык для агентов
Армин Ронахер размышляет о том, почему нам нужны новые языки программирования, оптимизированные для агентного кодинга, и какие характеристики делают язык удобным для LLM.
Читать статью
Армин Ронахер размышляет о том, почему нам нужны новые языки программирования, оптимизированные для агентного кодинга, и какие характеристики делают язык удобным для LLM.
Читать статью
👍1
Media is too big
VIEW IN TELEGRAM
GPT для поиска статей в канале
У нас накопилось уже больше 280 статей и я подумал, что нужен какой-то удобный способ поиска по всем опубликованным материалам.
Поэтому я создал GPT и загрузил ему индекс и тексты всех статей и сказал искать среди них по вашему запросу - https://chatg.pt/TbZetHm
Больше оно ничего не умеет, зато четко следует инструкциям и статьи не придумывает. Переодически этот GPT будет обновляться, чтобы его база знаний была всегда актуальной.
Можете попробовать уже сейчас, просто спросите “Найди статьи про Claude Code” (тут я видео немного убыстрил, но обычно справляется с поиском за 20-40 секунд).
У нас накопилось уже больше 280 статей и я подумал, что нужен какой-то удобный способ поиска по всем опубликованным материалам.
Поэтому я создал GPT и загрузил ему индекс и тексты всех статей и сказал искать среди них по вашему запросу - https://chatg.pt/TbZetHm
Больше оно ничего не умеет, зато четко следует инструкциям и статьи не придумывает. Переодически этот GPT будет обновляться, чтобы его база знаний была всегда актуальной.
Можете попробовать уже сейчас, просто спросите “Найди статьи про Claude Code” (тут я видео немного убыстрил, но обычно справляется с поиском за 20-40 секунд).
👍10🔥5❤1
Почему вашему агенту нужен файл Principles.md
Большинство ИИ-агентов оптимизируются не под то. Они выполняют задачи, следуют инструкциям, но не имеют собственных принципов. Решение — дать агенту во что верить.
Читать статью
Большинство ИИ-агентов оптимизируются не под то. Они выполняют задачи, следуют инструкциям, но не имеют собственных принципов. Решение — дать агенту во что верить.
Читать статью
❤6👍2
Два паттерна подключения агентов к песочницам
Всё больше ИИ-агентов нуждаются в рабочем пространстве — компьютере, где они могут выполнять код, устанавливать пакеты и работать с файлами. Песочницы обеспечивают такую изоляцию. Существует два архитектурных паттерна интеграции.
Читать статью
Всё больше ИИ-агентов нуждаются в рабочем пространстве — компьютере, где они могут выполнять код, устанавливать пакеты и работать с файлами. Песочницы обеспечивают такую изоляцию. Существует два архитектурных паттерна интеграции.
Читать статью
👍1
Полное руководство: Claude для Excel
Подробный гайд по использованию Claude для Excel - ИИ-боковой панели, которая читает всю вашу рабочую книгу целиком и превращает работу с электронными таблицами в диалог со структурным аналитиком.
Читать статью
Подробный гайд по использованию Claude для Excel - ИИ-боковой панели, которая читает всю вашу рабочую книгу целиком и превращает работу с электронными таблицами в диалог со структурным аналитиком.
Читать статью
🔥6👍2🙏2
Топ обсуждений в AI-сообществе сегодня:
Python SDK для моделей Apple Intelligence
Python-библиотека для доступа к локальным моделям Apple через фреймворк Foundation Models.
Qwen3.5-35B-A3B показывает отличные результаты в агентном написании кода
Модель способна работать на одной RTX 3090 через llama.cpp и справляется со сложными задачами мобильной разработки за считанные минуты.
PersonalStyleAI — фреймворк для имитации вашего стиля общения
Инструмент для создания моделей, которые думают и выражаются как вы: от очистки истории чатов до локального fine-tuning через LoRA.
Anthropic стала значимым участником рынка open-weight моделей
В сообществе обсуждают непреднамеренный вклад компании в развитие открытых весов и призывают к активной дистилляции её моделей.
opentwitter-mcp — MCP-сервер для работы с данными X (Twitter)
Инструмент для доступа к профилям пользователей, поиску твитов и отслеживанию активности инфлюенсеров.
Проверка жизнеспособности ИИ-проектов через MCP
Сервер idea-reality-mcp сопоставляет идеи проектов с данными GitHub, Hacker News и Product Hunt, выставляя оценку реалистичности от 0 до 100.
Бенчмарк Qwen 3.5 на сложных задачах программирования
Сравнение моделей семейства Qwen 3.5 и Codex 5.3 на 70 реальных репозиториях выявило значительные различия в производительности и навыках работы с инструментами.
Дефицит открытых моделей из США становится проблемой
Обсуждение нехватки американских open-source LLM, что вынуждает пользователей выбирать между закрытыми системами или политически рискованными китайскими альтернативами.
Сравнение производительности Qwen3.5 27B и 35B-A3B
Анализ эффективности работы моделей на пользовательских системах с 16 ГБ VRAM и 32 ГБ оперативной памяти.
ZSE — серверный движок инференса для LLM
Новый проект Zyora Server Inference Engine для эффективного запуска больших языковых моделей.
Python SDK для моделей Apple Intelligence
Python-библиотека для доступа к локальным моделям Apple через фреймворк Foundation Models.
Qwen3.5-35B-A3B показывает отличные результаты в агентном написании кода
Модель способна работать на одной RTX 3090 через llama.cpp и справляется со сложными задачами мобильной разработки за считанные минуты.
PersonalStyleAI — фреймворк для имитации вашего стиля общения
Инструмент для создания моделей, которые думают и выражаются как вы: от очистки истории чатов до локального fine-tuning через LoRA.
Anthropic стала значимым участником рынка open-weight моделей
В сообществе обсуждают непреднамеренный вклад компании в развитие открытых весов и призывают к активной дистилляции её моделей.
opentwitter-mcp — MCP-сервер для работы с данными X (Twitter)
Инструмент для доступа к профилям пользователей, поиску твитов и отслеживанию активности инфлюенсеров.
Проверка жизнеспособности ИИ-проектов через MCP
Сервер idea-reality-mcp сопоставляет идеи проектов с данными GitHub, Hacker News и Product Hunt, выставляя оценку реалистичности от 0 до 100.
Бенчмарк Qwen 3.5 на сложных задачах программирования
Сравнение моделей семейства Qwen 3.5 и Codex 5.3 на 70 реальных репозиториях выявило значительные различия в производительности и навыках работы с инструментами.
Дефицит открытых моделей из США становится проблемой
Обсуждение нехватки американских open-source LLM, что вынуждает пользователей выбирать между закрытыми системами или политически рискованными китайскими альтернативами.
Сравнение производительности Qwen3.5 27B и 35B-A3B
Анализ эффективности работы моделей на пользовательских системах с 16 ГБ VRAM и 32 ГБ оперативной памяти.
ZSE — серверный движок инференса для LLM
Новый проект Zyora Server Inference Engine для эффективного запуска больших языковых моделей.
GitHub
GitHub - apple/python-apple-fm-sdk: Python bindings for access to the on-device model at the core of Apple Intelligence through…
Python bindings for access to the on-device model at the core of Apple Intelligence through the Foundation Models framework - apple/python-apple-fm-sdk
❤2🔥2
Представляем Showboat и Rodney — инструменты для демонстрации работы агентов
Два новых CLI-инструмента помогают программистским агентам не просто тестировать код, но и наглядно демонстрировать результаты своей работы — создавая документы с примерами выполнения команд и скриншотами.
Читать статью
Два новых CLI-инструмента помогают программистским агентам не просто тестировать код, но и наглядно демонстрировать результаты своей работы — создавая документы с примерами выполнения команд и скриншотами.
Читать статью
Как мы нанимаем инженеров, когда ИИ пишет наш код
Основатель Tolan рассказывает, как его компания перестроила процесс найма инженеров с нуля, сделав ИИ-инструменты неотъемлемой частью собеседования — потому что именно так выглядит реальная работа.
Читать статью
Основатель Tolan рассказывает, как его компания перестроила процесс найма инженеров с нуля, сделав ИИ-инструменты неотъемлемой частью собеседования — потому что именно так выглядит реальная работа.
Читать статью
Управление памятью Claude
Как управлять памятью Claude Code между сессиями, используя различные типы хранилищ и лучшие практики.
Читать статью
Как управлять памятью Claude Code между сессиями, используя различные типы хранилищ и лучшие практики.
Читать статью
👍4
Мультиагентный плейбук Codex, часть 1: руководство по настройке
Подробное руководство по настройке пользовательских мультиагентных ролей в Codex — от конфигурации до готовых шаблонов, которые можно сразу использовать в своих проектах.
Читать статью
Подробное руководство по настройке пользовательских мультиагентных ролей в Codex — от конфигурации до готовых шаблонов, которые можно сразу использовать в своих проектах.
Читать статью
❤1👍1
Я протестировал все 21 плагин Claude Cowork. Вот рейтинг, который никто не публикует
Автор четыре недели тестировал все 21 плагин Claude Cowork на реальных рабочих задачах и составил честный tier list — от S-уровня до C-уровня, — который не решилась опубликовать ни одна компания.
Читать статью
Автор четыре недели тестировал все 21 плагин Claude Cowork на реальных рабочих задачах и составил честный tier list — от S-уровня до C-уровня, — который не решилась опубликовать ни одна компания.
Читать статью
👍4
Ваша компания — это файловая система
Если представить компанию как файловую систему, ИИ-агенты смогут решать бизнес-задачи, просто читая и записывая файлы.
Читать статью
Если представить компанию как файловую систему, ИИ-агенты смогут решать бизнес-задачи, просто читая и записывая файлы.
Читать статью
👍1
Уроки разработки Claude Code: как научиться видеть глазами агента
Тарик, один из разработчиков Claude Code, делится опытом проектирования инструментов для ИИ-агентов — от первых неудачных экспериментов до выработки работающих принципов дизайна.
Читать статью
Тарик, один из разработчиков Claude Code, делится опытом проектирования инструментов для ИИ-агентов — от первых неудачных экспериментов до выработки работающих принципов дизайна.
Читать статью
👍3