Руководство разработчика по fine-tuning и дистилляции языковых моделей
Практическое руководство для разработчиков, которые хотят дообучать open-source LLM и дистиллировать большие модели в компактные и быстрые — техники, инструменты, датасеты и облачные GPU.
Читать статью
Практическое руководство для разработчиков, которые хотят дообучать open-source LLM и дистиллировать большие модели в компактные и быстрые — техники, инструменты, датасеты и облачные GPU.
Читать статью
👍4
Чего дизайнерам не хватает в понимании Claude Code
Дизайнер делится опытом перехода от Cursor к Claude Code с MCP-интеграциями для Figma, Framer и Remotion — и объясняет, почему это меняет правила игры для «нетехнических» людей.
Читать статью
Дизайнер делится опытом перехода от Cursor к Claude Code с MCP-интеграциями для Figma, Framer и Remotion — и объясняет, почему это меняет правила игры для «нетехнических» людей.
Читать статью
👍8
Топ обсуждений в AI-сообществе сегодня:
Вклад Андрея Карпати в развитие ИИ
В сообществе обсуждают значимость деятельности Андрея Карпати и его влияние на конкуренцию в сфере разработки нейросетей.
Ожидания моделей 9B против 35B
Пользователи выбирают наиболее востребованную размерность параметров для будущих релизов локальных моделей.
Нишевые сценарии использования локальных LLaMA
Обсуждение и поиск необычных способов применения языковых моделей в локальной среде для специфических задач.
Релиз модели DeepGen-1.0
Команда deepgenteam представила новую модель DeepGen-1.0, подробности о которой опубликованы в статье на arXiv.
Предупреждение о плагиате в ПО Shade
Проект Shade признан мошеннической копией кода Heretic и может использоваться для распространения вредоносного ПО.
vibe-local: среда разработки для Apple Silicon
Бесплатный инструмент для написания кода с ИИ, объединяющий Ollama и Python на устройствах Mac.
Конфликт ByteDance и Голливуда из-за Seedance 2.0
Релиз Seedance 2.0 от ByteDance вызвал резкую реакцию киноиндустрии и угрозы судебных исков в кратчайшие сроки.
Axon: графовый движок для анализа кода
Инструмент индексирует кодовые базы в граф знаний, предоставляя доступ через MCP для ИИ-агентов и CLI для разработчиков.
session-graph: граф знаний из диалогов с ИИ
Инструмент преобразует сессии из Claude, ChatGPT и DeepSeek в структурированные графы знаний с поддержкой SPARQL.
Управление аудио в Windows
Open source микшер для раздельного управления громкостью приложений с поддержкой профилей и горячих клавиш.
Вклад Андрея Карпати в развитие ИИ
В сообществе обсуждают значимость деятельности Андрея Карпати и его влияние на конкуренцию в сфере разработки нейросетей.
Ожидания моделей 9B против 35B
Пользователи выбирают наиболее востребованную размерность параметров для будущих релизов локальных моделей.
Нишевые сценарии использования локальных LLaMA
Обсуждение и поиск необычных способов применения языковых моделей в локальной среде для специфических задач.
Релиз модели DeepGen-1.0
Команда deepgenteam представила новую модель DeepGen-1.0, подробности о которой опубликованы в статье на arXiv.
Предупреждение о плагиате в ПО Shade
Проект Shade признан мошеннической копией кода Heretic и может использоваться для распространения вредоносного ПО.
vibe-local: среда разработки для Apple Silicon
Бесплатный инструмент для написания кода с ИИ, объединяющий Ollama и Python на устройствах Mac.
Конфликт ByteDance и Голливуда из-за Seedance 2.0
Релиз Seedance 2.0 от ByteDance вызвал резкую реакцию киноиндустрии и угрозы судебных исков в кратчайшие сроки.
Axon: графовый движок для анализа кода
Инструмент индексирует кодовые базы в граф знаний, предоставляя доступ через MCP для ИИ-агентов и CLI для разработчиков.
session-graph: граф знаний из диалогов с ИИ
Инструмент преобразует сессии из Claude, ChatGPT и DeepSeek в структурированные графы знаний с поддержкой SPARQL.
Управление аудио в Windows
Open source микшер для раздельного управления громкостью приложений с поддержкой профилей и горячих клавиш.
Reddit
From the LocalLLaMA community on Reddit: they have Karpathy, we are doomed ;)
Explore this post and more from the LocalLLaMA community
👍2
Навык, который изменил мою работу с Claude в маркетинге
Рекурсивный цикл самосовершенствования — техника, которая заставляет Claude итеративно улучшать свой вывод, пока он не достигнет заданной планки качества.
Читать статью
Рекурсивный цикл самосовершенствования — техника, которая заставляет Claude итеративно улучшать свой вывод, пока он не достигнет заданной планки качества.
Читать статью
👍3
Разговор с Беном Горовицем
Алекс Висснер-Гросс беседует с сооснователем a16z Беном Горовицем о засекречивании ИИ и физики, перспективах крипто как экономического слоя для ИИ-агентов, угрозе постоянного «низшего класса» и о том, как ИИ может решить целые научные дисциплины.
Читать статью
Алекс Висснер-Гросс беседует с сооснователем a16z Беном Горовицем о засекречивании ИИ и физики, перспективах крипто как экономического слоя для ИИ-агентов, угрозе постоянного «низшего класса» и о том, как ИИ может решить целые научные дисциплины.
Читать статью
👍4
Автоматическая дисциплина с OpenClaw
Как я использую ИИ-агента для поддержания структуры в своём дне без силы воли.
Читать статью
Как я использую ИИ-агента для поддержания структуры в своём дне без силы воли.
Читать статью
👍7
Уроки Lulubot: неделя создания и использования моего OpenClaw
Автор делится опытом создания и использования собственного ИИ-агента OpenClaw, анализируя ключевые выводы о технологии, доверии, экономике и будущем продуктов в эру автономных агентов.
Читать статью
Автор делится опытом создания и использования собственного ИИ-агента OpenClaw, анализируя ключевые выводы о технологии, доверии, экономике и будущем продуктов в эру автономных агентов.
Читать статью
👍3
Я создал рой ИИ-агентов в Discord. Это работает лучше всего, что я пробовал (полное руководство)
Практическое руководство по созданию системы координации ИИ-агентов в Discord: архитектура, распределение задач, управление памятью и автоматизация рабочих процессов.
Читать статью
Практическое руководство по созданию системы координации ИИ-агентов в Discord: архитектура, распределение задач, управление памятью и автоматизация рабочих процессов.
Читать статью
👍5❤1
Что такое персональный софт на самом деле
Дэн Шиппер размышляет о том, что персональный софт — это не vibe-coded SaaS, а агент, с которым вы строите отношения. На примере OpenClaw и своей компании Every он показывает, как агенты становятся зеркалом своих владельцев и наследуют их доверие.
Читать статью
Дэн Шиппер размышляет о том, что персональный софт — это не vibe-coded SaaS, а агент, с которым вы строите отношения. На примере OpenClaw и своей компании Every он показывает, как агенты становятся зеркалом своих владельцев и наследуют их доверие.
Читать статью
Claude только что убил наш стартап
Основатель рекламного AI-стартапа рассказывает, как одна функция Claude и Manus сделала целую категорию продуктов устаревшей, и делится прогнозами о будущем маркетинга и дистрибуции.
Читать статью
Основатель рекламного AI-стартапа рассказывает, как одна функция Claude и Manus сделала целую категорию продуктов устаревшей, и делится прогнозами о будущем маркетинга и дистрибуции.
Читать статью
👍8
Ваш CLAUDE.md сломан. Я спросил X, Reddit и YouTube, что реально работает
Исследование мнений сообщества разработчиков о лучших практиках для CLAUDE.md выявило две школы мысли — и обе оказались правы.
Читать статью
Исследование мнений сообщества разработчиков о лучших практиках для CLAUDE.md выявило две школы мысли — и обе оказались правы.
Читать статью
👍2
Какие вопросы нельзя откладывать?
Исследователи стратегии ИИ должны в первую очередь сосредоточиться на вопросах, связанных с ранними этапами перехода к продвинутому ИИ, даже если это означает отсрочку работы над вопросами, которые в конечном счёте кажутся более важными.
Читать статью
Исследователи стратегии ИИ должны в первую очередь сосредоточиться на вопросах, связанных с ранними этапами перехода к продвинутому ИИ, даже если это означает отсрочку работы над вопросами, которые в конечном счёте кажутся более важными.
Читать статью
Топ обсуждений в AI-сообществе сегодня:
Anthropic заявляет о масштабных «атаках дистилляцией» со стороны DeepSeek, Moonshot AI и MiniMax
Компания Anthropic предупреждает, что DeepSeek, Moonshot AI и MiniMax использовали её модели для промышленной дистилляции знаний в свои системы.
Руководство по обучению и дистилляции моделей Llama
Сборник советов от сообщества, охватывающий использование LoRA, QLoRA, MoE, чекпоинтов и требования к GPU.
Claude Sonnet-4.6 выдает себя за DeepSeek-V3 при запросах на китайском языке
Пользователи заметили, что при общении на китайском языке модель от Anthropic утверждает, будто она является разработкой DeepSeek.
Обсуждение локального запуска OpenClaw
В сообществе иронизируют над возможностью локального запуска OpenClaw, ссылаясь на уведомления безопасности Meta и общие вопросы обучения Llama.
Anthropic критикуют за отсутствие open source моделей
Отмечается, что в отличие от Google и OpenAI, компания Anthropic никогда не выпускала свои модели или токенизаторы в открытый доступ.
LocoOperator-4B: агентная модель для вызова инструментов
Модель на 4 миллиарда параметров, обученная методом дистилляции на основе трейсов инференса Qwen3-Coder-Next.
Steerling: интерпретируемые каузальные диффузионные языковые модели
Проект по созданию языковых моделей на базе диффузионных методов для повышения прозрачности их работы.
Набор задач для проверки пределов вычислительных систем
Репозиторий с различными челленджами по программированию, предназначенными для тестирования возможностей современных систем.
Солвер ARC-AGI-2 от Confluence Labs
Передовое решение для прохождения бенчмарка ARC-AGI-2, демонстрирующее современные результаты в задачах на логику.
Qwen3.5-397B-A17B в формате FP8
Выход масштабной модели от Alibaba в квантованном формате для более эффективного инференса.
Anthropic заявляет о масштабных «атаках дистилляцией» со стороны DeepSeek, Moonshot AI и MiniMax
Компания Anthropic предупреждает, что DeepSeek, Moonshot AI и MiniMax использовали её модели для промышленной дистилляции знаний в свои системы.
Руководство по обучению и дистилляции моделей Llama
Сборник советов от сообщества, охватывающий использование LoRA, QLoRA, MoE, чекпоинтов и требования к GPU.
Claude Sonnet-4.6 выдает себя за DeepSeek-V3 при запросах на китайском языке
Пользователи заметили, что при общении на китайском языке модель от Anthropic утверждает, будто она является разработкой DeepSeek.
Обсуждение локального запуска OpenClaw
В сообществе иронизируют над возможностью локального запуска OpenClaw, ссылаясь на уведомления безопасности Meta и общие вопросы обучения Llama.
Anthropic критикуют за отсутствие open source моделей
Отмечается, что в отличие от Google и OpenAI, компания Anthropic никогда не выпускала свои модели или токенизаторы в открытый доступ.
LocoOperator-4B: агентная модель для вызова инструментов
Модель на 4 миллиарда параметров, обученная методом дистилляции на основе трейсов инференса Qwen3-Coder-Next.
Steerling: интерпретируемые каузальные диффузионные языковые модели
Проект по созданию языковых моделей на базе диффузионных методов для повышения прозрачности их работы.
Набор задач для проверки пределов вычислительных систем
Репозиторий с различными челленджами по программированию, предназначенными для тестирования возможностей современных систем.
Солвер ARC-AGI-2 от Confluence Labs
Передовое решение для прохождения бенчмарка ARC-AGI-2, демонстрирующее современные результаты в задачах на логику.
Qwen3.5-397B-A17B в формате FP8
Выход масштабной модели от Alibaba в квантованном формате для более эффективного инференса.
Reddit
From the LocalLLaMA community on Reddit: Anthropic: "We’ve identified industrial-scale distillation attacks on our models by DeepSeek…
Explore this post and more from the LocalLLaMA community
👍2❤1
Модель выбора персоны
Почему ИИ-ассистенты ведут себя по-человечески? Anthropic предлагает теорию «модели выбора персоны», объясняющую, как обучение формирует человекоподобное поведение ИИ и какие последствия это имеет для разработки.
Читать статью
Почему ИИ-ассистенты ведут себя по-человечески? Anthropic предлагает теорию «модели выбора персоны», объясняющую, как обучение формирует человекоподобное поведение ИИ и какие последствия это имеет для разработки.
Читать статью
Вайб-кодинг — это новый продакт-менеджмент
Naval Ravikant о том, как Claude Code и подобные инструменты превращают обычных людей в создателей приложений, и почему это изменит всё.
Читать статью
Naval Ravikant о том, как Claude Code и подобные инструменты превращают обычных людей в создателей приложений, и почему это изменит всё.
Читать статью
🔥1🤯1
Ого, нас почти 1000!
Я создал этот канал, чтобы делиться с друзьями и коллегами статьями про AI, которые я сам каждый день читаю.
Каким-то невероятным образом (и явно благодаря рекомендациям @RationalAnswer) нас уже 978, а график роста канала подозрительно похож на динамику развития AI.
Если вам (вдруг) захочется поделиться статьями этого канала со своими друзьями и коллегами, вот самые популярные посты:
Какой ИИ использовать в эпоху агентов: руководство
https://t.me/ai_longreads/265
Пять уровней интеграции разработки с AI
https://t.me/ai_longreads/241
Ещё восемь месяцев с агентами
https://t.me/ai_longreads/214
Изнутри Felix: ИИ на OpenClaw, зарабатывающий тысячи долларов в неделю
https://t.me/ai_longreads/266
Происходит что-то большое
https://t.me/ai_longreads/213
Я создал этот канал, чтобы делиться с друзьями и коллегами статьями про AI, которые я сам каждый день читаю.
Каким-то невероятным образом (и явно благодаря рекомендациям @RationalAnswer) нас уже 978, а график роста канала подозрительно похож на динамику развития AI.
Если вам (вдруг) захочется поделиться статьями этого канала со своими друзьями и коллегами, вот самые популярные посты:
Какой ИИ использовать в эпоху агентов: руководство
https://t.me/ai_longreads/265
Пять уровней интеграции разработки с AI
https://t.me/ai_longreads/241
Ещё восемь месяцев с агентами
https://t.me/ai_longreads/214
Изнутри Felix: ИИ на OpenClaw, зарабатывающий тысячи долларов в неделю
https://t.me/ai_longreads/266
Происходит что-то большое
https://t.me/ai_longreads/213
❤12👍6⚡3
Эффективность токенов в OpenClaw: пусть скрипты делают тяжёлую работу
Практическое руководство по оптимизации затрат на токены: замена «умного опроса» на «простые скрипты + умные триггеры».
Читать статью
Практическое руководство по оптимизации затрат на токены: замена «умного опроса» на «простые скрипты + умные триггеры».
Читать статью
👍6
Minions: агенты для кодинга в Stripe, которые решают задачи от начала до конца за один проход
В Stripe создали собственных coding-агентов под названием Minions, которые полностью автономно пишут код — от получения задачи до готового pull request. Каждую неделю они создают более тысячи PR, которые проходят ревью и мержатся без единой строчки кода от человека.
Читать статью
В Stripe создали собственных coding-агентов под названием Minions, которые полностью автономно пишут код — от получения задачи до готового pull request. Каждую неделю они создают более тысячи PR, которые проходят ревью и мержатся без единой строчки кода от человека.
Читать статью
👍2
Агент-ориентированная разработка
Как перестроить инженерную организацию вокруг AI-агентов как основных исполнителей, а не вокруг инженеров — и почему это отличает 1x-разработчиков от 100x-разработчиков.
Читать статью
Как перестроить инженерную организацию вокруг AI-агентов как основных исполнителей, а не вокруг инженеров — и почему это отличает 1x-разработчиков от 100x-разработчиков.
Читать статью
👍1
Язык для агентов
Армин Ронахер размышляет о том, почему нам нужны новые языки программирования, оптимизированные для агентного кодинга, и какие характеристики делают язык удобным для LLM.
Читать статью
Армин Ронахер размышляет о том, почему нам нужны новые языки программирования, оптимизированные для агентного кодинга, и какие характеристики делают язык удобным для LLM.
Читать статью
👍1
Media is too big
VIEW IN TELEGRAM
GPT для поиска статей в канале
У нас накопилось уже больше 280 статей и я подумал, что нужен какой-то удобный способ поиска по всем опубликованным материалам.
Поэтому я создал GPT и загрузил ему индекс и тексты всех статей и сказал искать среди них по вашему запросу - https://chatg.pt/TbZetHm
Больше оно ничего не умеет, зато четко следует инструкциям и статьи не придумывает. Переодически этот GPT будет обновляться, чтобы его база знаний была всегда актуальной.
Можете попробовать уже сейчас, просто спросите “Найди статьи про Claude Code” (тут я видео немного убыстрил, но обычно справляется с поиском за 20-40 секунд).
У нас накопилось уже больше 280 статей и я подумал, что нужен какой-то удобный способ поиска по всем опубликованным материалам.
Поэтому я создал GPT и загрузил ему индекс и тексты всех статей и сказал искать среди них по вашему запросу - https://chatg.pt/TbZetHm
Больше оно ничего не умеет, зато четко следует инструкциям и статьи не придумывает. Переодически этот GPT будет обновляться, чтобы его база знаний была всегда актуальной.
Можете попробовать уже сейчас, просто спросите “Найди статьи про Claude Code” (тут я видео немного убыстрил, но обычно справляется с поиском за 20-40 секунд).
👍10🔥5❤1