От нуля до армии агентов Hermes
Подробнейший гайд по Hermes Agent — открытому агенту с 140K звёзд на GitHub. Ментальная модель, настройка, API-ключи, первый cron, дашборд, масштабирование и все практические советы для тех, кто хочет собрать собственную армию агентов.
Читать статью
Подробнейший гайд по Hermes Agent — открытому агенту с 140K звёзд на GitHub. Ментальная модель, настройка, API-ключи, первый cron, дашборд, масштабирование и все практические советы для тех, кто хочет собрать собственную армию агентов.
Читать статью
🔥5
Что сегодня обсуждают профессионалы AI-индустрии:
Meta направила юридическое уведомление проекту Heretic
Компания Meta предъявила юридические претензии разработчикам проекта Heretic.
Qwen с высокой вероятностью выпустит новую модель на 27B
Судя по обновленной дорожной карте, в ближайшее время ожидается релиз новой языковой модели Qwen с 27 миллиардами параметров.
В бенчмарках Hugging Face появился фильтр по размеру моделей
Платформа Hugging Face добавила возможность фильтрации наборов данных в бенчмарках по количеству параметров моделей.
yapsnap: инструмент для преобразования видео и аудио в текст
CLI-утилита позволяет быстро конвертировать любой URL видео или аудиофайл в текстовый формат без использования GPU и облачных сервисов.
Cohere представила Command A+ — эффективную MoE-модель с открытыми весами
Новая модель оптимизирована для эффективного инференса на ограниченных ресурсах GPU и распространяется под лицензией Apache 2.0.
Framedex — база знаний для поиска по видеоархивам
Проект позволяет создавать индексируемую базу данных для выполнения поисковых запросов по вашему архиву видеофайлов.
Релиз Command A+ с оптимизацией W4A4
Модель с открытым исходным кодом и 25 млрд активных параметров оптимизирована для агентных задач, мультиязычности и сложных рассуждений.
HRM-Text-1B: языковая модель на базе архитектуры иерархических рассуждений
Sapient Intelligence выпустила чекпоинт модели на 1 млрд параметров, обученной с нуля на структурированных публичных данных с использованием архитектуры HRM.
Результаты Qwen3.7 Max в Artificial Analysis и ожидание версий 27B/35B
Флагманская модель Qwen3.7 Max прошла тестирование Artificial Analysis, пока сообщество ожидает выход промежуточных версий на 27B и 35B.
webchat2api: API-прокси для веб-интерфейсов OpenAI и Grok
Инструмент для создания OpenAI-совместимого API из обычных веб-чатов с функциями управления аккаунтами GPT и Grok.
Meta направила юридическое уведомление проекту Heretic
Компания Meta предъявила юридические претензии разработчикам проекта Heretic.
Qwen с высокой вероятностью выпустит новую модель на 27B
Судя по обновленной дорожной карте, в ближайшее время ожидается релиз новой языковой модели Qwen с 27 миллиардами параметров.
В бенчмарках Hugging Face появился фильтр по размеру моделей
Платформа Hugging Face добавила возможность фильтрации наборов данных в бенчмарках по количеству параметров моделей.
yapsnap: инструмент для преобразования видео и аудио в текст
CLI-утилита позволяет быстро конвертировать любой URL видео или аудиофайл в текстовый формат без использования GPU и облачных сервисов.
Cohere представила Command A+ — эффективную MoE-модель с открытыми весами
Новая модель оптимизирована для эффективного инференса на ограниченных ресурсах GPU и распространяется под лицензией Apache 2.0.
Framedex — база знаний для поиска по видеоархивам
Проект позволяет создавать индексируемую базу данных для выполнения поисковых запросов по вашему архиву видеофайлов.
Релиз Command A+ с оптимизацией W4A4
Модель с открытым исходным кодом и 25 млрд активных параметров оптимизирована для агентных задач, мультиязычности и сложных рассуждений.
HRM-Text-1B: языковая модель на базе архитектуры иерархических рассуждений
Sapient Intelligence выпустила чекпоинт модели на 1 млрд параметров, обученной с нуля на структурированных публичных данных с использованием архитектуры HRM.
Результаты Qwen3.7 Max в Artificial Analysis и ожидание версий 27B/35B
Флагманская модель Qwen3.7 Max прошла тестирование Artificial Analysis, пока сообщество ожидает выход промежуточных версий на 27B и 35B.
webchat2api: API-прокси для веб-интерфейсов OpenAI и Grok
Инструмент для создания OpenAI-совместимого API из обычных веб-чатов с функциями управления аккаунтами GPT и Grok.
Reddit
From the LocalLLaMA community on Reddit: Heretic has been served a legal notice by Meta, Inc.
Explore this post and more from the LocalLLaMA community
❤2
Дизайн-системы теперь стали системами инференса
Три ключевых сдвига превращают дизайн-системы из предписывающих каталогов компонентов в адаптивные системы, с которыми работают ИИ-агенты: паттерны становятся параметрами, документация — контекстом, а управление — петлями обратной связи.
Читать статью
Три ключевых сдвига превращают дизайн-системы из предписывающих каталогов компонентов в адаптивные системы, с которыми работают ИИ-агенты: паттерны становятся параметрами, документация — контекстом, а управление — петлями обратной связи.
Читать статью
👍1
Проектирование, доработка и поддержка Agent Skills в Perplexity
Как команда Perplexity разрабатывает, оценивает и поддерживает модульные навыки для своих агентных продуктов — и почему написание хороших скиллов принципиально отличается от написания хорошего кода.
Читать статью
Как команда Perplexity разрабатывает, оценивает и поддерживает модульные навыки для своих агентных продуктов — и почему написание хороших скиллов принципиально отличается от написания хорошего кода.
Читать статью
👍2
Храповик сложности ИИ-агентов: почему 90% покрытие тестами обязательно
Гарри Тан, CEO Y Combinator, объясняет, почему тестовое покрытие в 90% -- это ключ к созданию надёжного программного обеспечения с помощью ИИ-агентов, и почему проекты без тестов обречены на провал.
Читать статью
Гарри Тан, CEO Y Combinator, объясняет, почему тестовое покрытие в 90% -- это ключ к созданию надёжного программного обеспечения с помощью ИИ-агентов, и почему проекты без тестов обречены на провал.
Читать статью
🔥1
Как получить максимум от Codex
Codex от OpenAI перестаёт быть узкоспециализированным помощником для написания кода и превращается в полноценную систему для выполнения самой разной компьютерной работы. Статья описывает ключевые возможности: долговечные треды, голосовой ввод, управление задачами, автоматизации и общую память.
Читать статью
Codex от OpenAI перестаёт быть узкоспециализированным помощником для написания кода и превращается в полноценную систему для выполнения самой разной компьютерной работы. Статья описывает ключевые возможности: долговечные треды, голосовой ввод, управление задачами, автоматизации и общую память.
Читать статью
👍5
Свежий AI-дайджест: темы дня с GitHub, Reddit и Hugging Face:
HRM-Text: Модель генерации текста на 1 млрд параметров
Модель на базе архитектуры HRM, усиленная механизмами выполнения задач и логическим выводом в латентном пространстве.
Lance: Унифицированная мультимодальная модель от ByteDance
Легковесная нативная модель для одновременного понимания, генерации и редактирования изображений и видео в рамках единого фреймворка.
Meta направила юридическое уведомление проекту Heretic
Компания Meta инициировала юридические действия в отношении разработчиков проекта Heretic.
humanize-text: Инструмент для обхода детекторов ИИ
Open source решение для преобразования сгенерированного контента в текст, неотличимый от написанного человеком, для обхода детекторов вроде Turnitin и GPTZero.
Hyperliquid Whale Tracker: Отслеживание крупных сделок на бирже
Инструмент для мониторинга действий крупных игроков на Hyperliquid с проверенной логикой работы через WebSocket.
PaperSpine: Помощник для анализа и написания научных статей
Инструмент для изучения академических работ, выстраивания центральной аргументации и редактирования рукописей с поддержкой LaTeX.
audit: Агент для автоматического поиска уязвимостей
Восьмиэтапный ИИ-агент, предназначенный для обнаружения уязвимостей в программном обеспечении.
Превью модели Supertonic 3
Компания Supertone опубликовала предварительную версию своей новой аудиомодели Supertonic 3.
Qwen готовится к выпуску моделей серии 3.7
Команда Qwen анонсировала скорый выход новой линейки моделей, вызвав большой интерес в сообществе разработчиков.
Обсуждение развития экосистемы в сообществе LocalLLaMA
Участники сообщества делятся положительными отзывами о текущем прогрессе в сфере локальных языковых моделей.
HRM-Text: Модель генерации текста на 1 млрд параметров
Модель на базе архитектуры HRM, усиленная механизмами выполнения задач и логическим выводом в латентном пространстве.
Lance: Унифицированная мультимодальная модель от ByteDance
Легковесная нативная модель для одновременного понимания, генерации и редактирования изображений и видео в рамках единого фреймворка.
Meta направила юридическое уведомление проекту Heretic
Компания Meta инициировала юридические действия в отношении разработчиков проекта Heretic.
humanize-text: Инструмент для обхода детекторов ИИ
Open source решение для преобразования сгенерированного контента в текст, неотличимый от написанного человеком, для обхода детекторов вроде Turnitin и GPTZero.
Hyperliquid Whale Tracker: Отслеживание крупных сделок на бирже
Инструмент для мониторинга действий крупных игроков на Hyperliquid с проверенной логикой работы через WebSocket.
PaperSpine: Помощник для анализа и написания научных статей
Инструмент для изучения академических работ, выстраивания центральной аргументации и редактирования рукописей с поддержкой LaTeX.
audit: Агент для автоматического поиска уязвимостей
Восьмиэтапный ИИ-агент, предназначенный для обнаружения уязвимостей в программном обеспечении.
Превью модели Supertonic 3
Компания Supertone опубликовала предварительную версию своей новой аудиомодели Supertonic 3.
Qwen готовится к выпуску моделей серии 3.7
Команда Qwen анонсировала скорый выход новой линейки моделей, вызвав большой интерес в сообществе разработчиков.
Обсуждение развития экосистемы в сообществе LocalLLaMA
Участники сообщества делятся положительными отзывами о текущем прогрессе в сфере локальных языковых моделей.
GitHub
GitHub - sapientinc/HRM-Text: HRM-Text is a 1B text generation model based on the HRM architecture, strengthened by task completion…
HRM-Text is a 1B text generation model based on the HRM architecture, strengthened by task completion and latent space reasoning. - sapientinc/HRM-Text
👍2
Промпт, цель и запуск в Colab с Codex!
Разработчик из OpenAI проверил, может ли Codex по одному промпту создать и обучить 10-миллионный трансформер на задаче сложения -- от написания кода до запуска в Google Colab и аудита результатов через субагентов.
Читать статью
Разработчик из OpenAI проверил, может ли Codex по одному промпту создать и обучить 10-миллионный трансформер на задаче сложения -- от написания кода до запуска в Google Colab и аудита результатов через субагентов.
Читать статью
Организация 100x: почему ClickUp сократил 22% сотрудников на пике роста
CEO ClickUp Зеб Эванс объясняет, почему компания провела масштабное сокращение не ради экономии, а ради перестройки вокруг новой модели «организации 100x» — где лучшие инженеры, продакт-менеджеры и менеджеры агентов создают стократный результат с помощью ИИ.
Читать статью
CEO ClickUp Зеб Эванс объясняет, почему компания провела масштабное сокращение не ради экономии, а ради перестройки вокруг новой модели «организации 100x» — где лучшие инженеры, продакт-менеджеры и менеджеры агентов создают стократный результат с помощью ИИ.
Читать статью
👏2
AI-дайджест: что обсуждают на GitHub, Reddit и Hugging Face:
NVIDIA убирает категорию игровых доходов из финансовых отчетов
Компания перестанет выделять выручку от игрового сегмента в отдельную категорию в своей финансовой отчетности.
Tencent выпустила модель Z-Image 6B для генерации в пиксельном пространстве
Модель работает без VAE, поддерживает разрешение 1k и генерирует изображения напрямую в пространстве пикселей.
DeepSeek планирует раунд финансирования на 10,29 миллиарда долларов
Глава компании Лян Вэньфэн намерен сосредоточиться на разработке open source моделей вместо погони за краткосрочной коммерциализацией.
Инструмент для апскейлинга и генерации кадров Lossless-Scaling
Решение с технологией LSFG для повышения четкости изображения и увеличения FPS, устанавливаемое одной командой.
Генератор ИИ-изображений и видео без цензуры
Инструмент для создания взрослого контента (18+) без программных ограничений.
Инструментарий для восстановления файлов после шифровальщика LockBit 3.0
Набор утилит для дешифровки файлов, пораженных вирусом LockBit 3.0 ("Black"), использующий уязвимость повторного использования ключевого потока.
Обсуждение «секретного ингредиента» GPT-5.5 и механизмов рассуждения
В сети обсуждают утечку логов, согласно которой продвинутые возможности модели могут основываться на упрощенном режиме рассуждений.
Влияет ли расстояние между GPU на охлаждение при андервольтинге
Пользователи обсуждают необходимость свободного пространства между видеокартами при работе с пониженным напряжением.
Неавторегрессионная ASR-модель Paraformer-large
Модель для распознавания речи, оптимизированная для инференса через ONNX без зависимости от PyTorch.
Модель распознавания китайской речи Paraformer-zh
Готовая к использованию end-to-end модель, работающая в 120 раз быстрее реального времени на GPU.
NVIDIA убирает категорию игровых доходов из финансовых отчетов
Компания перестанет выделять выручку от игрового сегмента в отдельную категорию в своей финансовой отчетности.
Tencent выпустила модель Z-Image 6B для генерации в пиксельном пространстве
Модель работает без VAE, поддерживает разрешение 1k и генерирует изображения напрямую в пространстве пикселей.
DeepSeek планирует раунд финансирования на 10,29 миллиарда долларов
Глава компании Лян Вэньфэн намерен сосредоточиться на разработке open source моделей вместо погони за краткосрочной коммерциализацией.
Инструмент для апскейлинга и генерации кадров Lossless-Scaling
Решение с технологией LSFG для повышения четкости изображения и увеличения FPS, устанавливаемое одной командой.
Генератор ИИ-изображений и видео без цензуры
Инструмент для создания взрослого контента (18+) без программных ограничений.
Инструментарий для восстановления файлов после шифровальщика LockBit 3.0
Набор утилит для дешифровки файлов, пораженных вирусом LockBit 3.0 ("Black"), использующий уязвимость повторного использования ключевого потока.
Обсуждение «секретного ингредиента» GPT-5.5 и механизмов рассуждения
В сети обсуждают утечку логов, согласно которой продвинутые возможности модели могут основываться на упрощенном режиме рассуждений.
Влияет ли расстояние между GPU на охлаждение при андервольтинге
Пользователи обсуждают необходимость свободного пространства между видеокартами при работе с пониженным напряжением.
Неавторегрессионная ASR-модель Paraformer-large
Модель для распознавания речи, оптимизированная для инференса через ONNX без зависимости от PyTorch.
Модель распознавания китайской речи Paraformer-zh
Готовая к использованию end-to-end модель, работающая в 120 раз быстрее реального времени на GPU.
Reddit
From the LocalLLaMA community on Reddit: NVIDIA Removes Gaming Revenue Category From Financial Reports
Posted by HumanDrone8721 - 702 votes and 209 comments
🔥1
Как я настроил пользовательских субагентов для Codex
Практическое руководство по организации параллельной работы с субагентами в Codex: шесть типовых агентов, паттерн «карточки задания» и конфигурация для мультиагентной разработки.
Читать статью
Практическое руководство по организации параллельной работы с субагентами в Codex: шесть типовых агентов, паттерн «карточки задания» и конфигурация для мультиагентной разработки.
Читать статью
WorkOS запускает auth.md — открытый протокол для регистрации агентов в веб-сервисах
WorkOS представляет auth.md — открытый протокол, позволяющий ИИ-агентам регистрироваться в веб-сервисах. Вместо имитации человеческих действий в браузере агенты получают собственный, полноценный путь регистрации.
Читать статью
WorkOS представляет auth.md — открытый протокол, позволяющий ИИ-агентам регистрироваться в веб-сервисах. Вместо имитации человеческих действий в браузере агенты получают собственный, полноценный путь регистрации.
Читать статью
Как Claude Code работает в больших кодовых базах: лучшие практики и с чего начать
Самые успешные внедрения Claude Code объединяет набор узнаваемых паттернов в конфигурации, инструментарии и организационной структуре. Эта статья — часть серии «Claude Code в масштабе», посвящённой лучшим практикам для инженерных организаций, внедряющих Claude Code на корпоративном уровне.
Читать статью
Самые успешные внедрения Claude Code объединяет набор узнаваемых паттернов в конфигурации, инструментарии и организационной структуре. Эта статья — часть серии «Claude Code в масштабе», посвящённой лучшим практикам для инженерных организаций, внедряющих Claude Code на корпоративном уровне.
Читать статью
🔥2
Создание безопасной и эффективной песочницы для работы Codex на Windows
Статья описывает, как команда Codex в OpenAI разработала собственную песочницу для Windows, чтобы обеспечить безопасное выполнение команд кодинг-агентом без постоянного подтверждения от пользователя.
Читать статью
Статья описывает, как команда Codex в OpenAI разработала собственную песочницу для Windows, чтобы обеспечить безопасное выполнение команд кодинг-агентом без постоянного подтверждения от пользователя.
Читать статью
❤2
Главные темы дня в AI-индустрии:
Financial Times опубликовала статью об инструменте Heretic
Heretic — это open source инструмент для снятия ограничений (guardrails) с Llama 3.3 от Meta, который использовался для создания тысяч нецензурированных моделей.
Торговый бот для платформы Hyperliquid
Проект представляет собой бота для торговли бессрочными контрактами и реализации прибыльных торговых стратегий на платформе Hyperliquid.
Релиз MiniCPM5-1B от OpenBMB
Представлена первая модель в серии MiniCPM5 — компактная языковая модель с 1 миллиардом параметров.
Zero-shot клонирование голоса и генерация речи Scenema
Инструмент для выразительного клонирования голоса и синтеза речи, работающий в режиме zero-shot без необходимости предварительной подготовки.
Останется ли NVIDIA стандартом для локальных LLM в 2026 году?
В сообществе обсуждают актуальность GPU от NVIDIA как основного выбора оборудования для запуска локальных моделей в ближайшем будущем.
Реализация архитектуры agent-runtime на Python
Порт архитектуры agent-runtime из Claude Code для Python на базе LangChain.
Выход нецензурированной версии Qwen3.5 35B A3B Heretic
Модель выпущена с полным сохранением 785 MTP и доступна в форматах Safetensors, GGUF, NVFP4 и GPTQ-Int4.
Библиотека uni-mm-trainer для обучения мультимодальных LLM
Легковесная библиотека для тренировки мультимодальных моделей, объединяющих работу с текстом, изображениями и аудио.
Бинарные и тернарные модели Bonsai Image 4B от PrismML
Выпущены 1-битные и тернарные диффузионные трансформеры для генерации изображений, способные работать локально в браузере через WebGPU.
Графический интерфейс для SNI-Spoofing на Windows
Проект AriMando предлагает современный GUI для обхода ограничений методом SNI-Spoofing без использования командной строки.
Financial Times опубликовала статью об инструменте Heretic
Heretic — это open source инструмент для снятия ограничений (guardrails) с Llama 3.3 от Meta, который использовался для создания тысяч нецензурированных моделей.
Торговый бот для платформы Hyperliquid
Проект представляет собой бота для торговли бессрочными контрактами и реализации прибыльных торговых стратегий на платформе Hyperliquid.
Релиз MiniCPM5-1B от OpenBMB
Представлена первая модель в серии MiniCPM5 — компактная языковая модель с 1 миллиардом параметров.
Zero-shot клонирование голоса и генерация речи Scenema
Инструмент для выразительного клонирования голоса и синтеза речи, работающий в режиме zero-shot без необходимости предварительной подготовки.
Останется ли NVIDIA стандартом для локальных LLM в 2026 году?
В сообществе обсуждают актуальность GPU от NVIDIA как основного выбора оборудования для запуска локальных моделей в ближайшем будущем.
Реализация архитектуры agent-runtime на Python
Порт архитектуры agent-runtime из Claude Code для Python на базе LangChain.
Выход нецензурированной версии Qwen3.5 35B A3B Heretic
Модель выпущена с полным сохранением 785 MTP и доступна в форматах Safetensors, GGUF, NVFP4 и GPTQ-Int4.
Библиотека uni-mm-trainer для обучения мультимодальных LLM
Легковесная библиотека для тренировки мультимодальных моделей, объединяющих работу с текстом, изображениями и аудио.
Бинарные и тернарные модели Bonsai Image 4B от PrismML
Выпущены 1-битные и тернарные диффузионные трансформеры для генерации изображений, способные работать локально в браузере через WebGPU.
Графический интерфейс для SNI-Spoofing на Windows
Проект AriMando предлагает современный GUI для обхода ограничений методом SNI-Spoofing без использования командной строки.
Reddit
From the LocalLLaMA community on Reddit: The Financial Times has published an article about Heretic
Explore this post and more from the LocalLLaMA community
🔥2
Project Glasswing: что нам показала модель Mythos
Cloudflare несколько месяцев тестировала специализированные LLM для поиска уязвимостей в собственной инфраструктуре. Модель Mythos Preview от Anthropic продемонстрировала качественный скачок: она умеет выстраивать цепочки эксплойтов и автоматически доказывать эксплуатируемость найденных багов.
Читать статью
Cloudflare несколько месяцев тестировала специализированные LLM для поиска уязвимостей в собственной инфраструктуре. Модель Mythos Preview от Anthropic продемонстрировала качественный скачок: она умеет выстраивать цепочки эксплойтов и автоматически доказывать эксплуатируемость найденных багов.
Читать статью
Project Glasswing: что нам показала модель Mythos
Cloudflare несколько месяцев тестировала специализированные LLM для поиска уязвимостей в собственной инфраструктуре. Модель Mythos Preview от Anthropic продемонстрировала качественный скачок: она умеет выстраивать цепочки эксплойтов и автоматически доказывать эксплуатируемость найденных багов.
Читать статью
Cloudflare несколько месяцев тестировала специализированные LLM для поиска уязвимостей в собственной инфраструктуре. Модель Mythos Preview от Anthropic продемонстрировала качественный скачок: она умеет выстраивать цепочки эксплойтов и автоматически доказывать эксплуатируемость найденных багов.
Читать статью
Лучшие практики использования компьютера и браузера с Claude (часть 1)
Практическое руководство для разработчиков, интегрирующих возможности управления компьютером и браузером с семейством моделей Claude.
Читать статью
Практическое руководство для разработчиков, интегрирующих возможности управления компьютером и браузером с семейством моделей Claude.
Читать статью
👍1
Лучшие практики использования компьютера и браузера с Claude (часть 2)
Управление контекстом, экспериментальные настройки и обучение Claude через демонстрации — продолжение руководства по computer use и browser use.
Читать статью
Управление контекстом, экспериментальные настройки и обучение Claude через демонстрации — продолжение руководства по computer use и browser use.
Читать статью
Codex-максинг
Как превратить Codex из инструмента для написания кода в полноценную рабочую среду: долгоживущие потоки, голосовой ввод, управляемая память, удалённый контроль и артефакты в боковой панели.
Читать статью
Как превратить Codex из инструмента для написания кода в полноценную рабочую среду: долгоживущие потоки, голосовой ввод, управляемая память, удалённый контроль и артефакты в боковой панели.
Читать статью
Дайджест AI-новостей: что в тренде сегодня:
FlashML-org/flashlib
Быстрые и эффективные по памяти операторы для классического машинного обучения.
Sophomoresty/gemini-web2api
Инструмент для конвертации веб-версии Google Gemini в OpenAI-совместимый API без необходимости авторизации.
Релиз 1-битных моделей генерации изображений от PrismML
Диффузионные трансформеры Bonsai на 4B параметров работают локально в браузере через WebGPU и занимают около 3 ГБ.
kepengxu/PRISM-VL
Исследование обучения мультимодальных моделей (VLM) на основе физических измерений с использованием RAW-данных и параметров камеры.
Самодельный локальный AI-сервер из подручных средств
В сообществе обсуждают пример крайне бюджетной и нестандартной аппаратной сборки для запуска нейросетей дома.
BennyDaBall/Qwen3-4b-Z-Image-Engineer-V4
Обновление специализированной модели на базе Qwen3 для работы с изображениями; в разработке уже находится шестая версия.
Влияние вежливого обращения на галлюцинации ИИ
Исследование того, как вежливый промптинг помогает моделям избегать зацикливания и честно признавать нехватку знаний.
Jackrong/Qwopus3.6-27B-v2-MTP-GGUF
Квантованная GGUF-версия модели Qwopus 3.6 на 27B параметров.
OpenMOSS-Team/moss-moon-003-base
Базовая версия открытой модели MOSS-moon-003, включающая наборы данных и инструменты для разработки.
OpenMOSS-Team/moss-moon-003-sft
Версия модели MOSS-moon-003, прошедшая стадию дообучения (SFT) для улучшения работы в режиме диалога.
FlashML-org/flashlib
Быстрые и эффективные по памяти операторы для классического машинного обучения.
Sophomoresty/gemini-web2api
Инструмент для конвертации веб-версии Google Gemini в OpenAI-совместимый API без необходимости авторизации.
Релиз 1-битных моделей генерации изображений от PrismML
Диффузионные трансформеры Bonsai на 4B параметров работают локально в браузере через WebGPU и занимают около 3 ГБ.
kepengxu/PRISM-VL
Исследование обучения мультимодальных моделей (VLM) на основе физических измерений с использованием RAW-данных и параметров камеры.
Самодельный локальный AI-сервер из подручных средств
В сообществе обсуждают пример крайне бюджетной и нестандартной аппаратной сборки для запуска нейросетей дома.
BennyDaBall/Qwen3-4b-Z-Image-Engineer-V4
Обновление специализированной модели на базе Qwen3 для работы с изображениями; в разработке уже находится шестая версия.
Влияние вежливого обращения на галлюцинации ИИ
Исследование того, как вежливый промптинг помогает моделям избегать зацикливания и честно признавать нехватку знаний.
Jackrong/Qwopus3.6-27B-v2-MTP-GGUF
Квантованная GGUF-версия модели Qwopus 3.6 на 27B параметров.
OpenMOSS-Team/moss-moon-003-base
Базовая версия открытой модели MOSS-moon-003, включающая наборы данных и инструменты для разработки.
OpenMOSS-Team/moss-moon-003-sft
Версия модели MOSS-moon-003, прошедшая стадию дообучения (SFT) для улучшения работы в режиме диалога.
GitHub
GitHub - FlashML-org/flashlib: Fast and memory-efficient classical machine learning operators
Fast and memory-efficient classical machine learning operators - FlashML-org/flashlib
👍1