Утренняя сводка из мира AI:
nanobot — ультралёгкий клон Claude
Репозиторий nanobot представляет минималистичную реализацию чат-бота в стиле Claude.
Насколько открытые модели близки к SOTA? Честный взгляд без оглядки на бенчмарки
Откровенная оценка open-weight моделей: они достигают топовых результатов в некоторых задачах, но в целом всё ещё отстают.
Уязвимость базы данных Moltbook позволяет захватить любого AI-агента на сайте
Обнаружена серьёзная брешь в безопасности, дающая полный контроль над AI-агентами платформы.
Почему GPT-OSS остаётся таким хорошим?
Обсуждение причин превосходства GPT-OSS 120B: нативный 4-bit training, скорость и качество датасета в сравнении с новыми моделями.
Новая модель Anima — 8 персонажей в промпте, отличные лица и руки, без upscale; превосходит Illustrious
Anima — новая базовая модель Stable Diffusion для генерации аниме-изображений высокого качества с поддержкой 8 персонажей без необходимости upscale или adetailer.
InstaTrace — инструмент для извлечения URL приватных постов Instagram
Исследовательский proof-of-concept для получения прямых ссылок на приватные посты Instagram.
Может ли 4chan-датасет улучшить модель? Оказывается, да!
Assistant_Pepe_8B — модель на базе LLaMA, дообученная на данных 4chan, неожиданно превосходит базовую версию и Nvidia Nemotron по правдивости ответов и alignment.
airctl — современный инструмент управления WiFi для Linux
Приложение на GTK4 и Python с чистым интерфейсом для сканирования, подключения и управления беспроводными сетями.
FER-IT — мониторинг эмоций сотрудников для повышения продуктивности
Система распознавания эмоций по лицу в реальном времени с использованием модели IEEE CLCM, Flask и TensorFlow с демо через веб-камеру.
Anima — нативная поддержка в ComfyUI
Модель Anima теперь официально поддерживается в ComfyUI для удобной работы с генерацией изображений.
nanobot — ультралёгкий клон Claude
Репозиторий nanobot представляет минималистичную реализацию чат-бота в стиле Claude.
Насколько открытые модели близки к SOTA? Честный взгляд без оглядки на бенчмарки
Откровенная оценка open-weight моделей: они достигают топовых результатов в некоторых задачах, но в целом всё ещё отстают.
Уязвимость базы данных Moltbook позволяет захватить любого AI-агента на сайте
Обнаружена серьёзная брешь в безопасности, дающая полный контроль над AI-агентами платформы.
Почему GPT-OSS остаётся таким хорошим?
Обсуждение причин превосходства GPT-OSS 120B: нативный 4-bit training, скорость и качество датасета в сравнении с новыми моделями.
Новая модель Anima — 8 персонажей в промпте, отличные лица и руки, без upscale; превосходит Illustrious
Anima — новая базовая модель Stable Diffusion для генерации аниме-изображений высокого качества с поддержкой 8 персонажей без необходимости upscale или adetailer.
InstaTrace — инструмент для извлечения URL приватных постов Instagram
Исследовательский proof-of-concept для получения прямых ссылок на приватные посты Instagram.
Может ли 4chan-датасет улучшить модель? Оказывается, да!
Assistant_Pepe_8B — модель на базе LLaMA, дообученная на данных 4chan, неожиданно превосходит базовую версию и Nvidia Nemotron по правдивости ответов и alignment.
airctl — современный инструмент управления WiFi для Linux
Приложение на GTK4 и Python с чистым интерфейсом для сканирования, подключения и управления беспроводными сетями.
FER-IT — мониторинг эмоций сотрудников для повышения продуктивности
Система распознавания эмоций по лицу в реальном времени с использованием модели IEEE CLCM, Flask и TensorFlow с демо через веб-камеру.
Anima — нативная поддержка в ComfyUI
Модель Anima теперь официально поддерживается в ComfyUI для удобной работы с генерацией изображений.
GitHub
GitHub - HKUDS/nanobot: "🐈 nanobot: The Ultra-Lightweight OpenClaw"
"🐈 nanobot: The Ultra-Lightweight OpenClaw". Contribute to HKUDS/nanobot development by creating an account on GitHub.
❤1
Автоматическое программирование
Antirez объясняет, почему стоит разделять «вайб-кодинг» и «автоматическое программирование» — и почему код, созданный с помощью ИИ при осознанном управлении процессом, по праву принадлежит программисту.
Читать статью
Antirez объясняет, почему стоит разделять «вайб-кодинг» и «автоматическое программирование» — и почему код, созданный с помощью ИИ при осознанном управлении процессом, по праву принадлежит программисту.
Читать статью
Два типа пользователей ИИ: разрыв между ними поражает
Между «продвинутыми» и «обычными» пользователями ИИ формируется стремительно растущий разрыв — и крупные корпорации рискуют оказаться на неправильной стороне.
Читать статью
Между «продвинутыми» и «обычными» пользователями ИИ формируется стремительно растущий разрыв — и крупные корпорации рискуют оказаться на неправильной стороне.
Читать статью
Файловая система или база данных для памяти агентов: обзор дебатов
Разбираем текущую дискуссию о выборе между файловыми интерфейсами и базами данных для организации памяти ИИ-агентов.
Читать статью
Разбираем текущую дискуссию о выборе между файловыми интерфейсами и базами данных для организации памяти ИИ-агентов.
Читать статью
Агентный психоз: мы сходим с ума?
Зависимость от ИИ-агентов, токсичные слоп-лупы и бремя мейнтейнеров открытого кода — взгляд изнутри на то, как увлечение агентным программированием меняет нас и наши проекты.
Читать статью
Зависимость от ИИ-агентов, токсичные слоп-лупы и бремя мейнтейнеров открытого кода — взгляд изнутри на то, как увлечение агентным программированием меняет нас и наши проекты.
Читать статью
Планирование — это новый код
Автор дважды создал одно и то же приложение. Первая попытка: день написания кода, несколько дней отладки. Вторая: несколько дней планирования, день написания кода — готовое приложение. Разница оказалась не в коде, а в плане.
Читать статью
Автор дважды создал одно и то же приложение. Первая попытка: день написания кода, несколько дней отладки. Вторая: несколько дней планирования, день написания кода — готовое приложение. Разница оказалась не в коде, а в плане.
Читать статью
Представляем Agent Readiness
Фреймворк для измерения и улучшения того, насколько хорошо ваша кодовая база поддерживает автономную разработку. Оцените репозитории по восьми техническим направлениям и пяти уровням зрелости.
Читать статью
Фреймворк для измерения и улучшения того, насколько хорошо ваша кодовая база поддерживает автономную разработку. Оцените репозитории по восьми техническим направлениям и пяти уровням зрелости.
Читать статью
Skills, правила, команды и субагенты: когда что использовать
Подробный разбор нового стандарта skills (*навыков*) для ИИ-агентов: как организовать контекст, чем skills отличаются от правил и команд, и как написать эффективную библиотеку навыков.
Читать статью
Подробный разбор нового стандарта skills (*навыков*) для ИИ-агентов: как организовать контекст, чем skills отличаются от правил и команд, и как написать эффективную библиотеку навыков.
Читать статью
Приложение Codex: мой опыт после нескольких недель реального использования
Автор делится впечатлениями от нового приложения Codex после нескольких недель активной работы — и рассказывает, как оно изменило его рабочий процесс.
Читать статью
Автор делится впечатлениями от нового приложения Codex после нескольких недель активной работы — и рассказывает, как оно изменило его рабочий процесс.
Читать статью
Утренний AI-обзор: GitHub, Reddit, Hugging Face:
GLM-OCR — быстрая и точная система распознавания текста
Комплексное решение для OCR с акцентом на скорость и точность.
Unreal — впечатляющая демонстрация возможностей
Пользователи LocalLLaMA делятся впечатлениями от новой разработки.
GLM-5 выйдет в феврале — официальное подтверждение
Релиз GLM-5 запланирован на февраль, информация подтверждена в сообществе LocalLLaMA.
ACE-Step 1.5 — open-source генератор музыки для GPU с 4GB VRAM
Альтернатива Suno с качественной генерацией музыки и кастомным UI, работает на видеокартах с минимальными требованиями.
Qwen3-Coder-Next — специализированная модель для code generation
Новая модель для генерации кода доступна на Hugging Face.
TeleStyle — перенос стиля с сохранением контента для изображений и видео
Open-source система для style transfer, работает как с изображениями, так и с видео.
Qwen3-Coder-Next — модель для coding agents и локальной разработки
Языковая модель с открытыми весами, специально разработанная для AI-агентов и разработки на локальных устройствах.
Qwen3-TTS Studio — профессиональный интерфейс для Qwen3-TTS
Инструмент с детальным контролем и интуитивным workflow для работы с моделью синтеза речи.
Цепочка удалённого выполнения кода в системе fnOS
Обнаружена уязвимость обхода аутентификации в системе fnOS с возможностью удалённого выполнения кода.
RAG-Skill — инструмент для работы с локальной базой знаний
Специализированный инструмент для retrieval из локальных knowledge base.
GLM-OCR — быстрая и точная система распознавания текста
Комплексное решение для OCR с акцентом на скорость и точность.
Unreal — впечатляющая демонстрация возможностей
Пользователи LocalLLaMA делятся впечатлениями от новой разработки.
GLM-5 выйдет в феврале — официальное подтверждение
Релиз GLM-5 запланирован на февраль, информация подтверждена в сообществе LocalLLaMA.
ACE-Step 1.5 — open-source генератор музыки для GPU с 4GB VRAM
Альтернатива Suno с качественной генерацией музыки и кастомным UI, работает на видеокартах с минимальными требованиями.
Qwen3-Coder-Next — специализированная модель для code generation
Новая модель для генерации кода доступна на Hugging Face.
TeleStyle — перенос стиля с сохранением контента для изображений и видео
Open-source система для style transfer, работает как с изображениями, так и с видео.
Qwen3-Coder-Next — модель для coding agents и локальной разработки
Языковая модель с открытыми весами, специально разработанная для AI-агентов и разработки на локальных устройствах.
Qwen3-TTS Studio — профессиональный интерфейс для Qwen3-TTS
Инструмент с детальным контролем и интуитивным workflow для работы с моделью синтеза речи.
Цепочка удалённого выполнения кода в системе fnOS
Обнаружена уязвимость обхода аутентификации в системе fnOS с возможностью удалённого выполнения кода.
RAG-Skill — инструмент для работы с локальной базой знаний
Специализированный инструмент для retrieval из локальных knowledge base.
GitHub
GitHub - zai-org/GLM-OCR: GLM-OCR: Accurate × Fast × Comprehensive
GLM-OCR: Accurate × Fast × Comprehensive. Contribute to zai-org/GLM-OCR development by creating an account on GitHub.
Bring Your Own Agent: будущее приложений на базе ИИ
Каждое приложение встраивает собственный ИИ — ассистент тут, копайлот там. Но настоящий контекст хранится у вашего персонального агента. Концепция BYOA предлагает перевернуть архитектуру: пусть интеллект следует за пользователем, а не живёт внутри приложения.
Читать статью
Каждое приложение встраивает собственный ИИ — ассистент тут, копайлот там. Но настоящий контекст хранится у вашего персонального агента. Концепция BYOA предлагает перевернуть архитектуру: пусть интеллект следует за пользователем, а не живёт внутри приложения.
Читать статью
10 советов по работе с приложением Codex от его разработчика
Доминик Кундель, один из создателей десктопного приложения Codex от OpenAI, полностью перешёл с IDE на Codex и делится практическими советами, которые помогут получить максимум от этого инструмента.
Читать статью
Доминик Кундель, один из создателей десктопного приложения Codex от OpenAI, полностью перешёл с IDE на Codex и делится практическими советами, которые помогут получить максимум от этого инструмента.
Читать статью
❤2
Вторая парадигма предобучения
Джим Фэн размышляет о фундаментальном сдвиге в ИИ — от предсказания следующего слова к моделированию мира и его значении для робототехники и мультимодального ИИ.
Читать статью
Джим Фэн размышляет о фундаментальном сдвиге в ИИ — от предсказания следующего слова к моделированию мира и его значении для робототехники и мультимодального ИИ.
Читать статью
Приложение Codex перевернуло мой рабочий процесс
Чарли Гуо из OpenAI описывает, как новое десктопное приложение Codex сместило его работу от написания кода к управлению агентами-программистами.
Читать статью
Чарли Гуо из OpenAI описывает, как новое десктопное приложение Codex сместило его работу от написания кода к управлению агентами-программистами.
Читать статью
Позвоните своему OpenClaw по телефону через ElevenLabs Agents
Техническое руководство по подключению голосовых агентов ElevenLabs к OpenClaw — чтобы можно было просто позвонить своему боту и поговорить голосом.
Читать статью
Техническое руководство по подключению голосовых агентов ElevenLabs к OpenClaw — чтобы можно было просто позвонить своему боту и поговорить голосом.
Читать статью
😁1
Apple Xcode теперь поддерживает Claude Agent SDK
Xcode 26.3 получил нативную интеграцию с Claude Agent SDK — тем же фреймворком, который лежит в основе Claude Code. Разработчики получают полную мощь автономного агентного кодинга прямо в IDE.
Читать статью
Xcode 26.3 получил нативную интеграцию с Claude Agent SDK — тем же фреймворком, который лежит в основе Claude Code. Разработчики получают полную мощь автономного агентного кодинга прямо в IDE.
Читать статью
Раскрываем Codex harness: как мы создали App Server
В этой статье команда OpenAI рассказывает об архитектуре Codex App Server — протоколе для интеграции Codex в различные продукты, от IDE до веб-приложений.
Читать статью
В этой статье команда OpenAI рассказывает об архитектуре Codex App Server — протоколе для интеграции Codex в различные продукты, от IDE до веб-приложений.
Читать статью
Имена от ИИ
Исследование показывает, что Claude катастрофически однообразен при генерации имён персонажей: 100% программистов получают имя «Marcus Chen», а космические пилоты — «Kira Voss».
Читать статью
Исследование показывает, что Claude катастрофически однообразен при генерации имён персонажей: 100% программистов получают имя «Marcus Chen», а космические пилоты — «Kira Voss».
Читать статью
Пришло время агентного видеомонтажа
2025 год стал годом видео. 2026-й станет годом, когда мы позволим агентам его монтировать.
Читать статью
2025 год стал годом видео. 2026-й станет годом, когда мы позволим агентам его монтировать.
Читать статью
Топ обсуждений в AI-сообществе сегодня:
MiniCPM-o 4.5 теперь доступна локально на Mac
Полнодуплексная коммуникация с низкой задержкой теперь работает прямо на вашем Mac через официальный Docker-образ.
Критика Ollama: почему это не просто развлечение, а необходимость
Дискуссия о проблемах платформы Ollama и почему важно открыто говорить о её недостатках.
Voxtral Mini 4B Realtime 2602 от Mistral AI
Мультиязычная модель для транскрипции речи в реальном времени — один из первых open-source решений с точностью офлайн-систем при минимальной задержке.
EpsteIn: проверьте свои LinkedIn-связи на упоминания в документах Эпштейна
Инструмент для поиска совпадений между вашими контактами в LinkedIn и лицами из материалов дела Эпштейна.
Google Research представила Sequential Attention
Новый метод делает AI-модели быстрее и экономичнее без потери точности.
LaTo: новая техника для точного редактирования лиц от Alibaba
Официальный репозиторий статьи о Landmark-tokenized Diffusion Transformer для детального редактирования человеческих лиц.
Qwen3-Coder-Next: языковая модель для coding-агентов
Открытая модель, специально разработанная для coding-агентов и локальной разработки, доступна в формате GGUF.
Неофициальный Python-клиент для распознавания речи входной системы Doubao
Клиент для работы с API распознавания речи китайской входной системы Doubao (豆包输入法).
Tencent Youtu-VL-4B-Instruct: новая vision-language модель
Компактная мультимодальная модель от Tencent с открытыми весами и технической документацией.
Опыт создания частного кластера H100: почему PCIe-серверы не подошли для обучения
Практические выводы о строительстве GPU-кластера на H100 и ограничениях PCIe-архитектуры при тренировке моделей.
MiniCPM-o 4.5 теперь доступна локально на Mac
Полнодуплексная коммуникация с низкой задержкой теперь работает прямо на вашем Mac через официальный Docker-образ.
Критика Ollama: почему это не просто развлечение, а необходимость
Дискуссия о проблемах платформы Ollama и почему важно открыто говорить о её недостатках.
Voxtral Mini 4B Realtime 2602 от Mistral AI
Мультиязычная модель для транскрипции речи в реальном времени — один из первых open-source решений с точностью офлайн-систем при минимальной задержке.
EpsteIn: проверьте свои LinkedIn-связи на упоминания в документах Эпштейна
Инструмент для поиска совпадений между вашими контактами в LinkedIn и лицами из материалов дела Эпштейна.
Google Research представила Sequential Attention
Новый метод делает AI-модели быстрее и экономичнее без потери точности.
LaTo: новая техника для точного редактирования лиц от Alibaba
Официальный репозиторий статьи о Landmark-tokenized Diffusion Transformer для детального редактирования человеческих лиц.
Qwen3-Coder-Next: языковая модель для coding-агентов
Открытая модель, специально разработанная для coding-агентов и локальной разработки, доступна в формате GGUF.
Неофициальный Python-клиент для распознавания речи входной системы Doubao
Клиент для работы с API распознавания речи китайской входной системы Doubao (豆包输入法).
Tencent Youtu-VL-4B-Instruct: новая vision-language модель
Компактная мультимодальная модель от Tencent с открытыми весами и технической документацией.
Опыт создания частного кластера H100: почему PCIe-серверы не подошли для обучения
Практические выводы о строительстве GPU-кластера на H100 и ограничениях PCIe-архитектуры при тренировке моделей.
huggingface.co
openbmb/MiniCPM-o-4_5 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
Как извлечь максимум из Opus 4.6
Claude Opus 4.6 добавляет новый адаптивный режим мышления и ряд улучшений API для управления контекстом в долгих задачах. Обзор возможностей с ссылками на документацию.
Читать статью
Claude Opus 4.6 добавляет новый адаптивный режим мышления и ряд улучшений API для управления контекстом в долгих задачах. Обзор возможностей с ссылками на документацию.
Читать статью