Про AI: Лучшие cтатьи и исследования
1.27K subscribers
281 photos
1 video
367 links
Качественные AI переводы лучших англоязычных статей и исследований про AI.
Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
Download Telegram
Утренняя сводка из мира AI:

nanobot — ультралёгкий клон Claude
Репозиторий nanobot представляет минималистичную реализацию чат-бота в стиле Claude.

Насколько открытые модели близки к SOTA? Честный взгляд без оглядки на бенчмарки
Откровенная оценка open-weight моделей: они достигают топовых результатов в некоторых задачах, но в целом всё ещё отстают.

Уязвимость базы данных Moltbook позволяет захватить любого AI-агента на сайте
Обнаружена серьёзная брешь в безопасности, дающая полный контроль над AI-агентами платформы.

Почему GPT-OSS остаётся таким хорошим?
Обсуждение причин превосходства GPT-OSS 120B: нативный 4-bit training, скорость и качество датасета в сравнении с новыми моделями.

Новая модель Anima — 8 персонажей в промпте, отличные лица и руки, без upscale; превосходит Illustrious
Anima — новая базовая модель Stable Diffusion для генерации аниме-изображений высокого качества с поддержкой 8 персонажей без необходимости upscale или adetailer.

InstaTrace — инструмент для извлечения URL приватных постов Instagram
Исследовательский proof-of-concept для получения прямых ссылок на приватные посты Instagram.

Может ли 4chan-датасет улучшить модель? Оказывается, да!
Assistant_Pepe_8B — модель на базе LLaMA, дообученная на данных 4chan, неожиданно превосходит базовую версию и Nvidia Nemotron по правдивости ответов и alignment.

airctl — современный инструмент управления WiFi для Linux
Приложение на GTK4 и Python с чистым интерфейсом для сканирования, подключения и управления беспроводными сетями.

FER-IT — мониторинг эмоций сотрудников для повышения продуктивности
Система распознавания эмоций по лицу в реальном времени с использованием модели IEEE CLCM, Flask и TensorFlow с демо через веб-камеру.

Anima — нативная поддержка в ComfyUI
Модель Anima теперь официально поддерживается в ComfyUI для удобной работы с генерацией изображений.
1
Автоматическое программирование

Antirez объясняет, почему стоит разделять «вайб-кодинг» и «автоматическое программирование» — и почему код, созданный с помощью ИИ при осознанном управлении процессом, по праву принадлежит программисту.

Читать статью
Два типа пользователей ИИ: разрыв между ними поражает

Между «продвинутыми» и «обычными» пользователями ИИ формируется стремительно растущий разрыв — и крупные корпорации рискуют оказаться на неправильной стороне.

Читать статью
Файловая система или база данных для памяти агентов: обзор дебатов

Разбираем текущую дискуссию о выборе между файловыми интерфейсами и базами данных для организации памяти ИИ-агентов.

Читать статью
Агентный психоз: мы сходим с ума?

Зависимость от ИИ-агентов, токсичные слоп-лупы и бремя мейнтейнеров открытого кода — взгляд изнутри на то, как увлечение агентным программированием меняет нас и наши проекты.

Читать статью
Планирование — это новый код

Автор дважды создал одно и то же приложение. Первая попытка: день написания кода, несколько дней отладки. Вторая: несколько дней планирования, день написания кода — готовое приложение. Разница оказалась не в коде, а в плане.

Читать статью
Представляем Agent Readiness

Фреймворк для измерения и улучшения того, насколько хорошо ваша кодовая база поддерживает автономную разработку. Оцените репозитории по восьми техническим направлениям и пяти уровням зрелости.

Читать статью
Skills, правила, команды и субагенты: когда что использовать

Подробный разбор нового стандарта skills (*навыков*) для ИИ-агентов: как организовать контекст, чем skills отличаются от правил и команд, и как написать эффективную библиотеку навыков.

Читать статью
Приложение Codex: мой опыт после нескольких недель реального использования

Автор делится впечатлениями от нового приложения Codex после нескольких недель активной работы — и рассказывает, как оно изменило его рабочий процесс.

Читать статью
Утренний AI-обзор: GitHub, Reddit, Hugging Face:

GLM-OCR — быстрая и точная система распознавания текста
Комплексное решение для OCR с акцентом на скорость и точность.

Unreal — впечатляющая демонстрация возможностей
Пользователи LocalLLaMA делятся впечатлениями от новой разработки.

GLM-5 выйдет в феврале — официальное подтверждение
Релиз GLM-5 запланирован на февраль, информация подтверждена в сообществе LocalLLaMA.

ACE-Step 1.5 — open-source генератор музыки для GPU с 4GB VRAM
Альтернатива Suno с качественной генерацией музыки и кастомным UI, работает на видеокартах с минимальными требованиями.

Qwen3-Coder-Next — специализированная модель для code generation
Новая модель для генерации кода доступна на Hugging Face.

TeleStyle — перенос стиля с сохранением контента для изображений и видео
Open-source система для style transfer, работает как с изображениями, так и с видео.

Qwen3-Coder-Next — модель для coding agents и локальной разработки
Языковая модель с открытыми весами, специально разработанная для AI-агентов и разработки на локальных устройствах.

Qwen3-TTS Studio — профессиональный интерфейс для Qwen3-TTS
Инструмент с детальным контролем и интуитивным workflow для работы с моделью синтеза речи.

Цепочка удалённого выполнения кода в системе fnOS
Обнаружена уязвимость обхода аутентификации в системе fnOS с возможностью удалённого выполнения кода.

RAG-Skill — инструмент для работы с локальной базой знаний
Специализированный инструмент для retrieval из локальных knowledge base.
Bring Your Own Agent: будущее приложений на базе ИИ

Каждое приложение встраивает собственный ИИ — ассистент тут, копайлот там. Но настоящий контекст хранится у вашего персонального агента. Концепция BYOA предлагает перевернуть архитектуру: пусть интеллект следует за пользователем, а не живёт внутри приложения.

Читать статью
10 советов по работе с приложением Codex от его разработчика

Доминик Кундель, один из создателей десктопного приложения Codex от OpenAI, полностью перешёл с IDE на Codex и делится практическими советами, которые помогут получить максимум от этого инструмента.

Читать статью
2
Вторая парадигма предобучения

Джим Фэн размышляет о фундаментальном сдвиге в ИИ — от предсказания следующего слова к моделированию мира и его значении для робототехники и мультимодального ИИ.

Читать статью
Приложение Codex перевернуло мой рабочий процесс

Чарли Гуо из OpenAI описывает, как новое десктопное приложение Codex сместило его работу от написания кода к управлению агентами-программистами.

Читать статью
Позвоните своему OpenClaw по телефону через ElevenLabs Agents

Техническое руководство по подключению голосовых агентов ElevenLabs к OpenClaw — чтобы можно было просто позвонить своему боту и поговорить голосом.

Читать статью
😁1
Apple Xcode теперь поддерживает Claude Agent SDK

Xcode 26.3 получил нативную интеграцию с Claude Agent SDK — тем же фреймворком, который лежит в основе Claude Code. Разработчики получают полную мощь автономного агентного кодинга прямо в IDE.

Читать статью
Раскрываем Codex harness: как мы создали App Server

В этой статье команда OpenAI рассказывает об архитектуре Codex App Server — протоколе для интеграции Codex в различные продукты, от IDE до веб-приложений.

Читать статью
Имена от ИИ

Исследование показывает, что Claude катастрофически однообразен при генерации имён персонажей: 100% программистов получают имя «Marcus Chen», а космические пилоты — «Kira Voss».

Читать статью
Пришло время агентного видеомонтажа

2025 год стал годом видео. 2026-й станет годом, когда мы позволим агентам его монтировать.

Читать статью
Топ обсуждений в AI-сообществе сегодня:

MiniCPM-o 4.5 теперь доступна локально на Mac
Полнодуплексная коммуникация с низкой задержкой теперь работает прямо на вашем Mac через официальный Docker-образ.

Критика Ollama: почему это не просто развлечение, а необходимость
Дискуссия о проблемах платформы Ollama и почему важно открыто говорить о её недостатках.

Voxtral Mini 4B Realtime 2602 от Mistral AI
Мультиязычная модель для транскрипции речи в реальном времени — один из первых open-source решений с точностью офлайн-систем при минимальной задержке.

EpsteIn: проверьте свои LinkedIn-связи на упоминания в документах Эпштейна
Инструмент для поиска совпадений между вашими контактами в LinkedIn и лицами из материалов дела Эпштейна.

Google Research представила Sequential Attention
Новый метод делает AI-модели быстрее и экономичнее без потери точности.

LaTo: новая техника для точного редактирования лиц от Alibaba
Официальный репозиторий статьи о Landmark-tokenized Diffusion Transformer для детального редактирования человеческих лиц.

Qwen3-Coder-Next: языковая модель для coding-агентов
Открытая модель, специально разработанная для coding-агентов и локальной разработки, доступна в формате GGUF.

Неофициальный Python-клиент для распознавания речи входной системы Doubao
Клиент для работы с API распознавания речи китайской входной системы Doubao (豆包输入法).

Tencent Youtu-VL-4B-Instruct: новая vision-language модель
Компактная мультимодальная модель от Tencent с открытыми весами и технической документацией.

Опыт создания частного кластера H100: почему PCIe-серверы не подошли для обучения
Практические выводы о строительстве GPU-кластера на H100 и ограничениях PCIe-архитектуры при тренировке моделей.
Как извлечь максимум из Opus 4.6

Claude Opus 4.6 добавляет новый адаптивный режим мышления и ряд улучшений API для управления контекстом в долгих задачах. Обзор возможностей с ссылками на документацию.

Читать статью