Про AI: Лучшие cтатьи и исследования
1.27K subscribers
281 photos
1 video
367 links
Качественные AI переводы лучших англоязычных статей и исследований про AI.
Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
Download Telegram
Bring Your Own Agent: будущее приложений на базе ИИ

Каждое приложение встраивает собственный ИИ — ассистент тут, копайлот там. Но настоящий контекст хранится у вашего персонального агента. Концепция BYOA предлагает перевернуть архитектуру: пусть интеллект следует за пользователем, а не живёт внутри приложения.

Читать статью
10 советов по работе с приложением Codex от его разработчика

Доминик Кундель, один из создателей десктопного приложения Codex от OpenAI, полностью перешёл с IDE на Codex и делится практическими советами, которые помогут получить максимум от этого инструмента.

Читать статью
2
Вторая парадигма предобучения

Джим Фэн размышляет о фундаментальном сдвиге в ИИ — от предсказания следующего слова к моделированию мира и его значении для робототехники и мультимодального ИИ.

Читать статью
Приложение Codex перевернуло мой рабочий процесс

Чарли Гуо из OpenAI описывает, как новое десктопное приложение Codex сместило его работу от написания кода к управлению агентами-программистами.

Читать статью
Позвоните своему OpenClaw по телефону через ElevenLabs Agents

Техническое руководство по подключению голосовых агентов ElevenLabs к OpenClaw — чтобы можно было просто позвонить своему боту и поговорить голосом.

Читать статью
😁1
Apple Xcode теперь поддерживает Claude Agent SDK

Xcode 26.3 получил нативную интеграцию с Claude Agent SDK — тем же фреймворком, который лежит в основе Claude Code. Разработчики получают полную мощь автономного агентного кодинга прямо в IDE.

Читать статью
Раскрываем Codex harness: как мы создали App Server

В этой статье команда OpenAI рассказывает об архитектуре Codex App Server — протоколе для интеграции Codex в различные продукты, от IDE до веб-приложений.

Читать статью
Имена от ИИ

Исследование показывает, что Claude катастрофически однообразен при генерации имён персонажей: 100% программистов получают имя «Marcus Chen», а космические пилоты — «Kira Voss».

Читать статью
Пришло время агентного видеомонтажа

2025 год стал годом видео. 2026-й станет годом, когда мы позволим агентам его монтировать.

Читать статью
Топ обсуждений в AI-сообществе сегодня:

MiniCPM-o 4.5 теперь доступна локально на Mac
Полнодуплексная коммуникация с низкой задержкой теперь работает прямо на вашем Mac через официальный Docker-образ.

Критика Ollama: почему это не просто развлечение, а необходимость
Дискуссия о проблемах платформы Ollama и почему важно открыто говорить о её недостатках.

Voxtral Mini 4B Realtime 2602 от Mistral AI
Мультиязычная модель для транскрипции речи в реальном времени — один из первых open-source решений с точностью офлайн-систем при минимальной задержке.

EpsteIn: проверьте свои LinkedIn-связи на упоминания в документах Эпштейна
Инструмент для поиска совпадений между вашими контактами в LinkedIn и лицами из материалов дела Эпштейна.

Google Research представила Sequential Attention
Новый метод делает AI-модели быстрее и экономичнее без потери точности.

LaTo: новая техника для точного редактирования лиц от Alibaba
Официальный репозиторий статьи о Landmark-tokenized Diffusion Transformer для детального редактирования человеческих лиц.

Qwen3-Coder-Next: языковая модель для coding-агентов
Открытая модель, специально разработанная для coding-агентов и локальной разработки, доступна в формате GGUF.

Неофициальный Python-клиент для распознавания речи входной системы Doubao
Клиент для работы с API распознавания речи китайской входной системы Doubao (豆包输入法).

Tencent Youtu-VL-4B-Instruct: новая vision-language модель
Компактная мультимодальная модель от Tencent с открытыми весами и технической документацией.

Опыт создания частного кластера H100: почему PCIe-серверы не подошли для обучения
Практические выводы о строительстве GPU-кластера на H100 и ограничениях PCIe-архитектуры при тренировке моделей.
Как извлечь максимум из Opus 4.6

Claude Opus 4.6 добавляет новый адаптивный режим мышления и ряд улучшений API для управления контекстом в долгих задачах. Обзор возможностей с ссылками на документацию.

Читать статью
Предпросмотр веб-проектов Claude Code с помощью GitHub Pages

Простой способ тестировать HTML-приложения, создаваемые Claude Code на мобильных устройствах, используя GitHub Pages для развёртывания веток прямо из облачной среды.

Читать статью
1
Claude изменил программирование в 2025 году. В 2026 году он изменит работу с информацией

Anthropic запустила Claude Opus 4.6 — поворотный момент, когда ИИ становится настоящим рабочим партнёром для тех, кто проводит дни в таблицах, презентациях и длинных документах.

Читать статью
👍2
Мой обзор GPT-5.3-Codex

Первая модель программирования, которую можно оставить работать на несколько часов и вернуться к готовому, полностью работающему софту. Автор тестировал сессии длительностью 8+ часов — и модель не теряла нить рассуждений.

Читать статью
2
Antigravity в стиле Ральфа Виггама

Как настроить агентную разработку с автономным циклом самоисправления в Google Antigravity — без постоянного одобрения каждого шага

Читать статью
Железяки с когтями

OpenClaw превращает ИИ из инструмента, ограниченного циклом «промпт-ответ», в полноценного агента с собственным компьютером, долговременной памятью и автономным исполнением задач — и это меняет всё.

Читать статью
MCP, скиллы и агенты

Бездумный хайп вокруг MCP и скиллов раздражает. Давайте разберёмся, чем отличаются MCP, скиллы, команды и субагенты, и когда использовать каждый из них.

Читать статью
Почему Ralph-плагин от Anthropic — плохое решение (используйте bash-цикл вместо него)

Официальный Ralph-плагин от Anthropic для Claude Code нарушает ключевой принцип методологии Ralph — агрессивную очистку контекстного окна между итерациями, что приводит к деградации производительности LLM.

Читать статью
Создание агентов со скиллами: оснащение агентов для специализированной работы

Скиллы упаковывают экспертные знания в файлы, к которым агенты могут обращаться и применять — превращая универсальных агентов в знающих специалистов для реальной работы.

Читать статью
👍1
Топ AI-тем дня:

GLM-OCR — точное, быстрое и комплексное решение для распознавания текста
Новый инструмент для OCR, сочетающий высокую точность, скорость работы и широкие возможности распознавания.

MiniCPM-o 4.5 — полнодуплексная AI-модель для локального запуска на Mac
Доступен официальный Docker-образ для запуска модели с малой задержкой и двусторонней коммуникацией прямо на вашем Mac.

EpsteIn — проверьте, кто из ваших контактов LinkedIn упоминается в файлах Эпштейна
Инструмент для поиска совпадений между вашими контактами в LinkedIn и документами, связанными с делом Эпштейна.

Unreal — обсуждение в сообществе LocalLLaMA
Пост вызвал активное обсуждение, детали в комментариях.

Критика Ollama стала обязанностью сообщества
Юмористический пост на r/LocalLLaMA объявляет критику Ollama не просто удовольствием, а долгом сообщества.

16-миллиардная MoE-модель работает на 10 TPS на старом ноутбуке без NVIDIA
Пользователь показал, как запустить 16B MoE LLM со скоростью ~10 токенов в секунду на ноутбуке 2018 года с процессором i3, используя ускорение интегрированной графики через OpenVINO.

GLM-5 выйдет в феврале — релиз подтверждён
Сообщество LocalLLaMA подтверждает февральский релиз GLM-5 со ссылкой на анонс в Twitter.

ACE-Step 1.5 — открытая альтернатива Suno для генерации музыки на менее 4 ГБ VRAM
Open-source модель для генерации музыки, работающая на видеокартах с минимальными требованиями к памяти, с пользовательским интерфейсом и без подписок.

Voxtral-Mini-4B-Realtime-2602 — мультиязычная модель для транскрибации речи в реальном времени
Одно из первых open-source решений, достигающее точности офлайн-систем с минимальной задержкой.

Qwen3-TTS-Studio — профессиональный интерфейс для Qwen3-TTS
Инструмент с детальным контролем и интуитивными рабочими процессами, раскрывающий полный потенциал модели Qwen3-TTS.
Разбираем агентный цикл Codex

OpenAI рассказывает о внутреннем устройстве Codex CLI: как работает агентный цикл, как происходит взаимодействие между пользователем, моделью и инструментами, и какие оптимизации позволяют эффективно управлять контекстом.

Читать статью