Про AI: Лучшие cтатьи и исследования
1.24K subscribers
269 photos
1 video
353 links
Качественные AI переводы лучших англоязычных статей и исследований про AI.
Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
Download Telegram
Агентная электронная почта

Настройка LLM-агентов для управления электронной почтой — заманчивая идея, но она создаёт идеальные условия для серьёзных утечек безопасности. Мартин Фаулер объясняет, почему «Летальная триада» делает агентную почту опасной и как можно снизить риски.

Читать статью
1👍1
Экспериментальная система памяти в Claude Code

Claude Code уже строит собственную систему памяти — файл MEMORY.md, который загружается в системный промпт в начале каждой сессии. Пока она работает только локально, но скоро может стать общей для всей команды.

Читать статью
👍2
Навигация по коду по смыслу

Автор представляет инструмент «семантический навигатор по проекту», который позволяет просматривать репозитории не по директориям, а по смысловым кластерам — с помощью спектральной кластеризации и языковых моделей для создания осмысленных иерархий файлов.

Читать статью
👍2
Первая многоповеденческая загрузка мозга

Впервые в истории эмуляция целого мозга, построенная на основе биологического коннектома, управляет физически симулированным телом, демонстрируя множество натуралистичных форм поведения.

Читать статью
😱2👀2
AI-дайджест: что обсуждают на GitHub, Reddit и Hugging Face:

Сравнение моделей семейства Qwen3.5 на общих бенчмарках
Сравнение бенчмарков показывает, что модели 122B, 35B и особенно 27B сохраняют флагманскую производительность, тогда как варианты 2B и 0.8B значительно уступают в задачах с длинным контекстом и агентных сценариях.

OpenClaw-Medical-Skills: библиотека медицинских навыков для ИИ
Крупнейшая open source библиотека медицинских навыков для обучения и улучшения моделей в сфере здравоохранения.

Автоматическая генерация профессиональных постеров и обложек
Инструмент для создания книжных обложек и афиш в стиле Mondo без знаний Photoshop и истории искусств. ИИ автоматически подбирает стилистику на основе работ 20 легендарных дизайнеров.

CLI-Anything: превращение любого ПО в агентную систему
Проект CLI-Anything позволяет сделать любое программное обеспечение совместимым с ИИ-агентами через командную строку.

Модель Heretic обходит ограничения GPT-OSS с помощью метода ARA
В модель добавлена экспериментальная техника децензурирования Arbitrary-Rank Ablation (ARA), которая позволяет обходить установленные фильтры и ограничения.

Обсуждение роли RL в обучении моделей Llama
В сообществе обсуждают эффективность обучения с подкреплением и ставят под сомнение, является ли RL решающим преимуществом при работе с моделями семейства Llama.

Порт Karpathy autoresearch для Apple Silicon на базе MLX
Инструмент для автономных циклов ИИ-исследований на Mac, оптимизированный под фреймворк MLX и не требующий использования PyTorch.

OpusDelta: симуляция машинных эмоций
Экспериментальный проект, исследующий способы выражения машинных эмоций и концепцию непрерывной эволюции модели.

VeridisQuo: open source детектор дипфейков
Детектор анализирует пространственные признаки и частотные характеристики изображения, используя GradCAM для визуализации измененных областей лица.

Qwen 3.5 27B опережает топовые модели в тестах на разработку приложений
В пользовательских тестах Qwen 3.5 27B продемонстрировала высокую скорость и точность при создании полноценного GUI-приложения, превзойдя по качеству кода GPT-5.
👍2🔥1
Карпатый превратил один GPU в исследовательскую лабораторию

Человек пишет Markdown-файл. ИИ проводит 100 экспериментов за ночь. Узкое место — не вычислительные мощности, а ваш program.md.

Читать статью
🔥1
Измерение автономии ИИ-агентов на практике

Anthropic проанализировала миллионы взаимодействий с ИИ-агентами в Claude Code и через публичный API, чтобы выяснить, сколько автономии люди предоставляют агентам, как это меняется с опытом и в каких сферах агенты уже задействованы.

Читать статью
Как создать собственный агентный фреймворк с помощью PI: стек, на котором работает OpenClaw

PI — это набор TypeScript-пакетов для создания ИИ-агентов. Статья пошагово разбирает четыре уровня фреймворка: от простых вызовов больших языковых моделей до полноценного агента с терминальным интерфейсом, сохранением сессий и расширяемой архитектурой.

Читать статью
👏1
Как я использую Agent Teams в Claude Code

Функция Agent Teams позволяет нескольким ИИ-агентам работать в команде с общим списком задач и обменом сообщениями. Автор делится своим опытом использования этой возможности для планирования и выполнения задач.

Читать статью
👍2
Раскрываем возможности Gemini CLI: Skills, Hooks и Plan Mode

Обзор продвинутых возможностей Gemini CLI — hooks для детерминированного контроля, skills для специализированных знаний и plan mode для безопасного планирования изменений.

Читать статью
Уроки разработки Claude Code: prompt caching решает всё

Статья от разработчика Claude Code о том, как prompt caching (кэширование промптов) стал центральным архитектурным принципом продукта — и какие неочевидные уроки команда извлекла при оптимизации кэширования в масштабе.

Читать статью
👍1
K-образное будущее разработки программного обеспечения

ИИ не заменяет инженеров — он расслаивает индустрию на тех, кто становится ценнее прежнего, и тех, чьи навыки обесцениваются в реальном времени. Статья о том, почему главное — не скорость написания кода, а умение решать правильные задачи.

Читать статью
👍3
Code Mode: предоставьте агентам доступ ко всему API за 1 000 токенов

Cloudflare представляет новый MCP-сервер для всего Cloudflare API, использующий технику Code Mode — всего два инструмента и около 1 000 токенов вместо 1,17 миллиона, с открытым исходным кодом SDK для создания собственных серверов.

Читать статью
1
AI-повестка дня: главное с GitHub, Reddit и Hugging Face:

knowsuchagency/mcp2cli
Инструмент для мгновенного превращения любого MCP-сервера или спецификации OpenAPI в CLI без необходимости генерации кода.

jackwener/xiaohongshu-cli
Командная строка для взаимодействия с платформой Xiaohongshu через реверс-инжиниринг API, поддерживающая поиск и чтение контента.

marilyn4120shaz3/KiteAI
Инструмент для автоматизации активностей в децентрализованной сети Kite AI, включая стейкинг, DEX-свопы, прохождение квизов и работу через прокси.

aiming-lab/MetaClaw
Платформа для создания агентов, которые обучаются и развиваются непосредственно в процессе взаимодействия с пользователем.

sarvamai/sarvam-105b
Новая модель на 105 млрд параметров с упором на кодинг, математику и агентные задачи. Поддерживает инференс через vLLM и SGLang.

История об увлечении локальными LLM
Обсуждение того, как процесс апгрейда железа и эксперименты с квантованием моделей могут полностью поглотить внимание пользователя.

shenhao-stu/ohmycaptcha
Селф-хост решение для распознавания капчи на базе FastAPI и мультимодальных моделей, совместимое с OpenAI API.

В ComfyUI появились App Mode и ComfyHub
Режим App Mode превращает любой воркфлоу в простой интерфейс приложения, а ComfyHub позволяет делиться этими решениями с сообществом.

Qwen 3.5 0.8B запускает DOOM
Крошечная модель Qwen 3.5 управляет агентом в VizDoom, анализируя сетку скриншотов и успешно отдавая команды на перемещение и стрельбу.
👍21👏1
Жизненный цикл разработки ПО мёртв

ИИ-агенты не ускорили SDLC — они его уничтожили. Привычная цепочка «требования → проектирование → код → тестирование → ревью → деплой → мониторинг» больше не существует.

Читать статью
👍3
Как autoresearch изменит внедрение малых языковых моделей

Что если можно оптимизировать модель за ночь без какого-либо опыта в машинном обучении? Autoresearch — это подход, при котором ИИ-агент автономно проводит сотни экспериментов по обучению, отбирая только улучшения.

Читать статью
👍2
Как убить код-ревью

Код, написанный людьми, умер в 2025 году. Код-ревью умрёт в 2026-м. Автор объясняет, почему ручное ревью больше не работает в мире агентного программирования, и предлагает многоуровневую систему доверия вместо него.

Читать статью
🔥1🤔1
Как я понимаю Codex

Габриель Чуа из OpenAI объясняет свою ментальную модель Codex: модель + обвязка + поверхности — и как эти слои помогают разобраться в том, что именно меняется с каждым обновлением.

Читать статью
Писать код теперь дёшево

Главная сложность внедрения агентных практик разработки — привыкнуть к последствиям того факта, что написание кода теперь практически ничего не стоит.

Читать статью
👍1
Red/Green TDD (Разработка через тестирование)

Лаконичный и эффективный подход к получению лучших результатов от кодирующих агентов — использование красно-зелёного цикла TDD.

Читать статью
Образовательный отчёт Anthropic: Индекс свободного владения ИИ

Anthropic представляет первый Индекс свободного владения ИИ — базовое измерение того, как люди взаимодействуют с ИИ, основанное на анализе почти 10 000 разговоров с Claude. Исследование показывает, что итеративные диалоги демонстрируют вдвое больше признаков грамотного использования ИИ, а пользователи реже критически оценивают результаты, когда ИИ создаёт готовые артефакты.

Читать статью
👍1