Про AI: Лучшие cтатьи и исследования
1.24K subscribers
268 photos
1 video
352 links
Качественные AI переводы лучших англоязычных статей и исследований про AI.
Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
Download Telegram
Как создать собственный агентный фреймворк с помощью PI: стек, на котором работает OpenClaw

PI — это набор TypeScript-пакетов для создания ИИ-агентов. Статья пошагово разбирает четыре уровня фреймворка: от простых вызовов больших языковых моделей до полноценного агента с терминальным интерфейсом, сохранением сессий и расширяемой архитектурой.

Читать статью
👏1
Как я использую Agent Teams в Claude Code

Функция Agent Teams позволяет нескольким ИИ-агентам работать в команде с общим списком задач и обменом сообщениями. Автор делится своим опытом использования этой возможности для планирования и выполнения задач.

Читать статью
👍2
Раскрываем возможности Gemini CLI: Skills, Hooks и Plan Mode

Обзор продвинутых возможностей Gemini CLI — hooks для детерминированного контроля, skills для специализированных знаний и plan mode для безопасного планирования изменений.

Читать статью
Уроки разработки Claude Code: prompt caching решает всё

Статья от разработчика Claude Code о том, как prompt caching (кэширование промптов) стал центральным архитектурным принципом продукта — и какие неочевидные уроки команда извлекла при оптимизации кэширования в масштабе.

Читать статью
👍1
K-образное будущее разработки программного обеспечения

ИИ не заменяет инженеров — он расслаивает индустрию на тех, кто становится ценнее прежнего, и тех, чьи навыки обесцениваются в реальном времени. Статья о том, почему главное — не скорость написания кода, а умение решать правильные задачи.

Читать статью
👍3
Code Mode: предоставьте агентам доступ ко всему API за 1 000 токенов

Cloudflare представляет новый MCP-сервер для всего Cloudflare API, использующий технику Code Mode — всего два инструмента и около 1 000 токенов вместо 1,17 миллиона, с открытым исходным кодом SDK для создания собственных серверов.

Читать статью
1
AI-повестка дня: главное с GitHub, Reddit и Hugging Face:

knowsuchagency/mcp2cli
Инструмент для мгновенного превращения любого MCP-сервера или спецификации OpenAPI в CLI без необходимости генерации кода.

jackwener/xiaohongshu-cli
Командная строка для взаимодействия с платформой Xiaohongshu через реверс-инжиниринг API, поддерживающая поиск и чтение контента.

marilyn4120shaz3/KiteAI
Инструмент для автоматизации активностей в децентрализованной сети Kite AI, включая стейкинг, DEX-свопы, прохождение квизов и работу через прокси.

aiming-lab/MetaClaw
Платформа для создания агентов, которые обучаются и развиваются непосредственно в процессе взаимодействия с пользователем.

sarvamai/sarvam-105b
Новая модель на 105 млрд параметров с упором на кодинг, математику и агентные задачи. Поддерживает инференс через vLLM и SGLang.

История об увлечении локальными LLM
Обсуждение того, как процесс апгрейда железа и эксперименты с квантованием моделей могут полностью поглотить внимание пользователя.

shenhao-stu/ohmycaptcha
Селф-хост решение для распознавания капчи на базе FastAPI и мультимодальных моделей, совместимое с OpenAI API.

В ComfyUI появились App Mode и ComfyHub
Режим App Mode превращает любой воркфлоу в простой интерфейс приложения, а ComfyHub позволяет делиться этими решениями с сообществом.

Qwen 3.5 0.8B запускает DOOM
Крошечная модель Qwen 3.5 управляет агентом в VizDoom, анализируя сетку скриншотов и успешно отдавая команды на перемещение и стрельбу.
👍21👏1
Жизненный цикл разработки ПО мёртв

ИИ-агенты не ускорили SDLC — они его уничтожили. Привычная цепочка «требования → проектирование → код → тестирование → ревью → деплой → мониторинг» больше не существует.

Читать статью
👍3
Как autoresearch изменит внедрение малых языковых моделей

Что если можно оптимизировать модель за ночь без какого-либо опыта в машинном обучении? Autoresearch — это подход, при котором ИИ-агент автономно проводит сотни экспериментов по обучению, отбирая только улучшения.

Читать статью
👍2
Как убить код-ревью

Код, написанный людьми, умер в 2025 году. Код-ревью умрёт в 2026-м. Автор объясняет, почему ручное ревью больше не работает в мире агентного программирования, и предлагает многоуровневую систему доверия вместо него.

Читать статью
🔥1🤔1
Как я понимаю Codex

Габриель Чуа из OpenAI объясняет свою ментальную модель Codex: модель + обвязка + поверхности — и как эти слои помогают разобраться в том, что именно меняется с каждым обновлением.

Читать статью
Писать код теперь дёшево

Главная сложность внедрения агентных практик разработки — привыкнуть к последствиям того факта, что написание кода теперь практически ничего не стоит.

Читать статью
👍1
Red/Green TDD (Разработка через тестирование)

Лаконичный и эффективный подход к получению лучших результатов от кодирующих агентов — использование красно-зелёного цикла TDD.

Читать статью
Образовательный отчёт Anthropic: Индекс свободного владения ИИ

Anthropic представляет первый Индекс свободного владения ИИ — базовое измерение того, как люди взаимодействуют с ИИ, основанное на анализе почти 10 000 разговоров с Claude. Исследование показывает, что итеративные диалоги демонстрируют вдвое больше признаков грамотного использования ИИ, а пользователи реже критически оценивают результаты, когда ИИ создаёт готовые артефакты.

Читать статью
👍1
Как мы построили масштабируемую инфраструктуру оценки ИИ-агентов для веба

Глубокое погружение в высокопараллельную платформу оценки на основе LLM-судьи, которая решает проблему дисперсии результатов веб-агентов.

Читать статью
Могут ли агентные системы справиться с миграцией COBOL?

Инженер из Amp Code провёл эксперимент: полностью перенёс демонстрационное COBOL-приложение с мейнфрейма в облако, написав 100% кода с помощью AI-агентов. Результат оказался неожиданно успешным.

Читать статью
Главные AI-темы с GitHub, Reddit и Hugging Face:

Первые бенчмарки M5 Max
Опубликованы результаты производительности различных LLM на новом 14-дюймовом Apple M5 Max с 128 ГБ памяти.

Autokernel: автоматическая оптимизация GPU-ядер
Инструмент для автоматического исследования и генерации оптимизированных Triton-ядер для любой модели PyTorch.

Отказ от function calling в пользу CLI для агентов
Бывший ведущий бэкенд-разработчик Manus предлагает использовать единый Unix-инструмент командной строки вместо каталога типизированных вызовов функций.

Необычный бенчмарк для проверки навыков кодинга
Предложен новый сложный тест для проверки способностей моделей к написанию анимаций на Three.js.

NVIDIA инвестирует $26 млрд в разработку open-weight моделей
Согласно финансовым отчетам, компания планирует направить значительные средства на создание ИИ-моделей с открытыми весами.

Nah: контроль безопасности для Claude Code
Контекстно-зависимая система разрешений, обеспечивающая контролируемую среду безопасности при работе с Claude Code.

NVIDIA выпустила модель Nemotron-3-Super-120B
Новая крупная языковая модель от NVIDIA на 120 млрд параметров стала доступна на Hugging Face.

Запуск llama.cpp на MacBook Neo
На устройстве с чипом A18 Pro удалось запустить Qwen 3.5 9B, достигнув скорости генерации 3.9 t/s.

Управление экраном Ubuntu для OpenClaw
Инструментарий для работы агентов OpenClaw в среде рабочего стола Ubuntu Xorg (X11).

RoboClaw: ассистент для воплощенного ИИ
Новый ИИ-помощник, ориентированный на задачи в области Embodied AI.
👍1
Как мы взломали ИИ-платформу McKinsey

Автономный ИИ-агент нашёл SQL-инъекцию в Lilli — внутренней ИИ-платформе McKinsey — и за два часа получил полный доступ к продакшен-базе данных с 46,5 миллионами сообщений.

Читать статью
👀1
Самосовершенствующаяся AI-система, которая построила сама себя

Разработчик из Composio создал оркестратор AI-агентов, который координирует до 30 параллельных coding-агентов, автоматически исправляет ошибки CI и обрабатывает code review - а потом направил агентов на улучшение самого оркестратора. 40 000 строк TypeScript за 8 дней.

Читать статью
👍1
Почему SWE-bench Verified больше не измеряет возможности фронтирного кодирования

SWE-bench Verified все больше подвержен контаминации данных. OpenAI рекомендует переходить на SWE-bench Pro для оценки возможностей моделей в программировании.

Читать статью
Файловая система -- это новая база данных: как я построил персональную ОС для ИИ-агентов

Муратджан Коилан рассказывает, как он создал Personal Brain OS -- файловую систему на базе Git-репозитория, которая превращает ИИ-ассистентов из забывчивых собеседников в полноценных рабочих партнёров с доступом к голосу, целям, контактам и рабочим процессам автора.

Читать статью
👍2