Про AI: Лучшие cтатьи и исследования
1.59K subscribers
484 photos
1 video
621 links
Качественные AI переводы лучших англоязычных статей и исследований про AI.
Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
Download Telegram
AI-дайджест: что обсуждают на GitHub, Reddit и Hugging Face:

NVIDIA убирает категорию игровых доходов из финансовых отчетов
Компания перестанет выделять выручку от игрового сегмента в отдельную категорию в своей финансовой отчетности.

Tencent выпустила модель Z-Image 6B для генерации в пиксельном пространстве
Модель работает без VAE, поддерживает разрешение 1k и генерирует изображения напрямую в пространстве пикселей.

DeepSeek планирует раунд финансирования на 10,29 миллиарда долларов
Глава компании Лян Вэньфэн намерен сосредоточиться на разработке open source моделей вместо погони за краткосрочной коммерциализацией.

Инструмент для апскейлинга и генерации кадров Lossless-Scaling
Решение с технологией LSFG для повышения четкости изображения и увеличения FPS, устанавливаемое одной командой.

Генератор ИИ-изображений и видео без цензуры
Инструмент для создания взрослого контента (18+) без программных ограничений.

Инструментарий для восстановления файлов после шифровальщика LockBit 3.0
Набор утилит для дешифровки файлов, пораженных вирусом LockBit 3.0 ("Black"), использующий уязвимость повторного использования ключевого потока.

Обсуждение «секретного ингредиента» GPT-5.5 и механизмов рассуждения
В сети обсуждают утечку логов, согласно которой продвинутые возможности модели могут основываться на упрощенном режиме рассуждений.

Влияет ли расстояние между GPU на охлаждение при андервольтинге
Пользователи обсуждают необходимость свободного пространства между видеокартами при работе с пониженным напряжением.

Неавторегрессионная ASR-модель Paraformer-large
Модель для распознавания речи, оптимизированная для инференса через ONNX без зависимости от PyTorch.

Модель распознавания китайской речи Paraformer-zh
Готовая к использованию end-to-end модель, работающая в 120 раз быстрее реального времени на GPU.
🔥1
Как я настроил пользовательских субагентов для Codex

Практическое руководство по организации параллельной работы с субагентами в Codex: шесть типовых агентов, паттерн «карточки задания» и конфигурация для мультиагентной разработки.

Читать статью
WorkOS запускает auth.md — открытый протокол для регистрации агентов в веб-сервисах

WorkOS представляет auth.md — открытый протокол, позволяющий ИИ-агентам регистрироваться в веб-сервисах. Вместо имитации человеческих действий в браузере агенты получают собственный, полноценный путь регистрации.

Читать статью
Как Claude Code работает в больших кодовых базах: лучшие практики и с чего начать

Самые успешные внедрения Claude Code объединяет набор узнаваемых паттернов в конфигурации, инструментарии и организационной структуре. Эта статья — часть серии «Claude Code в масштабе», посвящённой лучшим практикам для инженерных организаций, внедряющих Claude Code на корпоративном уровне.

Читать статью
🔥2
Создание безопасной и эффективной песочницы для работы Codex на Windows

Статья описывает, как команда Codex в OpenAI разработала собственную песочницу для Windows, чтобы обеспечить безопасное выполнение команд кодинг-агентом без постоянного подтверждения от пользователя.

Читать статью
2
Главные темы дня в AI-индустрии:

Financial Times опубликовала статью об инструменте Heretic
Heretic — это open source инструмент для снятия ограничений (guardrails) с Llama 3.3 от Meta, который использовался для создания тысяч нецензурированных моделей.

Торговый бот для платформы Hyperliquid
Проект представляет собой бота для торговли бессрочными контрактами и реализации прибыльных торговых стратегий на платформе Hyperliquid.

Релиз MiniCPM5-1B от OpenBMB
Представлена первая модель в серии MiniCPM5 — компактная языковая модель с 1 миллиардом параметров.

Zero-shot клонирование голоса и генерация речи Scenema
Инструмент для выразительного клонирования голоса и синтеза речи, работающий в режиме zero-shot без необходимости предварительной подготовки.

Останется ли NVIDIA стандартом для локальных LLM в 2026 году?
В сообществе обсуждают актуальность GPU от NVIDIA как основного выбора оборудования для запуска локальных моделей в ближайшем будущем.

Реализация архитектуры agent-runtime на Python
Порт архитектуры agent-runtime из Claude Code для Python на базе LangChain.

Выход нецензурированной версии Qwen3.5 35B A3B Heretic
Модель выпущена с полным сохранением 785 MTP и доступна в форматах Safetensors, GGUF, NVFP4 и GPTQ-Int4.

Библиотека uni-mm-trainer для обучения мультимодальных LLM
Легковесная библиотека для тренировки мультимодальных моделей, объединяющих работу с текстом, изображениями и аудио.

Бинарные и тернарные модели Bonsai Image 4B от PrismML
Выпущены 1-битные и тернарные диффузионные трансформеры для генерации изображений, способные работать локально в браузере через WebGPU.

Графический интерфейс для SNI-Spoofing на Windows
Проект AriMando предлагает современный GUI для обхода ограничений методом SNI-Spoofing без использования командной строки.
🔥2
Project Glasswing: что нам показала модель Mythos

Cloudflare несколько месяцев тестировала специализированные LLM для поиска уязвимостей в собственной инфраструктуре. Модель Mythos Preview от Anthropic продемонстрировала качественный скачок: она умеет выстраивать цепочки эксплойтов и автоматически доказывать эксплуатируемость найденных багов.

Читать статью
Project Glasswing: что нам показала модель Mythos

Cloudflare несколько месяцев тестировала специализированные LLM для поиска уязвимостей в собственной инфраструктуре. Модель Mythos Preview от Anthropic продемонстрировала качественный скачок: она умеет выстраивать цепочки эксплойтов и автоматически доказывать эксплуатируемость найденных багов.

Читать статью
Лучшие практики использования компьютера и браузера с Claude (часть 1)

Практическое руководство для разработчиков, интегрирующих возможности управления компьютером и браузером с семейством моделей Claude.

Читать статью
👍1
Лучшие практики использования компьютера и браузера с Claude (часть 2)

Управление контекстом, экспериментальные настройки и обучение Claude через демонстрации — продолжение руководства по computer use и browser use.

Читать статью
Codex-максинг

Как превратить Codex из инструмента для написания кода в полноценную рабочую среду: долгоживущие потоки, голосовой ввод, управляемая память, удалённый контроль и артефакты в боковой панели.

Читать статью
Дайджест AI-новостей: что в тренде сегодня:

FlashML-org/flashlib
Быстрые и эффективные по памяти операторы для классического машинного обучения.

Sophomoresty/gemini-web2api
Инструмент для конвертации веб-версии Google Gemini в OpenAI-совместимый API без необходимости авторизации.

Релиз 1-битных моделей генерации изображений от PrismML
Диффузионные трансформеры Bonsai на 4B параметров работают локально в браузере через WebGPU и занимают около 3 ГБ.

kepengxu/PRISM-VL
Исследование обучения мультимодальных моделей (VLM) на основе физических измерений с использованием RAW-данных и параметров камеры.

Самодельный локальный AI-сервер из подручных средств
В сообществе обсуждают пример крайне бюджетной и нестандартной аппаратной сборки для запуска нейросетей дома.

BennyDaBall/Qwen3-4b-Z-Image-Engineer-V4
Обновление специализированной модели на базе Qwen3 для работы с изображениями; в разработке уже находится шестая версия.

Влияние вежливого обращения на галлюцинации ИИ
Исследование того, как вежливый промптинг помогает моделям избегать зацикливания и честно признавать нехватку знаний.

Jackrong/Qwopus3.6-27B-v2-MTP-GGUF
Квантованная GGUF-версия модели Qwopus 3.6 на 27B параметров.

OpenMOSS-Team/moss-moon-003-base
Базовая версия открытой модели MOSS-moon-003, включающая наборы данных и инструменты для разработки.

OpenMOSS-Team/moss-moon-003-sft
Версия модели MOSS-moon-003, прошедшая стадию дообучения (SFT) для улучшения работы в режиме диалога.
👍1
Оценка агентов: подробное руководство

Лучшие практики и распространённые паттерны для эффективной оценки ИИ-агентов: от фундаментальных концепций до конкретных бенчмарков и пошагового плана создания собственной системы оценки.

Читать статью
Оценка агентов: подробное руководство (часть 2)

Продолжение: мультиагентные системы, context engineering и scaffolding агентов.

Читать статью
👍1
Оценка агентов: подробное руководство (часть 3)

Продолжение: паттерны оценки агентов, типы грейдеров и категории оценки.

Читать статью
👍1👏1
Оценка агентов: подробное руководство (часть 4)

Продолжение: кейс-стади серии tau-bench -- от базового бенчмарка до tau2-bench и tau3-bench.

Читать статью
👍1
Оценка агентов: подробное руководство (часть 5)

Завершение: Terminal-Bench, обзор других бенчмарков и дорожная карта создания собственной системы оценки агентов.

Читать статью
👍1
Code Intelligence для Linear Agent

Linear запускает Code Intelligence — функцию, которая позволяет ИИ-агенту читать кодовую базу и отвечать на вопросы, основываясь непосредственно на исходном коде. Это меняет рабочие процессы не только для разработчиков, но и для поддержки, продакт-менеджеров и всей команды.

Читать статью
👍1
Сегодня в AI-мире обсуждают:

gemini-web2api: Конвертация веб-версии Gemini в OpenAI-совместимый API
Инструмент позволяет превратить веб-интерфейс Google Gemini в API, совместимый с форматом OpenAI. Решение не требует авторизации, является кроссплатформенным и состоит из одного исполняемого файла.

aimili-vpngate: Прокси-инструмент для Linux
Утилита для Linux, использующая сервис vpngate.net для обеспечения выхода в сеть через прокси с чистыми IP-адресами.

DeltaForce-OBS-Locker: Плагин для автоматического прицеливания в Delta Force
Интеллектуальный помощник для прицеливания, работающий через инъекцию в рендеринг OBS. Поддерживает распознавание скелета, плавный аимбот и контроль отдачи, обеспечивая стабильную работу без обнаружения.

flashlib: Быстрые и эффективные операторы для классического машинного обучения
Библиотека с открытым исходным кодом, предлагающая оптимизированные по скорости и потреблению памяти операторы для задач классического машинного обучения.

Торговый бот для платформы Hyperliquid
Специализированный бот для торговли бессрочными контрактами на децентрализованной бирже Hyperliquid.

Financial Times опубликовала статью о проекте Heretic
Издание Financial Times подготовило материал, посвященный ИИ-проекту Heretic.

PrismML выпустила 1-битные диффузионные модели Bonsai Image 4B
Представлены модели для генерации изображений на 4 млрд параметров с использованием бинарных и тернарных весов. Модели работают полностью локально в браузере через WebGPU и занимают около 3 ГБ памяти.

Релиз MiniCPM5-1B от OpenBMB
Выпущена MiniCPM5-1B — первая модель в новой серии MiniCPM5, ориентированная на высокую производительность при малом количестве параметров.

Qwopus3.6-27B-v2-MTP в формате GGUF
Доступна обновленная версия модели на 27 млрд параметров в формате GGUF, оптимизированная для инференса на локальных устройствах.

Пример бюджетной сборки локального ИИ-сервера
Пользователи обсуждают самодельный и максимально упрощенный сервер для работы с локальными языковыми моделями.
🔥2
Лучшие практики использования компьютера и браузера с Claude

Практическое руководство для разработчиков, создающих интеграции computer use и browser use с семейством моделей Claude.

Читать статью
Мои главные выводы из разговора с Дэном Шиппером

Ленни Рачитски делится десятью ключевыми инсайтами из подкаста с Дэном Шиппером — основателем Every и одним из самых «AI-пилленых» людей в технологической индустрии — о будущем работы, SaaS, агентах и роли человека в эпоху ИИ.

Читать статью