Про AI: Лучшие cтатьи и исследования
1.28K subscribers
282 photos
1 video
368 links
Качественные AI переводы лучших англоязычных статей и исследований про AI.
Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
Download Telegram
AI-повестка дня: главное с GitHub, Reddit и Hugging Face:

Robbyant/lingbot-world — продвижение open-source моделей мира
Проект направлен на развитие открытых world models для AI-агентов.

jmuncor/sherlock — мониторинг API-трафика LLM в реальном времени
Инструмент перехватывает вызовы LLM API и визуализирует использование токенов в терминале, помогая отслеживать расходы и отлаживать prompts.

DeepSeek-OCR-2 — новая модель распознавания текста от DeepSeek
Inference доступен через Huggingface transformers на NVIDIA GPU.

Qwen3-ASR — мультиязычная система распознавания речи от Alibaba
Open-source серия ASR-моделей поддерживает распознавание речи, музыки и песен, определение языка и предсказание временных меток.

Prismer-AI/Prismer — открытая альтернатива OpenAI Prism
Open source проект как альтернатива закрытому OpenAI Prism.

Kimi K2.5 — новая лидирующая open-source модель для программирования
Kimi K2.5 представлена как лучшая открытая языковая модель для задач программирования.

MOVA — синхронизированная генерация видео и аудио
Проект направлен на масштабируемую и синхронизированную генерацию видео и аудио контента.

Kimi K2.5 показывает производительность Opus при 10% стоимости
Модель демонстрирует near-SOTA результаты при стоимости около 10% от Opus, превосходя GLM на не-веб задачах.

Запуск Kimi K2.5 локально стал доступнее благодаря новому квантованию
Мультимодальная модель на 1 триллион параметров сжимается с 600 GB до 240 GB с помощью Unsloth Dynamic 1.8-bit GGUF квантования.

GitHub тренды недели: половина репозиториев — AI-агентские фреймворки
Половина топовых репозиториев на GitHub — AI-агентские фреймворки, 90% из которых, по прогнозам, исчезнут через неделю, напоминая ситуацию с JS-фреймворками.
Obsidian + Claude Code 101

Система ведения заметок с помощью ИИ: как превратить хранилище Obsidian в живую базу знаний, которой управляет Claude Code

Читать статью
👍1
Как попасть в рекомендации LLM и AI-инструментов

Кэссиди Уильямс делится экспериментом: она выяснила, почему ИИ-боты её не рекомендуют, и использовала их же советы, чтобы это исправить. Спустя пару недель — результат налицо.

Читать статью
👍1
Что такое «наука» на самом деле?

Новый взгляд на философию науки с применением современной теории ИИ. Культурно-прагматический пробабилизм как способ примирить строгость и анархизм Фейерабенда.

Читать статью
Парадокс Джевонса для программной инженерии

Каждый раз, когда мы упрощали создание ПО, мы в итоге писали экспоненциально больше кода. ИИ-ассистенты повторят этот паттерн в беспрецедентных масштабах.

Читать статью
🔥1💯1
Единственный ИИ-бизнес, который стоит строить

Автор анализирует популярные бизнес-модели в сфере ИИ и объясняет, почему программные продукты — единственный путь к реальному успеху в эпоху искусственного интеллекта.

Читать статью
👍3
Moltbook — самое интересное место в интернете прямо сейчас

Moltbook — социальная сеть для ИИ-агентов, построенная на основе OpenClaw. Саймон Уиллисон рассказывает, как цифровые помощники общаются друг с другом, делятся знаниями и почему это одновременно захватывающе и пугающе.

Читать статью
🔥2
Прозрачные PNG-стикеры с Nano Banana Pro и Gemini Interactions API

Практическое руководство по генерации стикеров с прозрачным фоном: используем chromakey-зелёный и HSV-фильтрацию вместо отдельных моделей удаления фона.

Читать статью
🔥1
От трейсов к инсайтам: понимание поведения агентов в масштабе

LangSmith Insights Agent — новый инструмент для автоматического анализа тысяч трейсов агентов в продакшене. Вместо ручного просмотра он использует кластеризацию для обнаружения паттернов использования и типов ошибок.

Читать статью
Как я использую Claude Code

Полное руководство по работе с Claude Code — от базовых принципов до продвинутых техник. Автор делится проверенными стратегиями управления контекстом, планирования, отладки и масштабирования работы с несколькими терминалами параллельно.

Читать статью
🔥2💯1
Сегодняшние тренды AI-индустрии:

Lingbot-World: развитие open-source World Models
Проект посвящён продвижению открытых моделей мира для AI-систем.

Qwen3-ASR от Alibaba: многоязычное распознавание речи и музыки
Open-source серия ASR-моделей с поддержкой стабильного распознавания речи, музыки и песен, определения языка и предсказания временных меток.

Lingbot-Depth: моделирование глубины для пространственного восприятия
Masked Depth Modeling — новый подход к обучению пространственному восприятию.

VibeVoice-ASR от Microsoft
Новая модель автоматического распознавания речи от Microsoft.

TokenTap: мониторинг использования токенов в реальном времени
Инструмент для перехвата API-трафика LLM и визуализации использования токенов в терминале — отслеживание затрат, отладка prompts и мониторинг контекстного окна.

DeepSeek-OCR-2: распознавание текста на NVIDIA GPU
Inference с использованием Hugging Face transformers на видеокартах NVIDIA.

Prismer: open-source альтернатива OpenAI Prism
Открытая альтернатива закрытой модели OpenAI Prism.

Z Base — новая модель для Stable Diffusion
Модель Z-Image совместима со Stable Diffusion и доступна на HuggingFace со split-файлами для Comfy-Org.

Yann LeCun предупреждает: лучшие открытые модели теперь из Китая
Yann LeCun заявил, что лучшие открытые AI-модели появляются в Китае, а не на Западе, и что закрытие доступа может замедлить прогресс западных разработок.

AgentCPM-Report: агент на базе большой языковой модели
Open-source AI-агент, совместно разработанный THUNLP, Народным университетом Китая и ModelBest.
Clawdbot показал мне, как будет выглядеть будущее персональных ИИ-ассистентов

Clawdbot — революционный open-source проект, превращающий локальный Mac в мощного персонального ИИ-агента с доступом к файловой системе, терминалу и внешним интеграциям. Автор провёл неделю с этим инструментом и готов поделиться впечатлениями.

Читать статью
Clawdbot / OpenClaw — Полное руководство по практическому использованию

На канале This Week in Startups вышло отличное видео про практику использования Сlawdbot/OpenClaw и важные настройки безопастности для вашего агента - https://www.youtube.com/watch?v=sejqZld2yZ8&t=1165s

Конспект видео с ключевыми идеями и советами на русском
Руководство по агентному ИИ: паттерны для продакшена

Исчерпывающее руководство по 113 паттернам для создания надёжных ИИ-агентов. Паттерны собраны из публичных описаний реальных систем — рабочие процессы, защитные механизмы и архитектура, которые делают агентов полезными за пределами демо.

Читать статью
50 недооценённых советов по работе с Claude (практическое руководство)

Полезные советы по Claude Code, рабочим процессам Cowork, скрытым ресурсам Anthropic и секретам продвинутых пользователей — всё, о чём мало кто говорит.

Читать статью
7 советов по Codex для быстрой разработки приложений

Практические советы для начинающих пользователей Codex от разработчика, который выпускает приложения с ChatGPT Pro с декабря 2024 года.

Читать статью
Утренняя сводка из мира AI:

nanobot — ультралёгкий клон Claude
Репозиторий nanobot представляет минималистичную реализацию чат-бота в стиле Claude.

Насколько открытые модели близки к SOTA? Честный взгляд без оглядки на бенчмарки
Откровенная оценка open-weight моделей: они достигают топовых результатов в некоторых задачах, но в целом всё ещё отстают.

Уязвимость базы данных Moltbook позволяет захватить любого AI-агента на сайте
Обнаружена серьёзная брешь в безопасности, дающая полный контроль над AI-агентами платформы.

Почему GPT-OSS остаётся таким хорошим?
Обсуждение причин превосходства GPT-OSS 120B: нативный 4-bit training, скорость и качество датасета в сравнении с новыми моделями.

Новая модель Anima — 8 персонажей в промпте, отличные лица и руки, без upscale; превосходит Illustrious
Anima — новая базовая модель Stable Diffusion для генерации аниме-изображений высокого качества с поддержкой 8 персонажей без необходимости upscale или adetailer.

InstaTrace — инструмент для извлечения URL приватных постов Instagram
Исследовательский proof-of-concept для получения прямых ссылок на приватные посты Instagram.

Может ли 4chan-датасет улучшить модель? Оказывается, да!
Assistant_Pepe_8B — модель на базе LLaMA, дообученная на данных 4chan, неожиданно превосходит базовую версию и Nvidia Nemotron по правдивости ответов и alignment.

airctl — современный инструмент управления WiFi для Linux
Приложение на GTK4 и Python с чистым интерфейсом для сканирования, подключения и управления беспроводными сетями.

FER-IT — мониторинг эмоций сотрудников для повышения продуктивности
Система распознавания эмоций по лицу в реальном времени с использованием модели IEEE CLCM, Flask и TensorFlow с демо через веб-камеру.

Anima — нативная поддержка в ComfyUI
Модель Anima теперь официально поддерживается в ComfyUI для удобной работы с генерацией изображений.
1
Автоматическое программирование

Antirez объясняет, почему стоит разделять «вайб-кодинг» и «автоматическое программирование» — и почему код, созданный с помощью ИИ при осознанном управлении процессом, по праву принадлежит программисту.

Читать статью
Два типа пользователей ИИ: разрыв между ними поражает

Между «продвинутыми» и «обычными» пользователями ИИ формируется стремительно растущий разрыв — и крупные корпорации рискуют оказаться на неправильной стороне.

Читать статью
Файловая система или база данных для памяти агентов: обзор дебатов

Разбираем текущую дискуссию о выборе между файловыми интерфейсами и базами данных для организации памяти ИИ-агентов.

Читать статью
Агентный психоз: мы сходим с ума?

Зависимость от ИИ-агентов, токсичные слоп-лупы и бремя мейнтейнеров открытого кода — взгляд изнутри на то, как увлечение агентным программированием меняет нас и наши проекты.

Читать статью