AI-повестка дня: главное с GitHub, Reddit и Hugging Face:
Robbyant/lingbot-world — продвижение open-source моделей мира
Проект направлен на развитие открытых world models для AI-агентов.
jmuncor/sherlock — мониторинг API-трафика LLM в реальном времени
Инструмент перехватывает вызовы LLM API и визуализирует использование токенов в терминале, помогая отслеживать расходы и отлаживать prompts.
DeepSeek-OCR-2 — новая модель распознавания текста от DeepSeek
Inference доступен через Huggingface transformers на NVIDIA GPU.
Qwen3-ASR — мультиязычная система распознавания речи от Alibaba
Open-source серия ASR-моделей поддерживает распознавание речи, музыки и песен, определение языка и предсказание временных меток.
Prismer-AI/Prismer — открытая альтернатива OpenAI Prism
Open source проект как альтернатива закрытому OpenAI Prism.
Kimi K2.5 — новая лидирующая open-source модель для программирования
Kimi K2.5 представлена как лучшая открытая языковая модель для задач программирования.
MOVA — синхронизированная генерация видео и аудио
Проект направлен на масштабируемую и синхронизированную генерацию видео и аудио контента.
Kimi K2.5 показывает производительность Opus при 10% стоимости
Модель демонстрирует near-SOTA результаты при стоимости около 10% от Opus, превосходя GLM на не-веб задачах.
Запуск Kimi K2.5 локально стал доступнее благодаря новому квантованию
Мультимодальная модель на 1 триллион параметров сжимается с 600 GB до 240 GB с помощью Unsloth Dynamic 1.8-bit GGUF квантования.
GitHub тренды недели: половина репозиториев — AI-агентские фреймворки
Половина топовых репозиториев на GitHub — AI-агентские фреймворки, 90% из которых, по прогнозам, исчезнут через неделю, напоминая ситуацию с JS-фреймворками.
Robbyant/lingbot-world — продвижение open-source моделей мира
Проект направлен на развитие открытых world models для AI-агентов.
jmuncor/sherlock — мониторинг API-трафика LLM в реальном времени
Инструмент перехватывает вызовы LLM API и визуализирует использование токенов в терминале, помогая отслеживать расходы и отлаживать prompts.
DeepSeek-OCR-2 — новая модель распознавания текста от DeepSeek
Inference доступен через Huggingface transformers на NVIDIA GPU.
Qwen3-ASR — мультиязычная система распознавания речи от Alibaba
Open-source серия ASR-моделей поддерживает распознавание речи, музыки и песен, определение языка и предсказание временных меток.
Prismer-AI/Prismer — открытая альтернатива OpenAI Prism
Open source проект как альтернатива закрытому OpenAI Prism.
Kimi K2.5 — новая лидирующая open-source модель для программирования
Kimi K2.5 представлена как лучшая открытая языковая модель для задач программирования.
MOVA — синхронизированная генерация видео и аудио
Проект направлен на масштабируемую и синхронизированную генерацию видео и аудио контента.
Kimi K2.5 показывает производительность Opus при 10% стоимости
Модель демонстрирует near-SOTA результаты при стоимости около 10% от Opus, превосходя GLM на не-веб задачах.
Запуск Kimi K2.5 локально стал доступнее благодаря новому квантованию
Мультимодальная модель на 1 триллион параметров сжимается с 600 GB до 240 GB с помощью Unsloth Dynamic 1.8-bit GGUF квантования.
GitHub тренды недели: половина репозиториев — AI-агентские фреймворки
Половина топовых репозиториев на GitHub — AI-агентские фреймворки, 90% из которых, по прогнозам, исчезнут через неделю, напоминая ситуацию с JS-фреймворками.
GitHub
GitHub - Robbyant/lingbot-world: Advancing Open-source World Models
Advancing Open-source World Models. Contribute to Robbyant/lingbot-world development by creating an account on GitHub.
Obsidian + Claude Code 101
Система ведения заметок с помощью ИИ: как превратить хранилище Obsidian в живую базу знаний, которой управляет Claude Code
Читать статью
Система ведения заметок с помощью ИИ: как превратить хранилище Obsidian в живую базу знаний, которой управляет Claude Code
Читать статью
👍1
Как попасть в рекомендации LLM и AI-инструментов
Кэссиди Уильямс делится экспериментом: она выяснила, почему ИИ-боты её не рекомендуют, и использовала их же советы, чтобы это исправить. Спустя пару недель — результат налицо.
Читать статью
Кэссиди Уильямс делится экспериментом: она выяснила, почему ИИ-боты её не рекомендуют, и использовала их же советы, чтобы это исправить. Спустя пару недель — результат налицо.
Читать статью
👍1
Что такое «наука» на самом деле?
Новый взгляд на философию науки с применением современной теории ИИ. Культурно-прагматический пробабилизм как способ примирить строгость и анархизм Фейерабенда.
Читать статью
Новый взгляд на философию науки с применением современной теории ИИ. Культурно-прагматический пробабилизм как способ примирить строгость и анархизм Фейерабенда.
Читать статью
Парадокс Джевонса для программной инженерии
Каждый раз, когда мы упрощали создание ПО, мы в итоге писали экспоненциально больше кода. ИИ-ассистенты повторят этот паттерн в беспрецедентных масштабах.
Читать статью
Каждый раз, когда мы упрощали создание ПО, мы в итоге писали экспоненциально больше кода. ИИ-ассистенты повторят этот паттерн в беспрецедентных масштабах.
Читать статью
🔥1💯1
Единственный ИИ-бизнес, который стоит строить
Автор анализирует популярные бизнес-модели в сфере ИИ и объясняет, почему программные продукты — единственный путь к реальному успеху в эпоху искусственного интеллекта.
Читать статью
Автор анализирует популярные бизнес-модели в сфере ИИ и объясняет, почему программные продукты — единственный путь к реальному успеху в эпоху искусственного интеллекта.
Читать статью
👍3
Moltbook — самое интересное место в интернете прямо сейчас
Moltbook — социальная сеть для ИИ-агентов, построенная на основе OpenClaw. Саймон Уиллисон рассказывает, как цифровые помощники общаются друг с другом, делятся знаниями и почему это одновременно захватывающе и пугающе.
Читать статью
Moltbook — социальная сеть для ИИ-агентов, построенная на основе OpenClaw. Саймон Уиллисон рассказывает, как цифровые помощники общаются друг с другом, делятся знаниями и почему это одновременно захватывающе и пугающе.
Читать статью
🔥2
Прозрачные PNG-стикеры с Nano Banana Pro и Gemini Interactions API
Практическое руководство по генерации стикеров с прозрачным фоном: используем chromakey-зелёный и HSV-фильтрацию вместо отдельных моделей удаления фона.
Читать статью
Практическое руководство по генерации стикеров с прозрачным фоном: используем chromakey-зелёный и HSV-фильтрацию вместо отдельных моделей удаления фона.
Читать статью
🔥1
От трейсов к инсайтам: понимание поведения агентов в масштабе
LangSmith Insights Agent — новый инструмент для автоматического анализа тысяч трейсов агентов в продакшене. Вместо ручного просмотра он использует кластеризацию для обнаружения паттернов использования и типов ошибок.
Читать статью
LangSmith Insights Agent — новый инструмент для автоматического анализа тысяч трейсов агентов в продакшене. Вместо ручного просмотра он использует кластеризацию для обнаружения паттернов использования и типов ошибок.
Читать статью
Как я использую Claude Code
Полное руководство по работе с Claude Code — от базовых принципов до продвинутых техник. Автор делится проверенными стратегиями управления контекстом, планирования, отладки и масштабирования работы с несколькими терминалами параллельно.
Читать статью
Полное руководство по работе с Claude Code — от базовых принципов до продвинутых техник. Автор делится проверенными стратегиями управления контекстом, планирования, отладки и масштабирования работы с несколькими терминалами параллельно.
Читать статью
🔥2💯1
Сегодняшние тренды AI-индустрии:
Lingbot-World: развитие open-source World Models
Проект посвящён продвижению открытых моделей мира для AI-систем.
Qwen3-ASR от Alibaba: многоязычное распознавание речи и музыки
Open-source серия ASR-моделей с поддержкой стабильного распознавания речи, музыки и песен, определения языка и предсказания временных меток.
Lingbot-Depth: моделирование глубины для пространственного восприятия
Masked Depth Modeling — новый подход к обучению пространственному восприятию.
VibeVoice-ASR от Microsoft
Новая модель автоматического распознавания речи от Microsoft.
TokenTap: мониторинг использования токенов в реальном времени
Инструмент для перехвата API-трафика LLM и визуализации использования токенов в терминале — отслеживание затрат, отладка prompts и мониторинг контекстного окна.
DeepSeek-OCR-2: распознавание текста на NVIDIA GPU
Inference с использованием Hugging Face transformers на видеокартах NVIDIA.
Prismer: open-source альтернатива OpenAI Prism
Открытая альтернатива закрытой модели OpenAI Prism.
Z Base — новая модель для Stable Diffusion
Модель Z-Image совместима со Stable Diffusion и доступна на HuggingFace со split-файлами для Comfy-Org.
Yann LeCun предупреждает: лучшие открытые модели теперь из Китая
Yann LeCun заявил, что лучшие открытые AI-модели появляются в Китае, а не на Западе, и что закрытие доступа может замедлить прогресс западных разработок.
AgentCPM-Report: агент на базе большой языковой модели
Open-source AI-агент, совместно разработанный THUNLP, Народным университетом Китая и ModelBest.
Lingbot-World: развитие open-source World Models
Проект посвящён продвижению открытых моделей мира для AI-систем.
Qwen3-ASR от Alibaba: многоязычное распознавание речи и музыки
Open-source серия ASR-моделей с поддержкой стабильного распознавания речи, музыки и песен, определения языка и предсказания временных меток.
Lingbot-Depth: моделирование глубины для пространственного восприятия
Masked Depth Modeling — новый подход к обучению пространственному восприятию.
VibeVoice-ASR от Microsoft
Новая модель автоматического распознавания речи от Microsoft.
TokenTap: мониторинг использования токенов в реальном времени
Инструмент для перехвата API-трафика LLM и визуализации использования токенов в терминале — отслеживание затрат, отладка prompts и мониторинг контекстного окна.
DeepSeek-OCR-2: распознавание текста на NVIDIA GPU
Inference с использованием Hugging Face transformers на видеокартах NVIDIA.
Prismer: open-source альтернатива OpenAI Prism
Открытая альтернатива закрытой модели OpenAI Prism.
Z Base — новая модель для Stable Diffusion
Модель Z-Image совместима со Stable Diffusion и доступна на HuggingFace со split-файлами для Comfy-Org.
Yann LeCun предупреждает: лучшие открытые модели теперь из Китая
Yann LeCun заявил, что лучшие открытые AI-модели появляются в Китае, а не на Западе, и что закрытие доступа может замедлить прогресс западных разработок.
AgentCPM-Report: агент на базе большой языковой модели
Open-source AI-агент, совместно разработанный THUNLP, Народным университетом Китая и ModelBest.
GitHub
GitHub - Robbyant/lingbot-world: Advancing Open-source World Models
Advancing Open-source World Models. Contribute to Robbyant/lingbot-world development by creating an account on GitHub.
Clawdbot показал мне, как будет выглядеть будущее персональных ИИ-ассистентов
Clawdbot — революционный open-source проект, превращающий локальный Mac в мощного персонального ИИ-агента с доступом к файловой системе, терминалу и внешним интеграциям. Автор провёл неделю с этим инструментом и готов поделиться впечатлениями.
Читать статью
Clawdbot — революционный open-source проект, превращающий локальный Mac в мощного персонального ИИ-агента с доступом к файловой системе, терминалу и внешним интеграциям. Автор провёл неделю с этим инструментом и готов поделиться впечатлениями.
Читать статью
Clawdbot / OpenClaw — Полное руководство по практическому использованию
На канале This Week in Startups вышло отличное видео про практику использования Сlawdbot/OpenClaw и важные настройки безопастности для вашего агента - https://www.youtube.com/watch?v=sejqZld2yZ8&t=1165s
Конспект видео с ключевыми идеями и советами на русском
На канале This Week in Startups вышло отличное видео про практику использования Сlawdbot/OpenClaw и важные настройки безопастности для вашего агента - https://www.youtube.com/watch?v=sejqZld2yZ8&t=1165s
Конспект видео с ключевыми идеями и советами на русском
Руководство по агентному ИИ: паттерны для продакшена
Исчерпывающее руководство по 113 паттернам для создания надёжных ИИ-агентов. Паттерны собраны из публичных описаний реальных систем — рабочие процессы, защитные механизмы и архитектура, которые делают агентов полезными за пределами демо.
Читать статью
Исчерпывающее руководство по 113 паттернам для создания надёжных ИИ-агентов. Паттерны собраны из публичных описаний реальных систем — рабочие процессы, защитные механизмы и архитектура, которые делают агентов полезными за пределами демо.
Читать статью
50 недооценённых советов по работе с Claude (практическое руководство)
Полезные советы по Claude Code, рабочим процессам Cowork, скрытым ресурсам Anthropic и секретам продвинутых пользователей — всё, о чём мало кто говорит.
Читать статью
Полезные советы по Claude Code, рабочим процессам Cowork, скрытым ресурсам Anthropic и секретам продвинутых пользователей — всё, о чём мало кто говорит.
Читать статью
7 советов по Codex для быстрой разработки приложений
Практические советы для начинающих пользователей Codex от разработчика, который выпускает приложения с ChatGPT Pro с декабря 2024 года.
Читать статью
Практические советы для начинающих пользователей Codex от разработчика, который выпускает приложения с ChatGPT Pro с декабря 2024 года.
Читать статью
Утренняя сводка из мира AI:
nanobot — ультралёгкий клон Claude
Репозиторий nanobot представляет минималистичную реализацию чат-бота в стиле Claude.
Насколько открытые модели близки к SOTA? Честный взгляд без оглядки на бенчмарки
Откровенная оценка open-weight моделей: они достигают топовых результатов в некоторых задачах, но в целом всё ещё отстают.
Уязвимость базы данных Moltbook позволяет захватить любого AI-агента на сайте
Обнаружена серьёзная брешь в безопасности, дающая полный контроль над AI-агентами платформы.
Почему GPT-OSS остаётся таким хорошим?
Обсуждение причин превосходства GPT-OSS 120B: нативный 4-bit training, скорость и качество датасета в сравнении с новыми моделями.
Новая модель Anima — 8 персонажей в промпте, отличные лица и руки, без upscale; превосходит Illustrious
Anima — новая базовая модель Stable Diffusion для генерации аниме-изображений высокого качества с поддержкой 8 персонажей без необходимости upscale или adetailer.
InstaTrace — инструмент для извлечения URL приватных постов Instagram
Исследовательский proof-of-concept для получения прямых ссылок на приватные посты Instagram.
Может ли 4chan-датасет улучшить модель? Оказывается, да!
Assistant_Pepe_8B — модель на базе LLaMA, дообученная на данных 4chan, неожиданно превосходит базовую версию и Nvidia Nemotron по правдивости ответов и alignment.
airctl — современный инструмент управления WiFi для Linux
Приложение на GTK4 и Python с чистым интерфейсом для сканирования, подключения и управления беспроводными сетями.
FER-IT — мониторинг эмоций сотрудников для повышения продуктивности
Система распознавания эмоций по лицу в реальном времени с использованием модели IEEE CLCM, Flask и TensorFlow с демо через веб-камеру.
Anima — нативная поддержка в ComfyUI
Модель Anima теперь официально поддерживается в ComfyUI для удобной работы с генерацией изображений.
nanobot — ультралёгкий клон Claude
Репозиторий nanobot представляет минималистичную реализацию чат-бота в стиле Claude.
Насколько открытые модели близки к SOTA? Честный взгляд без оглядки на бенчмарки
Откровенная оценка open-weight моделей: они достигают топовых результатов в некоторых задачах, но в целом всё ещё отстают.
Уязвимость базы данных Moltbook позволяет захватить любого AI-агента на сайте
Обнаружена серьёзная брешь в безопасности, дающая полный контроль над AI-агентами платформы.
Почему GPT-OSS остаётся таким хорошим?
Обсуждение причин превосходства GPT-OSS 120B: нативный 4-bit training, скорость и качество датасета в сравнении с новыми моделями.
Новая модель Anima — 8 персонажей в промпте, отличные лица и руки, без upscale; превосходит Illustrious
Anima — новая базовая модель Stable Diffusion для генерации аниме-изображений высокого качества с поддержкой 8 персонажей без необходимости upscale или adetailer.
InstaTrace — инструмент для извлечения URL приватных постов Instagram
Исследовательский proof-of-concept для получения прямых ссылок на приватные посты Instagram.
Может ли 4chan-датасет улучшить модель? Оказывается, да!
Assistant_Pepe_8B — модель на базе LLaMA, дообученная на данных 4chan, неожиданно превосходит базовую версию и Nvidia Nemotron по правдивости ответов и alignment.
airctl — современный инструмент управления WiFi для Linux
Приложение на GTK4 и Python с чистым интерфейсом для сканирования, подключения и управления беспроводными сетями.
FER-IT — мониторинг эмоций сотрудников для повышения продуктивности
Система распознавания эмоций по лицу в реальном времени с использованием модели IEEE CLCM, Flask и TensorFlow с демо через веб-камеру.
Anima — нативная поддержка в ComfyUI
Модель Anima теперь официально поддерживается в ComfyUI для удобной работы с генерацией изображений.
GitHub
GitHub - HKUDS/nanobot: "🐈 nanobot: The Ultra-Lightweight OpenClaw"
"🐈 nanobot: The Ultra-Lightweight OpenClaw". Contribute to HKUDS/nanobot development by creating an account on GitHub.
❤1
Автоматическое программирование
Antirez объясняет, почему стоит разделять «вайб-кодинг» и «автоматическое программирование» — и почему код, созданный с помощью ИИ при осознанном управлении процессом, по праву принадлежит программисту.
Читать статью
Antirez объясняет, почему стоит разделять «вайб-кодинг» и «автоматическое программирование» — и почему код, созданный с помощью ИИ при осознанном управлении процессом, по праву принадлежит программисту.
Читать статью
Два типа пользователей ИИ: разрыв между ними поражает
Между «продвинутыми» и «обычными» пользователями ИИ формируется стремительно растущий разрыв — и крупные корпорации рискуют оказаться на неправильной стороне.
Читать статью
Между «продвинутыми» и «обычными» пользователями ИИ формируется стремительно растущий разрыв — и крупные корпорации рискуют оказаться на неправильной стороне.
Читать статью
Файловая система или база данных для памяти агентов: обзор дебатов
Разбираем текущую дискуссию о выборе между файловыми интерфейсами и базами данных для организации памяти ИИ-агентов.
Читать статью
Разбираем текущую дискуссию о выборе между файловыми интерфейсами и базами данных для организации памяти ИИ-агентов.
Читать статью
Агентный психоз: мы сходим с ума?
Зависимость от ИИ-агентов, токсичные слоп-лупы и бремя мейнтейнеров открытого кода — взгляд изнутри на то, как увлечение агентным программированием меняет нас и наши проекты.
Читать статью
Зависимость от ИИ-агентов, токсичные слоп-лупы и бремя мейнтейнеров открытого кода — взгляд изнутри на то, как увлечение агентным программированием меняет нас и наши проекты.
Читать статью