AiHub Приручаем ИИ | Вайб-кодинг | Ai-first development
229 subscribers
132 photos
2 videos
4 files
197 links
Объясняем вайб-кодинг с продуктовым акцентом. Новости из мира ИИ, обзоры инструментов и моделей нейросетей.

Web: AiHubNews.ru
Чат: @AiHubFeedChat
Связь: @nyxandro

За плечами 15 лет опыта разработки и продвижения коммерческих сайтов и веб-приложений.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
GPT 5.3 Codex прокачался там, где не ждали

Когда я выбираю модель для работы с фронтендом, преимущественно именно для верстки визуальной составляющей, я обращаю внимание на то, как модель оперирует координатами в пространстве, осями, понимает в какой стороне что находится, знает, сколько это "чуть-чуть левее" или "сделай чтобы светилось". Поэтому, я для проверки этих вещей обычно прошу создать какую-то простую браузерную игру, там и раскрываются все эти умения. Ранее для меня лидером для браузерных игр (следовательно, и для верстки, был Gemini 3 pro), а сейчас попробовал новый 5.3 codex и был приятно удивлен. Несколько игр с одного промта собрал на отличном уровне. Совсем простые игры я не прошу делать, тетрисы, теннисы и прочее, они уже давно собирают на автомате. А вот странные игры с нестандартными правилами, физикой, визуальной составляющей, делают уже с разной степенью успешности. В общем, сделал 3 штуки, все получились на нужном мне уровне, отказываюсь от Gemini и следующие фронты буду собирать на GPT.
1👍2
AGENTS.md против «skills»: простой файл, который дает 100% успеха ИИ-агентам

Vercel проверил, как лучше “докармливать” кодинг-агентов актуальными знаниями о фреймворке, и победила максимально простая идея - один Markdown-файл в корне проекта.

Проблема: актуальность знаний модели быстро устаревает, и при выходе новых API (например, в Next.js) агент начинает генерировать неверный код или тянет старые паттерны.

Vercel сравнил два подхода: “skills” (агент сам должен вызвать пакет знаний/доков) и AGENTS.md (постоянный контекст, доступный агенту на каждом шаге).

Цифры из тестов

- Skills не вызывались в 56% кейсов, хотя документация была доступна.
- Базовый результат без доков - 53% pass rate.
- Skills “по умолчанию” дали те же 53% (то есть 0 улучшения).
- Skills с явной инструкцией “сначала изучи проект, потом вызови skill” поднялись до 79%, но формулировки оказались хрупкими.
- AGENTS.md с сжатым индексом документации дал 100% pass rate; индекс ужали с ~40KB до ~8KB без потери результата.

Почему “пассивный контекст” сработал лучше

- Нет точки принятия решения (“надо ли мне вызвать skill?”) - информация уже доступна.
- Контекст стабильно попадает в системные инструкции на каждом шаге, без асинхронной загрузки и “порядка вызовов”.

Готовый индекс актуальной документации в виде правил агента для проектов на Next.js

Запустить команду: npx @next/codemod@canary agents-md

Команда определяет версию Next.js, скачивает подходящую документацию в .next-docs/, добавляет сжатый индекс в AGENTS.md.

Статья в оригинале есть тут vercel.com
1👍1
Смущает только мизерная скорость Avg 18 tok/s, но попробовать всё равно нужно. 👇
Forwarded from Govard
На Open Router в тесте бесплатно stealth модель SOTA-класса.

Что это может быть: GLM 5, DeepSeek V4 или Sonnet 5.
Наиболее вероятно это GLM 5, т.к. выпуск ее в феврале уже обещан, две остальные - слухи.

https://openrouter.ai/openrouter/pony-alpha
1
Штирлиц еще никогда не был так близко к провалу 😀

К слову о слухах что новая модель Pony Alpha на опен роутере, это китайская версия Claude Opus, она же GLM 5.0

Модель созналась буквально с первого вопроса в лоб.
1😁3
Тест трех моделей нейросетей в верстке: GPT 5.2 codex / GPT 5.3 codex / Kimi K2.5

Решил протестировать какая из моделей лучше соберет главную страницу сайтов разной тематики с одного запроса.

Спойлер: никакая, нужны детальные спецификации, референсы, грамотное описание дизайн системы и четкая структура. Но общие отличия считаю незначительными, при грамотном подходе все сверстают одинаково. В целом тест ничего не показывает кроме их скорости =)

Полноценные скрины тут не получится показать, поэтому прикреплю ссылками и архив с исходником, промтом и скрином.

Прогнал в opencode на своих базовых правилах для вебразработки, без дополнительной какой-либо обвязки, скиллов и тд. Только самопроверка через Playwright. По скорости Kimi самая быстрая, затем GPT 5.3, потом 5.2.

Метеолаборатория:

v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5

Вырубка деревьев:

v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5

Магазин автозапчастей:

v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
1🔥1😁1
В TG bot API появилась возможность создавать кастомные кнопки с индивидуальными цветами и эмодзи
Forwarded from BotNews
This media is not supported in your browser
VIEW IN TELEGRAM
Bot API 9.4

🎨 Custom Emoji and Buttons
• Bots can now use custom emoji in outgoing messages if their owner has Telegram Premium.
• Keyboard and inline buttons now support background colors and custom emoji.

💬 Private Chat Topics
• Bots can now create new topics in 1-on-1 chats.
• Via the BotFather Mini App, bot owners can also prevent users from creating or deleting topics.

🤖 Profile Info
• Bots can now set and remove their own profile pic.
• User profile audios are now visible to bots.

🎁 Gifts
• Unique gifts now include model rarity information.
• Out-of-the-box support for detecting gifts burned after crafting.

✈️ General
• Bots now handle service messages when a chat owner leaves or ownership changes.
• Video objects now include a list of available qualities.

• And more, see the full changelog for details:

https://core.telegram.org/bots/api-changelog#february-9-2026
Please open Telegram to view this post
VIEW IN TELEGRAM
2
GLM 5 вышел!

Пока что показывается только на их сайте, https://chat.z.ai/ но уже можно протестировать в чате.

В opencode ждем в ближайшее время.
1👍1🔥1
super_z_system_prompt.md
18.8 KB
Полный системный промпт агента "Super Z" с сайта chat.z.ai (разработчики линейки моделей GLM) прикрепил файлом

Полезно будет для изучения тем, кто строит своих агентов с широкими возможностями. Обратите внимание, как и в каком формате описываются вызовы инструментов, инструкции и ограничения. Для себя пару полезных моментов подчерпнул. Да и в целом, для написания любых правил агента пригодится.

🎙 AI & Media — 11 навыков (ASR, TTS, VLM, генерация картинок/видео, подкасты)
📄 Документы — docx, xlsx, pptx, pdf
🌐 Web & Research — поиск, чтение страниц, deep research
📊 Data & Analytics — CSV, финансы
🎨 Design & UI — фронтенд
🛠 12 инструментов — Bash, Grep, Read/Write и др.
🤖 6 подагентов — от general-purpose до full-stack-developer
⚡️ Ключевые правила работы
1👍1
12 полезных библиотек для разработки на Python

1. MarkItDown
Репозиторий: https://github.com/microsoft/markitdown
Звёзд: ~86 тыс.+ на GitHub (быстрое распространение в 2025 году)
Возможности: MarkItDown преобразует документы вроде PDF, Word, Excel и PowerPoint в Markdown. Сохраняет структуру — заголовки, таблицы, списки — и ориентирована на рабочие процессы с большими языковыми моделями (LLM).

2. Polars
Репозиторий: https://github.com/pola-rs/polars
Звёзд: ~37 тыс.+ на GitHub
Возможности: Polars — быстрая библиотека DataFrame, написанная на Rust с поддержкой Python. Поддерживает ленивые и немедленные вычисления, многопоточность и экономию памяти. Работает с CSV, Parquet, JSON и значительно превосходит Pandas на больших наборах данных.

3. GPT Pilot (ранее Pythagora)
Репозиторий: https://github.com/Pythagora-io/gpt-pilot
Звёзд: ~33,8 тыс.+ на GitHub
Возможности: Pythagora помогает ИИ разбирать код и создавать документацию. GPT Pilot лежит в основе расширения Pythagora для VS Code, которое становится полноценным ИИ-соратником разработчика: пишет целые функции, отлаживает код, обсуждает проблемы и запрашивает ревью.

4. Smolagents
Репозиторий: https://github.com/huggingface/smolagents
Звёзд: ~25 тыс.+ на GitHub
Возможности: Smolagents — фреймворк для ИИ-агентов от Hugging Face. Позволяет создавать умных агентов, которые пишут код или вызывают инструменты, работает с разными LLM и поддерживает многошаговое рассуждение. Интегрируется с изолированными средами выполнения (Blaxel, Docker, WebAssembly).

5. LangExtract
Репозиторий: https://github.com/google/langextract
Звёзд: ~24 тыс.+ на GitHub
Возможности: LangExtract достаёт структурированные данные из неструктурированного текста с помощью LLM. Распознаёт сущности, применяет схемы и визуализирует результаты. Поддерживает облачные модели (например, Gemini) и локальные через плагины провайдеров, оптимизирована для длинных документов.

6. FastMCP
Репозиторий: https://github.com/jlowin/fastmcp
Звёзд: ~22 тыс.+ на GitHub
Возможности: FastMCP — фреймворк для серверов и клиентов по протоколу Model Context Protocol (MCP). Упрощает связь между клиентами и серверами, управление преобразованиями данных. Такие шаблоны интеграции удобнее чистых реализаций MCP.

7. Data Formulator
Репозиторий: https://github.com/microsoft/data-formulator
Звёзд: ~15 тыс.+ на GitHub
Возможности: Data Formulator — проект Microsoft Research, где ИИ-агенты помогают исследовать данные через яркие визуализации. Превращает намерения и данные в графики с помощью интерактивного процесса.

8. Pydantic-AI
Репозиторий: https://github.com/pydantic/pydantic-ai
Звёзд: ~14 тыс.+ на GitHub
Возможности: Pydantic-AI — фреймворк для агентных приложений генеративного ИИ (GenAI) промышленного уровня. Объединяет типы Pydantic с шаблонами генеративных моделей, чтобы выводы всегда проверялись и оставались последовательными.

9. Pyrefly
Репозиторий: https://github.com/facebook/pyrefly
Звёзд: ~5 тыс.+ на GitHub
Возможности: Pyrefly — инструмент статического анализа и проверки типов для Python. Интегрируется с Pydantic, обеспечивает современную, быструю и точную проверку типов в крупных проектах.

10. Morphik-Core
Репозиторий: https://github.com/morphik-org/morphik-core
Звёзд: ~3,5 тыс.+ на GitHub
Возможности: Morphik — набор ИИ-инструментов для визуально насыщенных и мультимодальных документов. Разработчики могут хранить, искать и анализировать PDF, изображения, видео и другое с помощью Python SDK и веб-консоли.

11. ChainForge
Репозиторий: https://github.com/ianarawjo/ChainForge
Звёзд: ~2,9 тыс.+ на GitHub
Возможности: ChainForge — визуальный набор для инженерии промтов и тестирования гипотез с LLM. Помогает сравнивать подходы и изучать поведение моделей.

12. MostlyAI
Репозиторий: https://github.com/mostly-ai/mostlyai
Звёзд: ~700+ на GitHub
Возможности: MostlyAI создаёт реалистичные синтетические данные для тестов и машинного обучения. Сохраняет статистические свойства реальных данных, не раскрывая их.
1🔥2
Mastra придумала “память” для ИИ-агентов со светофором из эмодзи

Если кратко: у агентов быстро раздувается контекст в длинных диалогах, и они начинают отвечать дороже, медленнее и хуже. Mastra предлагает не таскать весь лог сообщений, а превращать его в короткие “заметки-память” и уже их подмешивать в контекст. Судя по их описанию, главная суть в том, что важные заметки сохраняем, мусор и шум из контекста выкидываем. На выходе получаем более долгую и автономную работу агентов без забываний важных деталей.

Принцип работы

Два фоновых агента следят за разговором и сжимают новые сообщения в заметки.

Каждая заметка помечается приоритетом как “светофор”: 🔴 важно, 🟡 может пригодиться, 🟢 просто фон.

Заметки хранятся обычным текстом в стандартных БД типа PostgreSQL/LibSQL/MongoDB, без векторных БД и без графов знаний.

Что в этом полезного

Это не “суммаризация в последний момент”, а постоянный лог наблюдений, который дополняется по мере разговора.

Есть понятные пороги: по умолчанию после ~30k токенов контекста включается “наблюдатель”, а после ~40k токенов идет дополнительное “уплотнение” заметок.

Заявлена совместимость с кешированием промптов у Anthropic/OpenAI и других.

Заявленные цифры

Для обычных текстовых диалогов заявляют сжатие примерно в 3-6 раз (в LongMemEval около 6 раз).

Для агентных сценариев с кучей вызовов инструментов (браузер, скриншоты, чтение файлов) сжатие может быть 5-40 раз, потому что “шум” хорошо выкидывается.

По LongMemEval заявляют 94,87% с GPT-5 Mini и 84,23% с GPT-4o.

Исследование Mastra
Пост с объяснением
Github
👍31🔥1
Recraft V4 вышла! И это даже важнее, чем выход Sonnet 4.6

Почему Recraft вообще в вайбкод комьюнити важен? А всё потому, что 99% сгенерированных сайтов с помощью Claude или GPT представляют из себя просто набор блоков по стандартной сетке с одинаковыми градиентами и шрифтами.

Хотите оживить ИИ-верстку? Всё просто, меньше заливайте сплошными цветами и градиентами блоки, а больше используйте графику.

С растровой графикой отлично справится Nano Banana Pro, но для современных сайтов растр - не лучший выбор. Все, что можно перевести в вектор, нужно переводить в вектор, а именно в .svg. Но модели напрямую красиво SVG рисовать практически не могут, и тут как раз появляются такие модели, как Recraft V4 Vector и Recraft V4 PRO Vector, которые специально обучены работать с векторами и выдают результаты не хуже работ иллюстраторов.

С растром, кстати, работает тоже на уровне.

Можно попробовать бесплатно:

www.recraft.ai

Тут пост про релиз модели
🔥2
5 эффективных ИИ-инструментов для ревью кода

Делаем свой воркфлоу еще более вайбкодерским. Закрываем еще одно слабое место нейронок: отсутствие грамотного ревью кода на выходе. Если же мы переходим на сторону зла и больше не заглядываем в код и доверяемся нейронке, нужно как можно больше "фильтров" на каждом из этапов генерации: планирование, ревью планирования, тесты перед кодом, затем ревью кода, потом еще раз тесты, потом еще раз ревью. Тогда шанс, что до продакшена доедет что-то живое, возрастает кратно.

🐰 Лично мне из подборки зашел CodeRabbit - можно использовать бесплатно, и использовать не как надзирателя с единственно верными данными, а лишь как источник указания на проблемы, на которые стоило бы обратить внимание оркестратору/агенту, перед тем, как закончить сессию. Потому что CodeRabbit не всегда в курсе контекста всего проекта, некоторые советы может давать ошибочно, что собьет с толку основного агента. Для этого у меня есть простое правило, чтобы агент это воспринимал как совет, на который стоит обратить внимание, но не слепо следовать как по инструкции. И это помогает. Я неоднократно смотрел, что из найденных проблем агент правил (CodeRabbit может запускаться прямо внутри сессии агента обычной командой в терминале, и возвращать агенту промпт с советами по исправлениям) , а что оставлял неизменными. Вот, кстати эти строки из правил агента:
### Code Review

- Use the AI code review tool CodeRabbit to check code quality and identify potential issues.
- To run it, execute `coderabbit --prompt-only --type uncommitted` and wait for the output; it may take a few minutes.
- Do not treat CodeRabbit as 100% correct; it may miss important project-specific details, so validate recommendations against our code and architecture.
- Regardless of whether you used CodeRabbit, review all uncommitted changes yourself, evaluate implementation quality, and fix issues as needed.


О своем любимчике рассказал, а теперь общий список полезных инструментов для ревью 👇


1️⃣ Graphite - платформа, которая перестраивает сам процесс ревью: stacked PR (разбиение большой фичи на маленькие диффы), ИИ-помощник в интерфейсе PR, генерация тест-планов и более удобный UI, чем стандартный GitHub.

🔗 Ссылка: Graphite (документация).

2️⃣ Greptile - индексирует весь репозиторий и строит “граф знаний”, чтобы понимать зависимости, историю и влияние правок на систему целиком (а не только строки в диффе).

🔗 Ссылка: Greptile (установка).

3️⃣ Qodo - делает ревью через призму качества: автоматически пишет юнит-тесты по изменениям (включая крайние случаи), оценивает поведение кода и дает советы по поддерживаемости и читаемости.

🔗 Ссылка: Qodo (установка).

4️⃣ CodeRabbit - бот для GitHub/GitLab/Bitbucket: при открытии PR генерирует обзор изменений, совмещает LLM и линтеры, и позволяет “дочатывать” вопросы прямо в комментариях PR.

🔗 Ссылка: CodeRabbit (документация).

5️⃣ Ellipsis - следующий шаг: не только оставляет замечания, но и может сам вносить правки по комментариям ревьюеров, создавать коммиты с фиксами и прогонять тесты.

🔗 Ссылка: Ellipsis (установка).
👍2
India AI Impact Summit запомнится этой фотографией 😆

Если вдруг кто не знает этих ребят: по центру Сэм Альтман из OpenAI и Дарио Амадей из Anthropic (справа), и я не понял прикола, почему их поставили рядом, особенно после последних их колких сообщений в сторону друг друга в сети.
Anthropic добавили в Claude Code новый режим - Claude Code Security, который просматривает вашу кодовую базу как живой инженер, а не как линтер по списку правил.

- Сканирует репозиторий, ищет уязвимости от банальных до хитрых логических дыр и проблем с контролем доступа, которые классические SAST-инструменты обычно не ловят.

- Для каждой находки показывает описание, риск, уровень уверенности и предлагает аккуратный патч для ручного ревью, без авто‑фикса в прод.

- Всё это собирается в дашборде Claude Code Security внутри веб-версии Claude Code: можно пройтись по списку, посмотреть диффы и решить, какие фиксы применять.

Режим пока запущен как превью для Enterprise и Team‑клиентов, плюс приоритетный доступ для мейнтейнеров open-source репозиториев.
👍1🔥1
Модели по api для распознавания речи в текст с отличной скоростью, качеством и бесплатно.

Коллеги дали наводку на удачный free tier Whisper моделей с достаточно щедрыми рейт-лимитами для себя и небольших проектов. По отзывам летает быстро, хватает на долго, распознает превосходно.

Whisper Large-v3 и Whisper Large-v3 Turbo

Регистрируемся/авторизуемся тут:
https://console.groq.com/

Получаем api ключик в разделе API KEYS и подключаем куда угодно.

Быстрый старт:
BASE URL: https://api.groq.com/openai/v1
MODEL NAME: whisper-large-v3-turbo или whisper-large-v3
API KEY: указываем полученный API ключ.
🔥2