This media is not supported in your browser
VIEW IN TELEGRAM
GPT 5.3 Codex прокачался там, где не ждали
Когда я выбираю модель для работы с фронтендом, преимущественно именно для верстки визуальной составляющей, я обращаю внимание на то, как модель оперирует координатами в пространстве, осями, понимает в какой стороне что находится, знает, сколько это "чуть-чуть левее" или "сделай чтобы светилось". Поэтому, я для проверки этих вещей обычно прошу создать какую-то простую браузерную игру, там и раскрываются все эти умения. Ранее для меня лидером для браузерных игр (следовательно, и для верстки, был Gemini 3 pro), а сейчас попробовал новый 5.3 codex и был приятно удивлен. Несколько игр с одного промта собрал на отличном уровне. Совсем простые игры я не прошу делать, тетрисы, теннисы и прочее, они уже давно собирают на автомате. А вот странные игры с нестандартными правилами, физикой, визуальной составляющей, делают уже с разной степенью успешности. В общем, сделал 3 штуки, все получились на нужном мне уровне, отказываюсь от Gemini и следующие фронты буду собирать на GPT.
Когда я выбираю модель для работы с фронтендом, преимущественно именно для верстки визуальной составляющей, я обращаю внимание на то, как модель оперирует координатами в пространстве, осями, понимает в какой стороне что находится, знает, сколько это "чуть-чуть левее" или "сделай чтобы светилось". Поэтому, я для проверки этих вещей обычно прошу создать какую-то простую браузерную игру, там и раскрываются все эти умения. Ранее для меня лидером для браузерных игр (следовательно, и для верстки, был Gemini 3 pro), а сейчас попробовал новый 5.3 codex и был приятно удивлен. Несколько игр с одного промта собрал на отличном уровне. Совсем простые игры я не прошу делать, тетрисы, теннисы и прочее, они уже давно собирают на автомате. А вот странные игры с нестандартными правилами, физикой, визуальной составляющей, делают уже с разной степенью успешности. В общем, сделал 3 штуки, все получились на нужном мне уровне, отказываюсь от Gemini и следующие фронты буду собирать на GPT.
1👍2
AGENTS.md против «skills»: простой файл, который дает 100% успеха ИИ-агентам
Vercel проверил, как лучше “докармливать” кодинг-агентов актуальными знаниями о фреймворке, и победила максимально простая идея - один Markdown-файл в корне проекта.
Проблема: актуальность знаний модели быстро устаревает, и при выходе новых API (например, в Next.js) агент начинает генерировать неверный код или тянет старые паттерны.
Vercel сравнил два подхода: “skills” (агент сам должен вызвать пакет знаний/доков) и AGENTS.md (постоянный контекст, доступный агенту на каждом шаге).
Цифры из тестов
- Skills не вызывались в 56% кейсов, хотя документация была доступна.
- Базовый результат без доков - 53% pass rate.
- Skills “по умолчанию” дали те же 53% (то есть 0 улучшения).
- Skills с явной инструкцией “сначала изучи проект, потом вызови skill” поднялись до 79%, но формулировки оказались хрупкими.
- AGENTS.md с сжатым индексом документации дал 100% pass rate; индекс ужали с ~40KB до ~8KB без потери результата.
Почему “пассивный контекст” сработал лучше
- Нет точки принятия решения (“надо ли мне вызвать skill?”) - информация уже доступна.
- Контекст стабильно попадает в системные инструкции на каждом шаге, без асинхронной загрузки и “порядка вызовов”.
Готовый индекс актуальной документации в виде правил агента для проектов на Next.js
Запустить команду:
Команда определяет версию Next.js, скачивает подходящую документацию в .next-docs/, добавляет сжатый индекс в AGENTS.md.
Статья в оригинале есть тут vercel.com
Vercel проверил, как лучше “докармливать” кодинг-агентов актуальными знаниями о фреймворке, и победила максимально простая идея - один Markdown-файл в корне проекта.
Проблема: актуальность знаний модели быстро устаревает, и при выходе новых API (например, в Next.js) агент начинает генерировать неверный код или тянет старые паттерны.
Vercel сравнил два подхода: “skills” (агент сам должен вызвать пакет знаний/доков) и AGENTS.md (постоянный контекст, доступный агенту на каждом шаге).
Цифры из тестов
- Skills не вызывались в 56% кейсов, хотя документация была доступна.
- Базовый результат без доков - 53% pass rate.
- Skills “по умолчанию” дали те же 53% (то есть 0 улучшения).
- Skills с явной инструкцией “сначала изучи проект, потом вызови skill” поднялись до 79%, но формулировки оказались хрупкими.
- AGENTS.md с сжатым индексом документации дал 100% pass rate; индекс ужали с ~40KB до ~8KB без потери результата.
Почему “пассивный контекст” сработал лучше
- Нет точки принятия решения (“надо ли мне вызвать skill?”) - информация уже доступна.
- Контекст стабильно попадает в системные инструкции на каждом шаге, без асинхронной загрузки и “порядка вызовов”.
Готовый индекс актуальной документации в виде правил агента для проектов на Next.js
Запустить команду:
npx @next/codemod@canary agents-mdКоманда определяет версию Next.js, скачивает подходящую документацию в .next-docs/, добавляет сжатый индекс в AGENTS.md.
Статья в оригинале есть тут vercel.com
Vercel
AGENTS.md outperforms skills in our agent evals - Vercel
A compressed 8KB docs index in AGENTS.md achieved 100% on Next.js 16 API evals. Skills maxed at 79%. Here's what we learned and how to set it up.
1👍1
Смущает только мизерная скорость Avg 18 tok/s, но попробовать всё равно нужно. 👇
Forwarded from Govard
На Open Router в тесте бесплатно stealth модель SOTA-класса.
Что это может быть: GLM 5, DeepSeek V4 или Sonnet 5.
Наиболее вероятно это GLM 5, т.к. выпуск ее в феврале уже обещан, две остальные - слухи.
https://openrouter.ai/openrouter/pony-alpha
Что это может быть: GLM 5, DeepSeek V4 или Sonnet 5.
Наиболее вероятно это GLM 5, т.к. выпуск ее в феврале уже обещан, две остальные - слухи.
https://openrouter.ai/openrouter/pony-alpha
1
Тест трех моделей нейросетей в верстке: GPT 5.2 codex / GPT 5.3 codex / Kimi K2.5
Решил протестировать какая из моделей лучше соберет главную страницу сайтов разной тематики с одного запроса.
Спойлер:никакая, нужны детальные спецификации, референсы, грамотное описание дизайн системы и четкая структура. Но общие отличия считаю незначительными, при грамотном подходе все сверстают одинаково. В целом тест ничего не показывает кроме их скорости =)
Полноценные скрины тут не получится показать, поэтому прикреплю ссылками и архив с исходником, промтом и скрином.
Прогнал в opencode на своих базовых правилах для вебразработки, без дополнительной какой-либо обвязки, скиллов и тд. Только самопроверка через Playwright. По скорости Kimi самая быстрая, затем GPT 5.3, потом 5.2.
Метеолаборатория:
v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
Вырубка деревьев:
v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
Магазин автозапчастей:
v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
Решил протестировать какая из моделей лучше соберет главную страницу сайтов разной тематики с одного запроса.
Спойлер:
Полноценные скрины тут не получится показать, поэтому прикреплю ссылками и архив с исходником, промтом и скрином.
Прогнал в opencode на своих базовых правилах для вебразработки, без дополнительной какой-либо обвязки, скиллов и тд. Только самопроверка через Playwright. По скорости Kimi самая быстрая, затем GPT 5.3, потом 5.2.
Метеолаборатория:
v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
Вырубка деревьев:
v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
Магазин автозапчастей:
v1 GPT 5.2 codex xhigh
v2 GPT 5.3 codex xhigh
v3 Kimi K2.5
1🔥1😁1
В TG bot API появилась возможность создавать кастомные кнопки с индивидуальными цветами и эмодзи
Forwarded from BotNews
This media is not supported in your browser
VIEW IN TELEGRAM
Bot API 9.4
🎨 Custom Emoji and Buttons
• Bots can now use custom emoji in outgoing messages if their owner has Telegram Premium.
• Keyboard and inline buttons now support background colors and custom emoji.
💬 Private Chat Topics
• Bots can now create new topics in 1-on-1 chats.
• Via the BotFather Mini App, bot owners can also prevent users from creating or deleting topics.
🤖 Profile Info
• Bots can now set and remove their own profile pic.
• User profile audios are now visible to bots.
🎁 Gifts
• Unique gifts now include model rarity information.
• Out-of-the-box support for detecting gifts burned after crafting.
✈️ General
• Bots now handle service messages when a chat owner leaves or ownership changes.
• Video objects now include a list of available qualities.
• And more, see the full changelog for details:
https://core.telegram.org/bots/api-changelog#february-9-2026
• Bots can now use custom emoji in outgoing messages if their owner has Telegram Premium.
• Keyboard and inline buttons now support background colors and custom emoji.
• Bots can now create new topics in 1-on-1 chats.
• Via the BotFather Mini App, bot owners can also prevent users from creating or deleting topics.
• Bots can now set and remove their own profile pic.
• User profile audios are now visible to bots.
• Unique gifts now include model rarity information.
• Out-of-the-box support for detecting gifts burned after crafting.
• Bots now handle service messages when a chat owner leaves or ownership changes.
• Video objects now include a list of available qualities.
• And more, see the full changelog for details:
https://core.telegram.org/bots/api-changelog#february-9-2026
Please open Telegram to view this post
VIEW IN TELEGRAM
2
GLM 5 вышел!
Пока что показывается только на их сайте, https://chat.z.ai/ но уже можно протестировать в чате.
В opencode ждем в ближайшее время.
Пока что показывается только на их сайте, https://chat.z.ai/ но уже можно протестировать в чате.
В opencode ждем в ближайшее время.
1👍1🔥1
super_z_system_prompt.md
18.8 KB
Полный системный промпт агента "Super Z" с сайта chat.z.ai (разработчики линейки моделей GLM) прикрепил файлом
Полезно будет для изучения тем, кто строит своих агентов с широкими возможностями. Обратите внимание, как и в каком формате описываются вызовы инструментов, инструкции и ограничения. Для себя пару полезных моментов подчерпнул. Да и в целом, для написания любых правил агента пригодится.
🎙 AI & Media — 11 навыков (ASR, TTS, VLM, генерация картинок/видео, подкасты)
📄 Документы — docx, xlsx, pptx, pdf
🌐 Web & Research — поиск, чтение страниц, deep research
📊 Data & Analytics — CSV, финансы
🎨 Design & UI — фронтенд
🛠 12 инструментов — Bash, Grep, Read/Write и др.
🤖 6 подагентов — от general-purpose до full-stack-developer
⚡️ Ключевые правила работы
Полезно будет для изучения тем, кто строит своих агентов с широкими возможностями. Обратите внимание, как и в каком формате описываются вызовы инструментов, инструкции и ограничения. Для себя пару полезных моментов подчерпнул. Да и в целом, для написания любых правил агента пригодится.
🎙 AI & Media — 11 навыков (ASR, TTS, VLM, генерация картинок/видео, подкасты)
📄 Документы — docx, xlsx, pptx, pdf
🌐 Web & Research — поиск, чтение страниц, deep research
📊 Data & Analytics — CSV, финансы
🎨 Design & UI — фронтенд
🛠 12 инструментов — Bash, Grep, Read/Write и др.
🤖 6 подагентов — от general-purpose до full-stack-developer
⚡️ Ключевые правила работы
1👍1
12 полезных библиотек для разработки на Python
1. MarkItDown
Репозиторий: https://github.com/microsoft/markitdown
Звёзд: ~86 тыс.+ на GitHub (быстрое распространение в 2025 году)
Возможности: MarkItDown преобразует документы вроде PDF, Word, Excel и PowerPoint в Markdown. Сохраняет структуру — заголовки, таблицы, списки — и ориентирована на рабочие процессы с большими языковыми моделями (LLM).
2. Polars
Репозиторий: https://github.com/pola-rs/polars
Звёзд: ~37 тыс.+ на GitHub
Возможности: Polars — быстрая библиотека DataFrame, написанная на Rust с поддержкой Python. Поддерживает ленивые и немедленные вычисления, многопоточность и экономию памяти. Работает с CSV, Parquet, JSON и значительно превосходит Pandas на больших наборах данных.
3. GPT Pilot (ранее Pythagora)
Репозиторий: https://github.com/Pythagora-io/gpt-pilot
Звёзд: ~33,8 тыс.+ на GitHub
Возможности: Pythagora помогает ИИ разбирать код и создавать документацию. GPT Pilot лежит в основе расширения Pythagora для VS Code, которое становится полноценным ИИ-соратником разработчика: пишет целые функции, отлаживает код, обсуждает проблемы и запрашивает ревью.
4. Smolagents
Репозиторий: https://github.com/huggingface/smolagents
Звёзд: ~25 тыс.+ на GitHub
Возможности: Smolagents — фреймворк для ИИ-агентов от Hugging Face. Позволяет создавать умных агентов, которые пишут код или вызывают инструменты, работает с разными LLM и поддерживает многошаговое рассуждение. Интегрируется с изолированными средами выполнения (Blaxel, Docker, WebAssembly).
5. LangExtract
Репозиторий: https://github.com/google/langextract
Звёзд: ~24 тыс.+ на GitHub
Возможности: LangExtract достаёт структурированные данные из неструктурированного текста с помощью LLM. Распознаёт сущности, применяет схемы и визуализирует результаты. Поддерживает облачные модели (например, Gemini) и локальные через плагины провайдеров, оптимизирована для длинных документов.
6. FastMCP
Репозиторий: https://github.com/jlowin/fastmcp
Звёзд: ~22 тыс.+ на GitHub
Возможности: FastMCP — фреймворк для серверов и клиентов по протоколу Model Context Protocol (MCP). Упрощает связь между клиентами и серверами, управление преобразованиями данных. Такие шаблоны интеграции удобнее чистых реализаций MCP.
7. Data Formulator
Репозиторий: https://github.com/microsoft/data-formulator
Звёзд: ~15 тыс.+ на GitHub
Возможности: Data Formulator — проект Microsoft Research, где ИИ-агенты помогают исследовать данные через яркие визуализации. Превращает намерения и данные в графики с помощью интерактивного процесса.
8. Pydantic-AI
Репозиторий: https://github.com/pydantic/pydantic-ai
Звёзд: ~14 тыс.+ на GitHub
Возможности: Pydantic-AI — фреймворк для агентных приложений генеративного ИИ (GenAI) промышленного уровня. Объединяет типы Pydantic с шаблонами генеративных моделей, чтобы выводы всегда проверялись и оставались последовательными.
9. Pyrefly
Репозиторий: https://github.com/facebook/pyrefly
Звёзд: ~5 тыс.+ на GitHub
Возможности: Pyrefly — инструмент статического анализа и проверки типов для Python. Интегрируется с Pydantic, обеспечивает современную, быструю и точную проверку типов в крупных проектах.
10. Morphik-Core
Репозиторий: https://github.com/morphik-org/morphik-core
Звёзд: ~3,5 тыс.+ на GitHub
Возможности: Morphik — набор ИИ-инструментов для визуально насыщенных и мультимодальных документов. Разработчики могут хранить, искать и анализировать PDF, изображения, видео и другое с помощью Python SDK и веб-консоли.
11. ChainForge
Репозиторий: https://github.com/ianarawjo/ChainForge
Звёзд: ~2,9 тыс.+ на GitHub
Возможности: ChainForge — визуальный набор для инженерии промтов и тестирования гипотез с LLM. Помогает сравнивать подходы и изучать поведение моделей.
12. MostlyAI
Репозиторий: https://github.com/mostly-ai/mostlyai
Звёзд: ~700+ на GitHub
Возможности: MostlyAI создаёт реалистичные синтетические данные для тестов и машинного обучения. Сохраняет статистические свойства реальных данных, не раскрывая их.
1. MarkItDown
Репозиторий: https://github.com/microsoft/markitdown
Звёзд: ~86 тыс.+ на GitHub (быстрое распространение в 2025 году)
Возможности: MarkItDown преобразует документы вроде PDF, Word, Excel и PowerPoint в Markdown. Сохраняет структуру — заголовки, таблицы, списки — и ориентирована на рабочие процессы с большими языковыми моделями (LLM).
2. Polars
Репозиторий: https://github.com/pola-rs/polars
Звёзд: ~37 тыс.+ на GitHub
Возможности: Polars — быстрая библиотека DataFrame, написанная на Rust с поддержкой Python. Поддерживает ленивые и немедленные вычисления, многопоточность и экономию памяти. Работает с CSV, Parquet, JSON и значительно превосходит Pandas на больших наборах данных.
3. GPT Pilot (ранее Pythagora)
Репозиторий: https://github.com/Pythagora-io/gpt-pilot
Звёзд: ~33,8 тыс.+ на GitHub
Возможности: Pythagora помогает ИИ разбирать код и создавать документацию. GPT Pilot лежит в основе расширения Pythagora для VS Code, которое становится полноценным ИИ-соратником разработчика: пишет целые функции, отлаживает код, обсуждает проблемы и запрашивает ревью.
4. Smolagents
Репозиторий: https://github.com/huggingface/smolagents
Звёзд: ~25 тыс.+ на GitHub
Возможности: Smolagents — фреймворк для ИИ-агентов от Hugging Face. Позволяет создавать умных агентов, которые пишут код или вызывают инструменты, работает с разными LLM и поддерживает многошаговое рассуждение. Интегрируется с изолированными средами выполнения (Blaxel, Docker, WebAssembly).
5. LangExtract
Репозиторий: https://github.com/google/langextract
Звёзд: ~24 тыс.+ на GitHub
Возможности: LangExtract достаёт структурированные данные из неструктурированного текста с помощью LLM. Распознаёт сущности, применяет схемы и визуализирует результаты. Поддерживает облачные модели (например, Gemini) и локальные через плагины провайдеров, оптимизирована для длинных документов.
6. FastMCP
Репозиторий: https://github.com/jlowin/fastmcp
Звёзд: ~22 тыс.+ на GitHub
Возможности: FastMCP — фреймворк для серверов и клиентов по протоколу Model Context Protocol (MCP). Упрощает связь между клиентами и серверами, управление преобразованиями данных. Такие шаблоны интеграции удобнее чистых реализаций MCP.
7. Data Formulator
Репозиторий: https://github.com/microsoft/data-formulator
Звёзд: ~15 тыс.+ на GitHub
Возможности: Data Formulator — проект Microsoft Research, где ИИ-агенты помогают исследовать данные через яркие визуализации. Превращает намерения и данные в графики с помощью интерактивного процесса.
8. Pydantic-AI
Репозиторий: https://github.com/pydantic/pydantic-ai
Звёзд: ~14 тыс.+ на GitHub
Возможности: Pydantic-AI — фреймворк для агентных приложений генеративного ИИ (GenAI) промышленного уровня. Объединяет типы Pydantic с шаблонами генеративных моделей, чтобы выводы всегда проверялись и оставались последовательными.
9. Pyrefly
Репозиторий: https://github.com/facebook/pyrefly
Звёзд: ~5 тыс.+ на GitHub
Возможности: Pyrefly — инструмент статического анализа и проверки типов для Python. Интегрируется с Pydantic, обеспечивает современную, быструю и точную проверку типов в крупных проектах.
10. Morphik-Core
Репозиторий: https://github.com/morphik-org/morphik-core
Звёзд: ~3,5 тыс.+ на GitHub
Возможности: Morphik — набор ИИ-инструментов для визуально насыщенных и мультимодальных документов. Разработчики могут хранить, искать и анализировать PDF, изображения, видео и другое с помощью Python SDK и веб-консоли.
11. ChainForge
Репозиторий: https://github.com/ianarawjo/ChainForge
Звёзд: ~2,9 тыс.+ на GitHub
Возможности: ChainForge — визуальный набор для инженерии промтов и тестирования гипотез с LLM. Помогает сравнивать подходы и изучать поведение моделей.
12. MostlyAI
Репозиторий: https://github.com/mostly-ai/mostlyai
Звёзд: ~700+ на GitHub
Возможности: MostlyAI создаёт реалистичные синтетические данные для тестов и машинного обучения. Сохраняет статистические свойства реальных данных, не раскрывая их.
1🔥2
GitHub
GitHub - mastra-ai/mastra: From the team behind Gatsby, Mastra is a framework for building AI-powered applications and agents with…
From the team behind Gatsby, Mastra is a framework for building AI-powered applications and agents with a modern TypeScript stack. - mastra-ai/mastra
Mastra придумала “память” для ИИ-агентов со светофором из эмодзи
Если кратко: у агентов быстро раздувается контекст в длинных диалогах, и они начинают отвечать дороже, медленнее и хуже. Mastra предлагает не таскать весь лог сообщений, а превращать его в короткие “заметки-память” и уже их подмешивать в контекст. Судя по их описанию, главная суть в том, что важные заметки сохраняем, мусор и шум из контекста выкидываем. На выходе получаем более долгую и автономную работу агентов без забываний важных деталей.
Принцип работы
Два фоновых агента следят за разговором и сжимают новые сообщения в заметки.
Каждая заметка помечается приоритетом как “светофор”: 🔴 важно, 🟡 может пригодиться, 🟢 просто фон.
Заметки хранятся обычным текстом в стандартных БД типа PostgreSQL/LibSQL/MongoDB, без векторных БД и без графов знаний.
Что в этом полезного
Это не “суммаризация в последний момент”, а постоянный лог наблюдений, который дополняется по мере разговора.
Есть понятные пороги: по умолчанию после ~30k токенов контекста включается “наблюдатель”, а после ~40k токенов идет дополнительное “уплотнение” заметок.
Заявлена совместимость с кешированием промптов у Anthropic/OpenAI и других.
Заявленные цифры
Для обычных текстовых диалогов заявляют сжатие примерно в 3-6 раз (в LongMemEval около 6 раз).
Для агентных сценариев с кучей вызовов инструментов (браузер, скриншоты, чтение файлов) сжатие может быть 5-40 раз, потому что “шум” хорошо выкидывается.
По LongMemEval заявляют 94,87% с GPT-5 Mini и 84,23% с GPT-4o.
Исследование Mastra
Пост с объяснением
Github
Если кратко: у агентов быстро раздувается контекст в длинных диалогах, и они начинают отвечать дороже, медленнее и хуже. Mastra предлагает не таскать весь лог сообщений, а превращать его в короткие “заметки-память” и уже их подмешивать в контекст. Судя по их описанию, главная суть в том, что важные заметки сохраняем, мусор и шум из контекста выкидываем. На выходе получаем более долгую и автономную работу агентов без забываний важных деталей.
Принцип работы
Два фоновых агента следят за разговором и сжимают новые сообщения в заметки.
Каждая заметка помечается приоритетом как “светофор”: 🔴 важно, 🟡 может пригодиться, 🟢 просто фон.
Заметки хранятся обычным текстом в стандартных БД типа PostgreSQL/LibSQL/MongoDB, без векторных БД и без графов знаний.
Что в этом полезного
Это не “суммаризация в последний момент”, а постоянный лог наблюдений, который дополняется по мере разговора.
Есть понятные пороги: по умолчанию после ~30k токенов контекста включается “наблюдатель”, а после ~40k токенов идет дополнительное “уплотнение” заметок.
Заявлена совместимость с кешированием промптов у Anthropic/OpenAI и других.
Заявленные цифры
Для обычных текстовых диалогов заявляют сжатие примерно в 3-6 раз (в LongMemEval около 6 раз).
Для агентных сценариев с кучей вызовов инструментов (браузер, скриншоты, чтение файлов) сжатие может быть 5-40 раз, потому что “шум” хорошо выкидывается.
По LongMemEval заявляют 94,87% с GPT-5 Mini и 84,23% с GPT-4o.
Исследование Mastra
Пост с объяснением
Github
👍3❤1🔥1
Recraft V4 вышла! И это даже важнее, чем выход Sonnet 4.6
Почему Recraft вообще в вайбкод комьюнити важен? А всё потому, что 99% сгенерированных сайтов с помощью Claude или GPT представляют из себя просто набор блоков по стандартной сетке с одинаковыми градиентами и шрифтами.
Хотите оживить ИИ-верстку? Всё просто, меньше заливайте сплошными цветами и градиентами блоки, а больше используйте графику.
С растровой графикой отлично справится Nano Banana Pro, но для современных сайтов растр - не лучший выбор. Все, что можно перевести в вектор, нужно переводить в вектор, а именно в .svg. Но модели напрямую красиво SVG рисовать практически не могут, и тут как раз появляются такие модели, как Recraft V4 Vector и Recraft V4 PRO Vector, которые специально обучены работать с векторами и выдают результаты не хуже работ иллюстраторов.
С растром, кстати, работает тоже на уровне.
Можно попробовать бесплатно:
www.recraft.ai
Тут пост про релиз модели
Почему Recraft вообще в вайбкод комьюнити важен? А всё потому, что 99% сгенерированных сайтов с помощью Claude или GPT представляют из себя просто набор блоков по стандартной сетке с одинаковыми градиентами и шрифтами.
Хотите оживить ИИ-верстку? Всё просто, меньше заливайте сплошными цветами и градиентами блоки, а больше используйте графику.
С растровой графикой отлично справится Nano Banana Pro, но для современных сайтов растр - не лучший выбор. Все, что можно перевести в вектор, нужно переводить в вектор, а именно в .svg. Но модели напрямую красиво SVG рисовать практически не могут, и тут как раз появляются такие модели, как Recraft V4 Vector и Recraft V4 PRO Vector, которые специально обучены работать с векторами и выдают результаты не хуже работ иллюстраторов.
С растром, кстати, работает тоже на уровне.
Можно попробовать бесплатно:
www.recraft.ai
Тут пост про релиз модели
🔥2
5 эффективных ИИ-инструментов для ревью кода
Делаем свой воркфлоу еще более вайбкодерским. Закрываем еще одно слабое место нейронок: отсутствие грамотного ревью кода на выходе. Если же мы переходим на сторону зла и больше не заглядываем в код и доверяемся нейронке, нужно как можно больше "фильтров" на каждом из этапов генерации: планирование, ревью планирования, тесты перед кодом, затем ревью кода, потом еще раз тесты, потом еще раз ревью. Тогда шанс, что до продакшена доедет что-то живое, возрастает кратно.
🐰 Лично мне из подборки зашел CodeRabbit - можно использовать бесплатно, и использовать не как надзирателя с единственно верными данными, а лишь как источник указания на проблемы, на которые стоило бы обратить внимание оркестратору/агенту, перед тем, как закончить сессию. Потому что CodeRabbit не всегда в курсе контекста всего проекта, некоторые советы может давать ошибочно, что собьет с толку основного агента. Для этого у меня есть простое правило, чтобы агент это воспринимал как совет, на который стоит обратить внимание, но не слепо следовать как по инструкции. И это помогает. Я неоднократно смотрел, что из найденных проблем агент правил (CodeRabbit может запускаться прямо внутри сессии агента обычной командой в терминале, и возвращать агенту промпт с советами по исправлениям) , а что оставлял неизменными. Вот, кстати эти строки из правил агента:
О своем любимчике рассказал, а теперь общий список полезных инструментов для ревью 👇
1️⃣ Graphite - платформа, которая перестраивает сам процесс ревью: stacked PR (разбиение большой фичи на маленькие диффы), ИИ-помощник в интерфейсе PR, генерация тест-планов и более удобный UI, чем стандартный GitHub.
🔗 Ссылка: Graphite (документация).
2️⃣ Greptile - индексирует весь репозиторий и строит “граф знаний”, чтобы понимать зависимости, историю и влияние правок на систему целиком (а не только строки в диффе).
🔗 Ссылка: Greptile (установка).
3️⃣ Qodo - делает ревью через призму качества: автоматически пишет юнит-тесты по изменениям (включая крайние случаи), оценивает поведение кода и дает советы по поддерживаемости и читаемости.
🔗 Ссылка: Qodo (установка).
4️⃣ CodeRabbit - бот для GitHub/GitLab/Bitbucket: при открытии PR генерирует обзор изменений, совмещает LLM и линтеры, и позволяет “дочатывать” вопросы прямо в комментариях PR.
🔗 Ссылка: CodeRabbit (документация).
5️⃣ Ellipsis - следующий шаг: не только оставляет замечания, но и может сам вносить правки по комментариям ревьюеров, создавать коммиты с фиксами и прогонять тесты.
🔗 Ссылка: Ellipsis (установка).
Делаем свой воркфлоу еще более вайбкодерским. Закрываем еще одно слабое место нейронок: отсутствие грамотного ревью кода на выходе. Если же мы переходим на сторону зла и больше не заглядываем в код и доверяемся нейронке, нужно как можно больше "фильтров" на каждом из этапов генерации: планирование, ревью планирования, тесты перед кодом, затем ревью кода, потом еще раз тесты, потом еще раз ревью. Тогда шанс, что до продакшена доедет что-то живое, возрастает кратно.
🐰 Лично мне из подборки зашел CodeRabbit - можно использовать бесплатно, и использовать не как надзирателя с единственно верными данными, а лишь как источник указания на проблемы, на которые стоило бы обратить внимание оркестратору/агенту, перед тем, как закончить сессию. Потому что CodeRabbit не всегда в курсе контекста всего проекта, некоторые советы может давать ошибочно, что собьет с толку основного агента. Для этого у меня есть простое правило, чтобы агент это воспринимал как совет, на который стоит обратить внимание, но не слепо следовать как по инструкции. И это помогает. Я неоднократно смотрел, что из найденных проблем агент правил (CodeRabbit может запускаться прямо внутри сессии агента обычной командой в терминале, и возвращать агенту промпт с советами по исправлениям) , а что оставлял неизменными. Вот, кстати эти строки из правил агента:
### Code Review
- Use the AI code review tool CodeRabbit to check code quality and identify potential issues.
- To run it, execute `coderabbit --prompt-only --type uncommitted` and wait for the output; it may take a few minutes.
- Do not treat CodeRabbit as 100% correct; it may miss important project-specific details, so validate recommendations against our code and architecture.
- Regardless of whether you used CodeRabbit, review all uncommitted changes yourself, evaluate implementation quality, and fix issues as needed.
О своем любимчике рассказал, а теперь общий список полезных инструментов для ревью 👇
1️⃣ Graphite - платформа, которая перестраивает сам процесс ревью: stacked PR (разбиение большой фичи на маленькие диффы), ИИ-помощник в интерфейсе PR, генерация тест-планов и более удобный UI, чем стандартный GitHub.
🔗 Ссылка: Graphite (документация).
2️⃣ Greptile - индексирует весь репозиторий и строит “граф знаний”, чтобы понимать зависимости, историю и влияние правок на систему целиком (а не только строки в диффе).
🔗 Ссылка: Greptile (установка).
3️⃣ Qodo - делает ревью через призму качества: автоматически пишет юнит-тесты по изменениям (включая крайние случаи), оценивает поведение кода и дает советы по поддерживаемости и читаемости.
🔗 Ссылка: Qodo (установка).
4️⃣ CodeRabbit - бот для GitHub/GitLab/Bitbucket: при открытии PR генерирует обзор изменений, совмещает LLM и линтеры, и позволяет “дочатывать” вопросы прямо в комментариях PR.
🔗 Ссылка: CodeRabbit (документация).
5️⃣ Ellipsis - следующий шаг: не только оставляет замечания, но и может сам вносить правки по комментариям ревьюеров, создавать коммиты с фиксами и прогонять тесты.
🔗 Ссылка: Ellipsis (установка).
👍2
Anthropic добавили в Claude Code новый режим - Claude Code Security, который просматривает вашу кодовую базу как живой инженер, а не как линтер по списку правил.
- Сканирует репозиторий, ищет уязвимости от банальных до хитрых логических дыр и проблем с контролем доступа, которые классические SAST-инструменты обычно не ловят.
- Для каждой находки показывает описание, риск, уровень уверенности и предлагает аккуратный патч для ручного ревью, без авто‑фикса в прод.
- Всё это собирается в дашборде Claude Code Security внутри веб-версии Claude Code: можно пройтись по списку, посмотреть диффы и решить, какие фиксы применять.
Режим пока запущен как превью для Enterprise и Team‑клиентов, плюс приоритетный доступ для мейнтейнеров open-source репозиториев.
- Сканирует репозиторий, ищет уязвимости от банальных до хитрых логических дыр и проблем с контролем доступа, которые классические SAST-инструменты обычно не ловят.
- Для каждой находки показывает описание, риск, уровень уверенности и предлагает аккуратный патч для ручного ревью, без авто‑фикса в прод.
- Всё это собирается в дашборде Claude Code Security внутри веб-версии Claude Code: можно пройтись по списку, посмотреть диффы и решить, какие фиксы применять.
Режим пока запущен как превью для Enterprise и Team‑клиентов, плюс приоритетный доступ для мейнтейнеров open-source репозиториев.
👍1🔥1
Модели по api для распознавания речи в текст с отличной скоростью, качеством и бесплатно.
Коллеги дали наводку на удачный free tier Whisper моделей с достаточно щедрыми рейт-лимитами для себя и небольших проектов. По отзывам летает быстро, хватает на долго, распознает превосходно.
Whisper Large-v3 и Whisper Large-v3 Turbo
Регистрируемся/авторизуемся тут:
https://console.groq.com/
Получаем api ключик в разделе API KEYS и подключаем куда угодно.
Быстрый старт:
BASE URL:
MODEL NAME:
API KEY: указываем полученный API ключ.
Коллеги дали наводку на удачный free tier Whisper моделей с достаточно щедрыми рейт-лимитами для себя и небольших проектов. По отзывам летает быстро, хватает на долго, распознает превосходно.
Whisper Large-v3 и Whisper Large-v3 Turbo
Регистрируемся/авторизуемся тут:
https://console.groq.com/
Получаем api ключик в разделе API KEYS и подключаем куда угодно.
Быстрый старт:
BASE URL:
https://api.groq.com/openai/v1MODEL NAME:
whisper-large-v3-turbo или whisper-large-v3API KEY: указываем полученный API ключ.
🔥2