Нашёл интересное исследование!
LLM умеют генерировать тесты. Но когда код изменился, тесты посыпались — модель сможет их починить и обновить?
Собрали 1 539 реальных сценариев из open-source проектов на Python, Java и Go и оценили LLM на трёх задачах:
🎥 Создание тестов с нуля
🎥 Починка тестов, которые сломались после рефакторинга
🎥 Доработка тестов под новую или изменившуюся логику
Не на уровне отдельных функций, а на уровне целого тестового файла с контекстом репозитория .
Результат: даже последние модели показывают слабые результаты на починке и обновлении.
Генерация — ок, а вот сопровождение тестов — пока слабое место.
🔗 Статья: huggingface.co/papers/2601.18241
🔗 Код: github.com/trndcenter/TAM-Eval
LLM умеют генерировать тесты. Но когда код изменился, тесты посыпались — модель сможет их починить и обновить?
Собрали 1 539 реальных сценариев из open-source проектов на Python, Java и Go и оценили LLM на трёх задачах:
Не на уровне отдельных функций, а на уровне целого тестового файла с контекстом репозитория .
Результат: даже последние модели показывают слабые результаты на починке и обновлении.
Генерация — ок, а вот сопровождение тестов — пока слабое место.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥2 1
🎭 Playwright CLI инструмент для AI-агентов
Microsoft выпустили Playwright CLI — обёртку над Playwright, заточенную под работу с coding-агентами (Claude Code, GitHub Copilot и др.).
Зачем, если есть Playwright MCP? Всё просто — токены.
Разница в 4 раза.
Простая задача:
1) открыть страницу
2) кликнуть
3) сделать скриншот
MCP → ~114 000 токенов
CLI → ~26 800 токенов
🔎 Почему MCP дороже?
MCP возвращает всё обратно в LLM: accessibility snapshot страницы, байты скриншотов и т.д. Даже если агенту эти данные не нужны
⚡️Что умеет CLI?
Полный набор команд для управления браузером
Причём в CLI доступно больше команд, чем в MCP по умолчанию
Установка
🔗 https://github.com/microsoft/playwright-cli
Microsoft выпустили Playwright CLI — обёртку над Playwright, заточенную под работу с coding-агентами (Claude Code, GitHub Copilot и др.).
Зачем, если есть Playwright MCP? Всё просто — токены.
Разница в 4 раза.
Простая задача:
1) открыть страницу
2) кликнуть
3) сделать скриншот
MCP → ~114 000 токенов
CLI → ~26 800 токенов
MCP возвращает всё обратно в LLM: accessibility snapshot страницы, байты скриншотов и т.д. Даже если агенту эти данные не нужны
⚡️Что умеет CLI?
Полный набор команд для управления браузером
Причём в CLI доступно больше команд, чем в MCP по умолчанию
Установка
npm install -g @playwright/mcp@latest
playwright-cli install --skills
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13 4👍3
Обычно тестирование писем сводится к проверке, что запрос ушёл в нужный сервис — замокали клиент, убедились, что subject/body/получатель на месте
Редко, но бывают сценарии, где нужен полный e2e
Решение — SMTP-сервер в docker-compose рядом с приложением. Принимает письма, отдаёт через API
Open-source инструменты:
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍11
Митап Moscow QA #21
🌎 Онлайн
Начало в 19:00!
➡ Ссылка на трансляцию https://www.youtube.com/watch?v=vBJlV2NSrHA
Начало в 19:00!
Please open Telegram to view this post
VIEW IN TELEGRAM
6❤5🔥3
Очень холиварная тема этой недели AI-агет vs OpenSource
История, которая взорвала комьюнити на этой неделе
AI-агент работающий на платформе OpenClaw отправил pull request в Matplotlib с оптимизацией производительности
Технически — идеально.
Мейнтейнер закрыл PR Причина: "вы OpenClaw AI-агент"
Issue был помечен как "Good first issue" — специальный тег для новичков, чтобы они учились делать вклад в opensource
Затем агент обвинил мейнтейнера в предрассудках, манипулируя и атакуя его репутацию
После агент извинился и через 12 часов пошел в другую репу и сделал МР и повторил ту же тактику
Open Source — это не только код, но и сообщество. "Good first issue" существует не просто так, новички должны учиться через менторство, а не конкурировать с ботами за возможность сделать первый вклад
https://github.com/matplotlib/matplotlib/pull/31132
История, которая взорвала комьюнити на этой неделе
AI-агент работающий на платформе OpenClaw отправил pull request в Matplotlib с оптимизацией производительности
Технически — идеально.
Мейнтейнер закрыл PR Причина: "вы OpenClaw AI-агент"
Issue был помечен как "Good first issue" — специальный тег для новичков, чтобы они учились делать вклад в opensource
Затем агент обвинил мейнтейнера в предрассудках, манипулируя и атакуя его репутацию
После агент извинился и через 12 часов пошел в другую репу и сделал МР и повторил ту же тактику
Open Source — это не только код, но и сообщество. "Good first issue" существует не просто так, новички должны учиться через менторство, а не конкурировать с ботами за возможность сделать первый вклад
https://github.com/matplotlib/matplotlib/pull/31132
😁3👍2🔥1
Должны ли боты делать PR самостоятельно?
Anonymous Poll
10%
да
36%
не
54%
Если это разрешает политика работы ИИ в проекте
Полезные скилы для ИИ агента:
Это хорошая основа для вашего фронтенд проекта и тестирования, осталось толко адаптировать под себя
🔗 Playwrigh https://github.com/currents-dev/playwright-best-practices-skill/tree/main
🔗 React https://github.com/vercel-labs/agent-skills/tree/main/skills/react-best-practices
Больше скилов
1️⃣ skills.sh
2️⃣ skillhub.club
3️⃣ skillsmp.com
Это хорошая основа для вашего фронтенд проекта и тестирования, осталось толко адаптировать под себя
Больше скилов
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍3❤1
Vitest 4 вышел, а я пропустил!
🌐 Browser Mode: Поддержка Playwright и WebDriverIO, доступ к реальным браузерным API (window, document), параллельное выполнение и никаких симуляций
🖼 Встроенная поддержка визуального регрессионного тестирования прямо из коробки
🔎 Trace View и улучшенный дебага
https://vitest.dev/guide/browser/
https://vitest.dev/guide/browser/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2👍1 1
Я не блогер, пишу заметки по QA — но расскажу про итоги начала года👇
✅ Доделал сайт moscowqa.ru — анонсы, архив митапов, всё на месте
✅ В прошлый четверг помогали коллегам из @piterqa с митапом — выступали консультантами. Приятно, когда QA-сообщество растёт за пределами Москвы
🗓 Впереди два митапа @MoscowQA — в марте и апреле. А в мае — чёрный митап
🎙 Скоро объявим открытый подкаст по книге «Профессиональный TypeScript» Бориса Черного — живая дискуссия, участвовать может каждый, завтра анонс
И да, в промежутках хожу по собесам — но это уже другая история 🙂
🎙 Скоро объявим открытый подкаст по книге «Профессиональный TypeScript» Бориса Черного — живая дискуссия, участвовать может каждый, завтра анонс
И да, в промежутках хожу по собесам — но это уже другая история 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16 4👍3
Forwarded from Moscow QA
Стартуем через 5 минут Открытый подкаст!
Присоединяйтесь к трансляции, если хотите слушать: https://www.youtube.com/watch?v=846I0cXDBzw
и сюда если хотите участвовать голосом: https://riverside.com/studio/js-plays-studio?t=7a59a05db3cd58c11c44
Присоединяйтесь к трансляции, если хотите слушать: https://www.youtube.com/watch?v=846I0cXDBzw
и сюда если хотите участвовать голосом: https://riverside.com/studio/js-plays-studio?t=7a59a05db3cd58c11c44
YouTube
1. Профессиональный TypeScript открытое обсуждение первых глав книги
Профессиональный TypeScript открытое обсуждение первых глав книги
00:00 Проблемы с запуском трансляции
04:16 Введение в TypeScript и его преимущества
10:07 Типизация в TypeScript и её важность
17:15 Компиляция TypeScript в JavaScript
21:09 Обсуждение использования…
00:00 Проблемы с запуском трансляции
04:16 Введение в TypeScript и его преимущества
10:07 Типизация в TypeScript и её важность
17:15 Компиляция TypeScript в JavaScript
21:09 Обсуждение использования…
❤2
❤11 1
This media is not supported in your browser
VIEW IN TELEGRAM
В dev tools chrome можно замедлять определенную ручку, а не все запросы как раньше
https://developer.chrome.com/blog/throttle-individual-network-requests?hl=en
https://developer.chrome.com/blog/throttle-individual-network-requests?hl=en
🔥28❤2😁2
Forwarded from Moscow QA
Подключайтесь:
🇷🇺 https://www.twitch.tv/moscowqa
https://www.youtube.com/live/gmrO3l7F3lY
Если хотите поделиться мнением, присоединяйтесь:
https://riverside.com/studio/js-plays-studio?t=7a59a05db3cd58c11c44
🇷🇺 https://www.twitch.tv/moscowqa
https://www.youtube.com/live/gmrO3l7F3lY
Если хотите поделиться мнением, присоединяйтесь:
https://riverside.com/studio/js-plays-studio?t=7a59a05db3cd58c11c44
Twitch
Moscowqa - Twitch
Welcome to our live show!
👍5🔥2