

За 11 лет в бизнесе я осознал одну простую истину: пока ручками проверяешь каждую строчку кода, конкуренты уже выкатили два-три обновления и получили живой отклик от клиентов. В 2023-м нам нужно было протестировать крипто-платформу за 48 часов до её листинга на Бирже Binance. Поскольку пять QA-инженеров не могли в силу физических закономерностей справиться с объемом работы, нам впервые потребовалось внедрить ИИ-агента для генерации тест-кейсов — результат оказался действительно впечатляющим: 2800 проверок за одну ночь, нашлось 47 критических багов, которые люди бы нашли только через неделю после релиза. С тех самых пор автоматизированное тестирование перестало быть просто инструментом, а стало настоящим стратегическим преимуществом.
Рынок ПО для тестирования переживает заметный сдвиг. Компании, которые решили внедрить искусственный интеллект в QA, сокращают время релизного цикла на 40-60% и достигают тестового покрытия до 85%. Традиционный подход - ручное написание скриптов для Selenium или Playwright пока не справляется с задачей - человек не успевает за темпами быстрой agile-разработки. ИИ меняет правила игры благодаря трем ключевым возможностям:

В мире криптопроектов скорость — вопрос не просто первостепенной важности, а, можно сказать, вопрос выживания. Рынки работают круглосуточно и без выходных, а значит время дорого и ошибки бьют по карману очень больно. Во время флэш-краша на DEX Solana в октябре 2024 наши AI-агенты за 12 минут сделали регрессионное тестирование основных модулей и подтвердили отсутствие дефектов в нашей части. Обычная ручная проверка заняла бы 4-6 часов, за это время у пользователей могло бы испариться всё доверие.
Главное, что отличает искусственный интеллект от традиционной автоматизации тестирования, заключается не в жестких правилах типа if X then Y. Нейросети учатся выявлять паттерны, находить аномалии и выдавать рекомендации. Мы переходим от роли "робота-исполнителя" к "роботу-аналитику", который понимает своими электронными мозгами — что к чему в поставленной задаче.
Автоматизированное тестирование – это когда одна программа тестирует другую. К примеру, скрипт открывает веб-приложение, вводит логин и пароль, жмет кнопку и проверяет, попал ли пользователь на главную страницу. Подобные проверки экономят целые тысячи часов ручной работы.
ИИ добавляет разума. Система не просто выполняет написанные заранее действия, но еще и адаптируется. Если в интерфейсе кнопка "Войти" вместо "Login" вдруг оказалась подписанной "Sign in", классический тест сломается, а AI найдет элемент в контексте. Нейронная сеть выполняет три роли в процессе генерации автотестов:
Существует два ключевых способа автоматизации с помощью ИИ:
Гибридные решения сочетают в себе оба подхода - критически важные сценарии пишутся от руки, остальные автоматизируются ИИ.
Показательный пример: в ASCN.AI для тестирования API блокчейна мы используем искусственный интеллект Playwright и GPT-4. Система самостоятельно генерирует запросы как с валидными, так и невалидными данными, анализирует ответы и сохраняет отчёты. Тестирование новых endpoint'ов занимает менее 30 секунд — разработчику остается всего-то проверить и запустить. Следует понимать: ИИ не заменяет тестировщика. Он убирает рутину, выдерживает стабильность. QA внимание переключает на выбор стратегий, приоритетов, анализ бизнес-рисков.
Начинаем с аудита: а какие задачи делают руками в основном? Как правило, речь идет о регрессионных тестах — убедиться, что старый функционал по-прежнему работает как и прежде. Именно тут и достигается максимальный выигрыш от автоматизации.
Алгоритм простой:
С ИИ еще проще - вы написали требования простым человеческим языком, а GPT вам написала код теста. Тем более, можно за один час получить уже 20–30 базовых тестовых кейсов, на выполнение которых вручную ушло бы несколько дней.
Так, например, в ASCN.AI мы применили этот подход к арбитражному сканеру, где биржи каждый раз меняют API. Мы обучили AI-агента парсить документы, формировать запросы к API и сравнивать ответы с ожиданиями. В случае обнаружения несоответствия — автоматически создаётся тикет и оповещение. При этом резко сократились критические сбои с 12 в месяц до 2.
Считаю важным отметить: exploratory testing - это ручной поиск скрытых багов, например - что будет, если открыть 50 вкладок или ввести эмодзи в числовое поле. ИИ знакомится с распространенными ситуациями, а человек ищет свои неожиданные ошибки.
Рекомендация по покрытию тестами такова: 60% - unit, 30% - интеграционных, 10% - end-to-end, согласно пирамиде тестирования от Google.
Selenium — один из старейших и довольно известных фреймворков для автоматизации браузеров. Он поддерживает все основные браузеры – Chrome, Firefox, Safari, Edge – а также множество языков программирования. Selenium воспроизводит пользовательскую деятельность: нажатия, набирание текста, проверки текстов и т.д.
Основная загадка Selenium - хрупкость тестов. Изменение в DOM вынуждает корректировать селекторы, что становится постоянной рутинной задачей. ИИ помогает с помощью умных локаторов: вместо жесткой связи к id кнопки AI ищет элемент по контексту – логически анализирует тип, место и текст. Это сильно снижает хрупкость тестов и ускоряет сопровождение. Примером успеха интеграции Selenium и GPT может служить подача простого текстового описания запроса, по которому бот генерирует код проверки формы с валидацией email. Экономия времени составляет 5-7 раз.
В ASCN.AI всего за три дня мы сформировали smoke-тесты для более чем двухсот страниц админки криптобиржи, хотя при ручной работе на это пришлось бы потратить целый месяц. Недостаток Selenium состоит в том, что он плохо работает с веб-технологиями: Canvas, WebGL и сложными одностраничными приложениями (SPA). Для таких случаев лучше использовать Playwright.
Playwright - это современный инструмент от Microsoft, который прекрасно приспособлен для работы с SPA. Он дает стабильность, поддерживает мультивкладочные сессии и имеет встроенные автоожидания элементов. По скорости и надежности он быстрее и лучше Selenium, в большинстве сценариев.
Playwright AI - это связка фреймворка с GPT, позволяющая автоматически генерировать тесты. Агент, изучив страницу, быстро накидывает различные сценарии, к примеру, тест на добавление товара в корзину и на оформление заказа.
Вот, к примеру, GPT сгенерировал тест Playwright, проверяющий оформление заказа на сайте, всего за 15 секунд. Каждый день с помощью AI Playwright выполняют более 150 тестов для React-приложения с асинхронной подгрузкой компонентов.
Совет: если имеется Swagger/OpenAPI документация, то можно попросить GPT сгенерировать тесты с проверкой статус-кодов и ответов на запрос. Это сэкономит целую неделю ручного труда. Ограничения: Playwright AI пока не поддерживает тестирование нативных мобильных приложений. В некоторых случаях для кастомных компонентов нужно вручную поправлять селекторы.
Автоматизированное тестирование - это рабочая практика, при которой после каждого коммита автоматически запускаются тесты и при их срыве код не попадает в продакшен. Эту работу усиливает интеллект ИИ:
Например, в ASCN.AI GitLab CI запускает линтеры, юнит-тесты, а потом Playwright с ИИ-агентами регрессии, конфигурируя их из более чем 200 тестов. За полгода это позволило избежать 14 критичных багов. Тем не менее, важность поддержания инфраструктуры в виде параллельных прогона и ретраев flaky-тестов нельзя игнорировать. Иначе можно потерпеть фиаско, не оправдать ожиданий и свести на нет экономию времени, так как исправление тестов отнимет ресурсы.
ИИ хорошо распознает требования, а также анализирует код, автоматически создавая список тест сценариев: позитивных, негативных и граничных. Пример: например, функция сброса пароля по email - AI генерирует кейсы на корректность email, время жизни ссылки, повторное использование и т.д.
В ASCN.AI при мониторинге фандинг-рейтов AI создал более 80 тест-кейсов за 2 часа вместо недели ручного труда. Преимуществом AI является возможность учитывать привычные тормоза и намеки на них по безопасности, такие как - например - SQL-инъекции и XSS, недостатком - отсутствие полного понимания бизнес-логики, специфичные edge-cases добавляем по-прежнему вручную.
Помимо тестов, автоматизация при помощи AI может помочь в планировании, анализе логов, создании отчетов, управлении тестовыми данными:
Кейс ASCN.AI: синтетические данные для 10 000 токенов с распределением по паттернам в свою очередь позволило увидеть узкие места производительности до выхода в релиз. Для продуктивного взаимодействия с AI требуется историческая база данных - порядка 3 - 6 месяцев работы команды. Но pre-trained модели можно использовать сразу для генерации базовых тест-кейсов и покрытий.
Нейросети решают три основных задачи с автотестами:
В ASCN.AI нейросеть умеет за три дня рефакторить более 300 legacy-тестов, при этом убирает из них 47 дублирующих, тем самым экономя месяц ручного труда. Не забываем: нейросети не понимают бизнес-логику, следовательно, специфичные требования надо задавать четко.
| Инструмент | Тип | Преимущества | Недостатки | Цена | Лучший сценарий использования |
|---|---|---|---|---|---|
| Testim.io | Платформа для UI-тестов | Самовосстановление тестов, поддержка React/Angular/Vue | Дорогая подписка, ограничена API-тестами | От 450 долларов/мес | E-commerce, SaaS |
| Mabl | No-code платформа | Автогенерация тестов, интеграция с CI/CD | Ограниченная гибкость | От 99 долларов/мес | Команды без опыта автоматизации |
| Applitools | Visual testing | Невероятный анализ визуального контура, поддержка любого технологического стека | Высокая цена и затейливые тесты | От 1 000 долларов/мес | Любые |
| Selenium | Инструментарий (Suite) по автоматизации | Full-featured бесплатная опенсорс платформа | Труднообучаемая и не имеющая визуализации | Бесплатно | Команды без фуллстек автоматизации |
| ASCN.AI NoCode | NoCode платформа | Интеграция AI-агентов с Telegram/CRM/API, доступная цена | Молодой продукт, меньше коннекторов | От $29/мес | Автоматизация QA и бизнес-процессов |
| GitHub Copilot | Ассистент кода | Автодополнение тестов в IDE | Не запускает тесты | $10/мес | Ускорение написания unit-тестов |
Процесс разбит на шаги:
Промт для генерации тестов на функцию двухфакторной аутентификации посредством SMS вызывает все возможные варианты тест-кейсов, вплоть до блокировки по некорректным кодам и проверки временного ограничения. Находящийся встроенный искусственный интеллект в Jira делает получение тест-кейсов к новым задачам неприлично быстрым и необъяснимо легким. Время от получения задач до получения тест-кейсов сокращается с нескольких дней до нескольких минут.
Далее - анализ и оптимизация тестов с помощью методов машинного обучения. Появляется возможность выделять неэффективные тесты:
С помощью ML-анализа в ASCN.AI удалось избавиться от дублирующих и устаревших тестов, сократив время прогона с 45 минут до 18, и при этом не ухудшив качество.
Внедрение ИИ в процессы QA — это не просто дань моде, а объективная необходимость для быстрорастущих проектов. Однако, как и любая технология, она имеет свои сильные и слабые стороны.
Радикальное ускорение разработки тестов. Использование ИИ позволяет сократить время на написание тестовых сценариев на 60–80%. То, что раньше занимало неделю ручного труда, теперь выполняется за несколько часов.
Повышение качества покрытия. ИИ способен генерировать сотни сценариев, включая сложные граничные случаи (edge cases), которые человек мог бы упустить из виду.
Снижение затрат на поддержку (Self-healing). Одной из главных проблем классической автоматизации является «хрупкость» тестов: любое изменение в дизайне ломает скрипты. ИИ-агенты умеют адаптироваться к изменениям интерфейса, автоматически обновляя локаторы элементов.
Освобождение человеческого ресурса. Тестировщики избавляются от рутины и могут сфокусироваться на анализе бизнес-рисков и сложных исследовательских тестах (exploratory testing).
Проблема «галлюцинаций» и ложной уверенности. ИИ может сгенерировать код, который выглядит корректно, но на самом деле пропускает важные логические ошибки. Высокое покрытие в отчетах не всегда означает реальную безопасность продукта.
Зависимость от качества входных данных. Если техническое задание (PRD) написано нечетко или документация устарела, ИИ создаст нерелевантные тесты. Работает принцип «Garbage In — Garbage Out» (мусор на входе — мусор на выходе).
Недостаток понимания бизнес-контекста. Нейросеть отлично понимает код, но не всегда осознает, почему та или иная функция должна работать именно так с точки зрения конечного пользователя. Сложную бизнес-логику всё еще нужно проверять вручную или жестко контролировать промптами.
Затраты на инфраструктуру. Использование мощных моделей (вроде GPT-4) требует оплаты токенов и вычислительных мощностей. При масштабировании на тысячи тестов эти расходы могут стать значительными.
Непрозрачность решений (Black Box). Иногда ИИ предсказывает наличие ошибки, но не может внятно объяснить причину. В таких случаях необходимо внедрять методы «объяснимого ИИ» (Explainable AI), чтобы команда понимала логику выводов системы.
На платформе 50 000 SKU, релизы каждую неделю. Ручная регрессия держала 3 дня. Ночью, когда в городе спят и люди расслабляются, к делу подключились GPT и Playwright, которые полагались на собственные силы, чтобы изучить, проанализировать и выдать тесты по изменённым модулям. В результате общее покрытие выросло с 30% до 82%, время на тестирование регрессии сократилось с 3 дней до 4 часов, а до релиза мы успели отловить 27 багов.
20 микросервисов на node, без тестов. С помощью хука pre-commit, использующего GPT, мы генерируем unit-тесты, проверяем покрытие и блокируем коммиты, когда тестов недостаточно. Через 3 месяца покрытие повысилось до 78%. Количество инцидентов в продакшене снизилось на 65%. Теперь команда тратит на тесты всего 10% времени, вместо их отсутствия в прошлом.
11 октября 2024 года произошел крах Bitcoin на 10%. AI-агент за 12 минут сгенерировал 50 сценариев на предмет проверки на экстремальную волатильность. Параллельное тестирование на соответствие в полной мере подтвердило, что система устойчива, что пользователи в кризис действительно имеют возможность зарабатывать на арбитраже. Подробности кейса.
Европейский банк с устаревшей системой на COBOL, с современным web фронтендом. В зависимости от используемой модели для анализа существующих и потенциальных зависимостей и рисков и от специфики ее работы, задача генерации регрессионных тестов была возложена на GPT, а автоматический их запуск обеспечила Selenium. Первые итоги - время тестирования сократилось с 6 до 2 недель, частота релизов выросла в 3 раза, а 14 инцидентов в год предотвратили.
Производитель электромобилей создает модели для экстремальных дорожных сценариев. GPT генерирует edge-cases на основании реальных данных, полученных с датчиков, а симулятор оценивает реакцию автопилота. В результате перед живыми тестами было выявлено 89 критичных по своей сути багов. Сэкономили 2 миллиона долларов и 70% времени.
Традиционные автотесты - это жестко прописанные логические скрипты, которые требуют ручного обновления при изменении тестируемых элементов. Автотесты на основе ИИ адаптивны, они автоматически подстраиваются под изменения UI (если такое возможно) и автоматически генерируются, включая edge-cases (это сокращает время на написание и поддержку, увеличивает покрытие и снижает ломкость). Всё равно - базовые и критические сценарии лучше писать вручную.
Информация в статье носит общий характер и не заменяет инвестиционных, юридических или консультаций по безопасности. Использование AI помощников требует осознанного подхода и понимания функций конкретных платформ.