Тестирование микросервисов. Справочная информация. Пополняемый и перерабатываемый материал.
О важности тестирования
Допустим, вы решили перейти на микросервисы (или уже почти там там). Только с помощью тестов можно проверить и подтвердить, что постепенно меняющаяся архитектура остается пригодной. Но почему еще тестирование микросервисов важно начинать с самых ранних этапов перехода?
Во-первых, это позволяет переходить на микросервисы микрошагами. Ручной затянутый регрес будет серьезным препятствием к постепенному переходу (что я и видел в нескольких неудачных попытках — деплой даже средних изменений приводил к тому, что то там, то здесь баг, а реализацию бизнес-фич никто не отменял).
Второй момент, — все мы знаем подход shift left (например — выполнять часть тестов производительности и безопасности еще на этапе разработки), когда практики качества серьезно сдвигаются влево. В микросервисах, помимо shift left появляется shift right — тестирование на продакшене (тот же chaos engineering, нагрузка и scalability на проде). Только на проде можно получить самые точные результаты тестов, так это именно то окружение, со своими достоинствами и недостатками, которым пользуется клиент.
Некоторые виды тестирования
Юнит-тесты
Бытует мнение, что при тестировании микросервисов не нужны юнит-тесты. Сложно определить, откуда пошло это заблуждение, но при динамике изменений, свойственной микросервисам, без быстрого выявления ошибок не обойтись.
Не стоит забывать и о том, что юнит-тесты — это и мощная практика дизайна. А трудности с написанием юнит-тестов на существующий код чаще всего связаны именно с проблемами кода и вносить изменения в рамках реализации новых бизнес-фич будет ничуть не проще, а даже и сложнее, чем написать юнит-тест.
Юнит-тесты можно условно поделить на те, что тестируют состояние объекта и те, что тестируют поведение/взаимодействие, используя тест-дублеры.
Первые находятся в центре дизайна, слое доменной логики. Его особенность в том, что если удалось провести качественное проектирование на уровне предметной области, то изменения в него будут вносится все реже и реже(и, скорее всего, точечно), — это стабильная область (в отличие, например, от UI). Следствие из этого — код и нюансы его работы будут забываться, тесты станут стабильнее и выступать в том числе актуальной документацией, а их запуск в рамках CI является формальным подтверждением того, что в сборку не попал регрес.
Вторая категория, — на уровне портов и адаптеров и здесь используются тесты с использованием тест-дублеров. Это другой слой стратегии тестирования. В нем проверяется любая логика, подготавливающая запросы или обрабатывающая ответы от внешних систем (в том числе баз данных), используя вместо них тест-дублеры. Это позволяет обспечить надежную, быструю и повторяемую проверку циклов «запрос-ответ».
Если планируется переход от монолита к микросервисам, то юнит-тесты с использованием дублеров могут разделиться на две части. Чтобы лучше это понять, следует обратиться к шаблону «Микросервисное шасси/Фреймворк микросервиса» — от вынесение общей инфраструктурной функциональности в отдельный фреймворк. Тесты общего назначения могут уйти в кодовую базу фреймворка и поддерживаться отдельно, что снижает общую сложность управления тестами и сокращает время их выполнения (в CI сервиса выполняются юнит-тесты сервиса, а юнит тесты фреймворка выполняются в своем CI).
В сухом остатке имеем набор микросервисов, каждый со своим набором юнит-тестов, выполняющихся в собственном пайплайне, часть из которых может быть вынесена в отдельный пайплайн микросервисного фреймворка. В рамках пайплайна тесты на домен более стабильные, чем тесты портов и адаптеров и мы держим их отдельно (не смешивая в коде самих тестов), чтобы не привнести более низкую стабильность в тесты доменной логики.
Интеграционные тесты
Интеграционные тесты проверяют, как это странно не прозвучит, интеграцию. Их есть два вида: проверка интеграции с другими сервисами и проверка интеграции с базами данных.
При проверке интеграций с другими сервисами эти тесты должны выявлять ошибки уровня протокола: пропущенные HTTP-заголовки, корректную работу с SSL, обработку ошибок. Медленные ответы и ошибки можно проверить в помощью стабов (stubs).
Интеграционные тесты на хранилище должны давать уверенность в том, что схема данных в хранилище соответствует реализации в коде (да-да, DDL в общем случае создает API для доступа к данным, а DML с определенной долей свободы толкования можно назвать протоколом взаимодействия). Тесты этого типа включают в себя сохранение/возврат сохраненных данных (транзакции), обработку ошибок сети и таймауты.
Компонентные тесты
average dose of levitra argumentative essay on boxing sildenafil savings card buy lisinopril online canada abbreviation https://businesswomanguide.org/capstone/dissertation-comment-faire-introduction/22/ here asid blockers affect viagra buy viagra in uae go how to cite an essay in print with pages https://oaksofwellington.com/promethazine-25-mg-recreational-use/ long term goals essay examples https://vivianschilling.com/film/essays-on-the-scientific-method/61/ get link change myself essay nuova pubblicit fiat viagra catcher in the rye essay about depression cialis take a month to work for bph an essay concerning toleration https://greenacresstorage.net/thesis-game-based-learning/ que efectos causa el viagra en las mujeres viagra spray in ksa follow link 40 40 viagra three strike law essay essay underline or quotations source url kamagra gel que es get link michigan works help pay college how to get misoprostol Компонент — любая хорошо инкапсулированная, целостная и независимо заменяемая часть большей системы.
Компонент изолируется с помощью тест-дублеров для исключения комплексного поведения, повышения контроля для тестовой средой и уровня повторяемости тестироруемого поведения.
В микросервисной архитектуре сам микросервис и есть компонент.
Компоненты можно тестировать с сетевым взаимодействием и с изоляцией сетевого взаимодействия.
Проверка с изоляцией сетевого взаимодействия достигается за счет Dependency Injection и in-memory решений.
Примеры библиотек для изоляции HTTP-сервера
- .NET: TestServer
- Java: Jetty
Примеры библиотек для изоляции хранилища
- H2 Database Engine в Java
- LiteDB в .NET
Проверка с сетевым взаимодействием помимо поведения позволяет проверить корректность сетевых настроек и возможность обрабатывать сетевые запросы. Реальный сервис заменяется на Stub Service.
Возможные реализации Stub Service
- Использование инструментов Mock’ирования
- Собственная разработка
- Record-replay
Примеры инструментов:
- http://wiremock.org
- http://postman.com
- http://hoverfly.io
- https://www.soapui.org
- https://smartbear.com
- https://www.mock-server.com
- https://github.com/dreamhead/moco
- http://www.mbtest.org
- https://github.com/vcr/vcr
Контрактные тесты
Контракт – это соглашение между потребителем и поставщиком сервиса, включающее в себя:
- Входные структуры данных
- Выходные структуры данных
- Обработку ошибок
- Производительность
- Параллелизм
Контрактные тесты разрабатывает потребитель (ServiceA-B-C), после чего они помещаются в тестовый набор Producer’а.
При обратно не совместимых изменениях Producer будет знать, какого потребителя уведомить. Пример инструмента для контрактного тестирования — pact.io.
End-to-end тесты
Проверка того, что система в целом, рассматриваемая как «черный ящик», достигает бизнес-целей. Так же проверяют корректность настроек фаерволов, балансировщиков, прокси и т.д.
При масштабных изменениях в архитектуре позволяют убедиться, что бизнес-цели по-прежнему достигаются.
При e2e-тестировании с нестабильными внешними системами, над которыми нет контроля, стоит задуматься о применении Stub’ов
Стратегия тестирования микросервисов
Простая стратегия в виде пирамиды тестирования все еще применима, но в нам потребуется посмотреть на нее немного глубже.
Тестирование в микросервисах наследует идеи, заложенные в DevOps и подразумевает участие всей команды в обеспечении качества:
- Тестирование идей
- Направление разработки через бизнес-ориентированные тесты
- Тестирование и разработка взаимно интегрированы, рассматриваются как единое целое
- Команда устраняет ошибки немедленно
- Вся команда вовлечена в мониторинг и тестирование на проде
Классический вопрос:
- На каком уровне автоматизировать тесты?
- Какую часть приложения должен проверять каждый тест?
- Идея в том, чтобы минимизировать количество слоев приложения, через которые проходит каждый тест
- Какую часть приложения должен проверять каждый тест?
Инфраструктура
При работе с микросервисами инфраструктуре уделяется особое, пристальное внимание. Вспомним, что при переходе на микросервисы сложность частично мигрирует в инфраструктуру, а значит инфраструктура должна быт надежной, а работа с ней – предсказуемой.
Стоит начать с выявления проблемных мест, например:
- Тестовая среда в нерабочем состоянии
- Установлена неверная версия продукта
- Артефакты поставки невозможно задеплоить
- В тестовой базе поврежденные данные
- Несколько тестов используют одни и те же данные
- Данные не prod-like
Новые возможности, предоставляемые инфраструктурой при применении микросервисного архитектурного стиля:
- Инструментальное создание сред с помощью скриптов
- Требования железа сместились с локальных сред к контейнерам и виртуалкам
- Локальные машины могут быть prod-like
Нельзя обойти стороной и преимущества тестирования на облачной инфраструктуре:
- Дешевле
- Проще реализовать
- Возможность параллельного выполнения
- Одновременное тестирование в нескольких браузерах
- Масштабируемость и повторяемость
Однако, не стоит забывать, что при неправильном использовании косты могут резко взлететь за счет потребляемых ресурсов.
Инфраструктура как код
В работе с инфраструктурой при использовании микросервисов без подхода Инфраструктра как код (IaC, Infrastructure as a Code) никуда. Инфраструктура == код. Код нужно тестировать. Что проверять?
- Код, конфигурирующий и настраивающий deployment pipeline
- Скрипты деплоя
- Подключения, надежность, failover’ы, бэкапы и восстановления
- Мониторинг прода
Тесты можно конфигурировать для выполнения на различных окружениях:
Обучение на продакшене
Задумаемся на минутку. Бывали ли в вашей жизни сюрпризы после выхода в прод?
Тестовое окружение никогда полностью не повторит прод, а выявить все способы взаимодействия клиента с продуктом просто невозможно. Нереально протестировать вообще всё:
- Test/Staging ≠ Production
- Поведение пользователя не предсказуемо
- Недостаток времени на тестирование всех возможных в природе сценариев
Но если мы научимся быстро реагировать на отказы, тогда мы можем перевести на свою сторону преимущество от использования технологий, помогающих выявлять проблемы на проде и узнавать, какую функциональность и как клиенты действительно хотят использовать.
Способы получения информации о здоровье сервиса:
- «Blackbox» мониторинг — опрос сервисов, не дает информации о причинах отказов
- «WhiteBox» мониторинг — отчеты о внуреннем состоянии (дебаггин, dashbord’ы, предиктивный анализ)
- Логи — дискретные событие, происходящие во времени (например в JSON)
Многие останавливаются на BlackBox, но это только симптомы. Чтобы понять причины, необходимо понимать, что происходит внутри.
Логирование должно быть централизированным и структурированным (json), но может оказаться дорогим.
Когда же возникает ошибка, нам помогает трассировка. Это индивидуальные пути движения клиента по системе с деталями движения: какие функции были вызваны, с какими параметрами, как долго функции выполнялись.
Метрики же — это числа во времени. Они оптимизируются для хранения. Их дешевле и проще хранить. Например Prometheus или ELK.
Наблюдаемость (Obesrvability) — это возможность задать произвольный вопрос об окружении, — и это ключевая часть, — не зная заранее что вы хотите спросить.
Таким образом, первый способ обучения на проде — это наблюдаемость.
Другой способ тестирования на проде — Chaos Engineering. Как и наблюдаемость, он позволяет выявлять неизвестные неизвестные. Заключается в проведении контрлируемых экспериментов на проде и требует мониторинга и наблюдаемости.
Примеры инструментов:
Заключение
Переделки (rework) увеличивают время цикла, что снижает нашу способность к обучению и командную динамику. Короткое время цикла увеличивает интенсивность поступления обратной связи при падении любых регрессионных тестов. Стоит фокусироваться на качестве, а не скорости, так как именно качество позволяет увеличить скорость в долгосрочной перспективе.