Что именно такое A/B тестирование плюс почему оно необходимо
Что именно такое A/B тестирование плюс почему оно необходимо
А/Б проверка представляет формат подход проверки нескольких либо нескольких версий страницы, экрана, текста, кнопки, поля ввода, письма, маркетингового креатива либо прочего цифрового объекта. Главная цель заключается в том задаче, для того чтобы выяснить, который версия лучше функционирует на реальном использовании. Взамен предположений плюс личных мнений задействуется эксперимент в рамках живой группы пользователей, когда одна группа видит версию A, и вторая — версию B.
Такой подход позволяет принимать действия с опорой на результатах показателей, но не индивидуальных предпочтений либо случайных замечаний. В экспертных публикациях, включая 1вин, регулярно указывается, что А/Б эксперимент наиболее ценно в тех случаях, при которых небольшие изменения способны сказываться по части реакции аудитории: нажатия, регистрации, заполнение форм, объем сессии, возвращаемость, покупки, подписки или другие целевые результаты. Эксперимент позволяет увидеть, реально ли именно корректировка усиливает 1win эффект.
Каким образом работает А/Б эксперимент
Принцип А/Б тестирования достаточно понятен. На первом этапе берется объект, что нужно протестировать. Это имеет шанс стать заголовок, цвет CTA-элемента, порядок секций, текст подсказки, построение поля ввода, визуал, стоимость, вариант условия или расположение целевого элемента. Далее создаются не менее пары варианта: контрольный и измененный. Затем этого поток пользователей распределяется среди версиями на основе предварительно определенным правилам.
Первая часть аудитории остается получать первоначальную страницу, а вторая получает обновленную. Платформа накапливает показатели касательно поведении каждой категории затем анализирует показатели. Если вариант B дает более сильный эффект при значительном массиве сведений, эту версию можно запускать. В случае если разницы нет либо новая страница показывает себя хуже, изменение не принимается. Именно в этом а также заключается практическая польза эксперимента: эксперимент помогает оценивать предположения до полного 1вин внедрения.
Для чего необходимо А/Б эксперимент
A/B тестирование необходимо для снижения сомнений. Внутри онлайн сервисах даже небольшая правка имеет шанс влиять в отношении понимание экрана. Один текстовый блок имеет шанс оказаться доступнее иного, короткая анкета имеет шанс заполняться регулярнее длинной, и намного более заметная кнопка действия имеет шанс усилить число переходов. Если не использовать эксперимента подобные выводы часто сохраняются гипотезами.
Метод помогает оптимизировать продукт шаг за шагом. Вместо крупной реконструкции всего ресурса а также сервиса получается проверять точечные блоки а также записывать практический эффект. Такая логика сокращает вероятность неудачных изменений, экономит время и средства и дает возможность накапливать понимание о поведении пользователей. Через временем специалисты 1 win формирует не совокупность суждений, вместо этого модель проверенных подходов.
Какого типа блоки можно сравнивать
Тестировать допустимо почти разный объект, какой сказывается на действия пользователя. Как правило всего проверяют заголовки, подзаголовки, обращения к переходу, тексты элементов действия, анкеты регистрации, позицию блоков, визуалы, страницы позиций, последовательность шагов, инструменты отбора, список разделов, баннеры, сообщения, рассылки плюс маркетинговые объявления. Важно, дабы указанный объект оказывался соотнесен с определенной заданной метрикой.
Если ориентир состоит в росте переданных заявок, правильно сравнивать заявку, формулировку возле формы, количество полей и выразительность элемента действия. Если нужно увеличить глубину сессии, стоит тестировать переходы, секций предложений, связанные переходы плюс построение раздела. Если точнее соотношение 1win в паре правкой плюс метрикой, тем самым полезнее итог тестирования.
Проверяемая идея как фундамент эксперимента
Каждый корректный сплит проверка запускается на основе проверяемой идеи. Проверяемая идея показывает, какого типа правка планируется, почему такая правка способно сказаться в отношении показатель и какой именно показатель может измениться. К примеру, можно сформулировать, если уменьшение анкеты оформления аккаунта снизит количество отказов, потому что посетителю нужно будет значительно меньше минут с целью окончания шага.
Корректная формулировка не обязана должна оставаться слишком широкой. Фраза типа «изменить страницу лучше» не позволяет дает возможность оценить показатель. Гораздо более точный пример: «при условии что поменять объемный надпись CTA на более сжатый а также понятный, объем кликов вырастет, поскольку что ожидаемый результат станет понятнее». Подобная формулировка непосредственно 1вин указывает элемент эксперимента, причину и метрику.
Контрольная и экспериментальная группы
В А/Б эксперименте базовая группа видит первоначальный версию, а проверочная — новый. Подобное разделение нужно с целью корректного сравнения. В случае если просто обновить раздел а также сравнить метрики до и после, итог имеет шанс стать неточным вследствие сезонных факторов, маркетинговой нагрузки, перестройки каналов трафика, новостей, служебных ошибок либо прочих внешних факторов.
Одновременный запуск нескольких решений уменьшает влияние случайных факторов. Обе аудитории оказываются в похожей ситуации: единый и тот идентичный период, схожие самые потоки посещений, похожие девайсы и общий фон. Следовательно различие по показателях с высокой 1 win большей степенью вероятности соотносится именно с правкой, и не не с посторонними сторонними обстоятельствами.
Какие именно показатели применяются внутри сплит проверках
Критерий — представляет собой значение, по чему оценивается итог проверки. Подбор метрики зависит с учетом задачи теста. В случае раздела с активной заявкой важны заполнения заявок, для интернет-магазина — сохранения к покупку плюс покупки, в случае контентного проекта — объем изучения а также период сессии, в случае сервиса — создания аккаунтов, запуски, retention плюс повторные 1win события.
Необходимо различать главную плюс дополнительные критерии. Главная отражает, ради какой цели делается проверка. Вспомогательные помогают выявить вторичные эффекты. К примеру, изменение CTA способно усилить переходы, однако снизить результативность дальнейших действий. Следовательно разумно оценивать не только только на стартовый шаг, а также и на последующее развитие: завершение заявки, возвраты, уходы, ошибки а также итоговую эффективность результата.
Расчетная достоверность
Статистическая существенность демонстрирует, в какой степени возможно, поскольку полученная расхождение среди вариантами не считается считается случайным колебанием. Если конкретный вариант слегка обходит второй по итогам ряда малого числа сессий, такой результат еще не означает выигрыш. В условиях небольшом объеме наблюдений результат имеет шанс резко измениться, когда 1вин группа станет объемнее.
Ради надежного вывода необходимо достаточное объем событий. Насколько скромнее предполагаемая дельта в паре версиями, тем самым больше данных потребуется получить. Когда корректировка должно увеличить результат лишь на несколько процентов, эксперименту будет необходимо значительно больше срока плюс пользователей. Математическая значимость помогает не делать выносить быстрые решения на базе случайных изменений.
Размер аудитории плюс длительность теста
Масштаб аудитории воздействует на достоверность результата. Когда проверка охватывает слишком ограниченный объем людей, выводы имеют шанс стать неточными. В частности, пять лишних переходов в конкретной выборке могут выглядеть как прирост, однако на большем количестве окажутся простой колебанием. Следовательно до момента начала важно понимать, сколько людей 1 win либо событий необходимо для подтверждения идеи.
Срок проверки также сохраняет важность. Чрезмерно быстрый тест способен не учитывать расхождения между рабочими а также выходными днями, рабочей а также вечерней посещаемостью, отличающимися потоками пользователей. Обычно тест должен включать полный круг действий посетителей. При таком подходе слишком затянутый период проверки также неоптимален, если внешние факторы успевают заметно поменяться.
По какой причине нельзя корректировать тест во время работы
Распространенная среди частых проблем — добавлять корректировки внутрь проверку после момента начала. Когда по ходу центре теста изменить формулировку, группу, интерфейс, условия показа а также цель, данные перемешаются. После этого станет непросто определить, что именно воздействовало на эффект. Эксперимент утратит корректность, а результаты станут спорными 1win.
Перед начала необходимо зафиксировать гипотезу, версии, критерии, разбивку аудитории плюс условия окончания. С момента старта лучше не стоит вмешиваться без серьезной основания. Если выявлена ошибка в запуске или технический проблема, правильнее прервать тест, устранить ошибку и начать повторный тест, вместо того чтобы пытаться объяснять смешанные показатели.
Параллельное тестирование разных правок
В отдельных случаях появляется желание протестировать за один раз группу изменений: новый headline, другую CTA, упрощенную заявку а также перестроенный расположение элементов. Такой подход может показать общий результат, однако не покажет раскроет, какого типа именно блок повлиял в отношении показатель. Когда измененная страница выиграла, будет непонятно, что повлияло эффективнее всего.
С целью точной оценки чаще всего изменяют один существенный элемент в 1вин одну проверку. В случае если требуется сравнить многие комбинаций, задействуется многовариантное сравнение. Оно многоуровневее, требует большего числа пользователей и корректной оценки. В случае большинства целей сплит тест на основе единственной точной гипотезой показывает гораздо более корректный плюс практичный результат.
Примеры А/Б экспериментов в UI
Внутри дизайнах сплит проверка регулярно используется ради оптимизации понятности действий. В частности, допустимо сопоставить две вариации заявки: расширенную с множеством строк плюс краткую с сокращенным числом данных. Когда короткая заявка повышает количество успешных регистраций без риска снижения ценности заявок, ее можно оценивать гораздо более результативной.
Другой сценарий — сравнение формулировки кнопки. Сдержанная формулировка способна стать не такой очевидной, относительно точное название действия. Также сравнивают позицию кнопок, порядок информационных блоков, оформление 1 win пояснений, наличие прогресс-бара, способ показа ошибок а также объем шагов на протяжении пути. Каждый подобный объект сказывается в отношении степень того, как просто окончить заданное событие.
A/B эксперимент на уровне контенте
На уровне содержании проверка помогает понять, какие headline-блоки, анонсы, схемы и форматы лучше привлекают вовлечение. Можно сопоставлять несколько интро, длину материала, логику аргументов, добавление списков, подачу элементов, подачу преимуществ а также манеру раскрытия трудной информации. Однако при таком подходе важно анализировать не исключительно нажатия, но также следующее взаимодействие.
Заголовок может увеличить объем кликов, при этом в случае если содержание не будет совпадает интересам, увеличится процент быстрых выходов. Из-за этого текстовые тесты должны учитывать качество контакта: период изучения, скролл, переходы внутри сайта, повторные визиты и выполнение заданных действий. Сильный результат — представляет собой не только исключительно получение внимания, вместо этого совпадение запроса плюс содержания.
A/B проверка на уровне email-рассылках
В email-рассылках часто тестируют заголовки сообщений, имя отправителя, стартовые строки, время отправки, объем email, место кнопок и формулировки предложений. Один сегмент аудитории открывает контрольную версию сообщения, второй сегмент — тестовую. Вслед за этого сопоставляются open rate, клики, unsubscribes, негативные сигналы а также последующие реакции на ресурсе.
Существенно не нужно ограничиваться значением просмотров письма. Заголовок рассылки способна быть выразительной плюс получать внимание, но когда тема не сможет совпадает наполнению, нажатия плюс уверенность способны ослабнуть. Поэтому качественный email-тест анализирует полную цепочку: просмотр, клик, активность после нажатия а также отклик подписчиков по отношению к сообщение.