Что означает A/B эксперимент а также зачем этот метод используется
A/B проверка представляет формат способ сопоставления пары либо нескольких вариантов страницы, экрана, копирайта, кнопки, поля ввода, письма, маркетингового объявления либо иного онлайн объекта. Его цель проявляется в задаче, для того чтобы определить, какая версия результативнее показывает себя при реальном использовании. Без опоры на предположений а также субъективных оценок используется эксперимент среди настоящей группы пользователей, когда первая группа получает формат A, а другая — версию B.
Подобный подход дает возможность принимать выводы на основе информации, а не личных вкусов а также случайных замечаний. Внутри экспертных источниках, включая 1вин, часто подчеркивается, что A/B проверка наиболее ценно в тех случаях, при которых точечные изменения способны воздействовать по части поведение аудитории: переходы, создания аккаунтов, заполнение заявок, длину сессии, лояльность, заказы, подключения а также другие нужные шаги. Подход помогает увидеть, на самом деле ли именно правка усиливает 1win показатель.
По какому принципу функционирует А/Б эксперимент
Механизм A/B тестирования достаточно несложен. Сначала выбирается элемент, какой требуется протестировать. Таким элементом способен стать headline, оттенок CTA-элемента, последовательность секций, формулировка подсказки, логика анкеты, картинка, стоимость, тип оффера или позиция ключевого шага. Затем формируются не менее двух версии: контрольный и обновленный. После подготовкой поток пользователей делится между ними согласно заранее установленным правилам.
Первая группа посетителей продолжает просматривать старую вариацию, а другая видит обновленную. Система накапливает сведения касательно реакциях каждой группы и анализирует результаты. Когда версия B показывает лучший эффект при значительном количестве данных, эту версию допустимо внедрять. В случае если разницы нет а также обновленная страница показывает себя хуже, корректировка отклоняется. В таком подходе и заключается прикладная значимость проверки: такой метод позволяет оценивать гипотезы до полного 1вин внедрения.
Зачем нужно A/B эксперимент
сплит эксперимент нужно для уменьшения сомнений. Внутри веб сервисах включая малая деталь имеет шанс воздействовать на восприятие интерфейса. Один заголовок способен оказаться доступнее иного, сжатая форма способна отправляться регулярнее длинной, и намного более заметная CTA способна увеличить объем нажатий. При отсутствии тестирования такие решения часто сохраняются догадками.
Метод помогает улучшать сервис поэтапно. Вместо крупной реконструкции целого проекта или сервиса получается тестировать конкретные объекты и записывать реальный показатель. Это сокращает вероятность неудачных правок, экономит ресурсы и дает возможность накапливать знания про действиях аудитории. Со временем специалисты 1 win собирает не случайный комплект мнений, но систему валидированных действий.
Какие блоки можно тестировать
Проверять можно практически каждый элемент, что сказывается в отношении реакции пользователя. Обычно преимущественно оценивают headline-блоки, разделы, обращения на переходу, надписи элементов действия, формы создания профиля, позицию блоков, изображения, карточки продуктов, очередность этапов, сортировки, список разделов, визуальные блоки, уведомления, email-сообщения а также маркетинговые материалы. Существенно, дабы выбранный объект оставался объединен с точной целью.
Если ориентир проявляется в необходимости увеличении заполненных заявок, разумно сравнивать форму, формулировку около этого блока, объем строк а также заметность кнопки. В случае если необходимо усилить длину изучения, следует тестировать меню, секций подсказок, внутрисайтовые ссылки а также построение страницы. Если прямее соотношение 1win среди корректировкой и целью, тем ценнее эффект тестирования.
Гипотеза как база эксперимента
Всякий качественный A/B эксперимент начинается с гипотезы. Предположение объясняет, какое именно изменение планируется, из-за чего оно может воздействовать по части результат плюс какой именно показатель должен измениться. К примеру, допустимо предположить, будто упрощение заявки оформления аккаунта сократит количество уходов, поскольку ведь посетителю нужно будет меньший объем минут для завершения шага.
Качественная формулировка не может быть чрезмерно размытой. Фраза наподобие «улучшить раздел лучше» не позволяет зафиксировать эффект. Намного более точный формат: «когда поменять длинный формулировку кнопки на сжатый а также конкретный, количество нажатий увеличится, поскольку ведь действие окажется очевиднее». Такая формулировка непосредственно 1вин указывает элемент эксперимента, основание а также показатель.
Контрольная плюс экспериментальная группы
В A/B тестировании исходная часть получает старый вариант, тогда как проверочная — новый. Такое разделение важно ради объективного сравнения. В случае если только поменять раздел а также оценить метрики до и после изменения, результат может испортиться по причине сезонности, промо кампании, изменения потоков трафика, информационного фона, служебных ошибок или других сторонних условий.
Синхронный запуск отличающихся решений уменьшает влияние внешних обстоятельств. Обе аудитории остаются на уровне близкой среде: один и тот идентичный отрезок, схожие идентичные каналы пользователей, похожие платформы а также единый окружение. Поэтому отличие по результатах с 1 win значительной степенью вероятности объясняется как раз с конкретным корректировкой, и не не только с внешними случайными факторами.
Какие метрики задействуются внутри А/Б проверках
Метрика — это значение, согласно чему проверяется итог эксперимента. Выбор критерия строится от задачи проверки. Ради страницы с анкетой важны заполнения заявок, в случае торговой площадки — сохранения к покупку и покупки, ради медиаресурса — объем изучения а также период сессии, в случае сервиса — оформления профилей, запуски, retention плюс повторные 1win действия.
Существенно отделять основную плюс дополнительные метрики. Главная показывает, зачем какого результата делается эксперимент. Вторичные позволяют выявить сопутствующие эффекты. К примеру, правка элемента действия имеет шанс повысить клики, однако уменьшить качество следующих действий. Поэтому важно анализировать не только лишь в сторону первый клик, а также еще на дальнейшее развитие: окончание формы, повторные визиты, уходы, сбои а также общую ценность действия.
Статистическая достоверность
Расчетная существенность демонстрирует, насколько реалистично, будто зафиксированная отличие среди вариантами не является оказывается случайным колебанием. В случае если первый вариант немного превосходит альтернативный после пары малого числа сессий, такой результат все еще не доказывает выигрыш. На фоне малом количестве наблюдений показатель имеет шанс резко измениться, если 1вин аудитория будет больше.
Для надежного заключения необходимо значительное количество данных. Чем меньше планируемая отличие среди версиями, тем самым объемнее данных нужно собрать. В случае если изменение обязано увеличить результат лишь примерно на несколько процентов, эксперименту нужно будет больше времени а также трафика. Расчетная значимость позволяет избегать принимать быстрые действия на базе временных изменений.
Объем выборки и длительность проверки
Масштаб выборки воздействует по части достоверность вывода. Если эксперимент видит очень небольшое число посетителей, заключения имеют шанс быть ненадежными. В частности, пять лишних кликов у первой аудитории способны показываться в виде прирост, но при значительном количестве станут простой случайностью. Поэтому перед запуском важно оценивать, какое количество людей 1 win а также конверсий необходимо с целью оценки идеи.
Продолжительность теста дополнительно имеет значение. Очень короткий тест способен не успеть отражать отличия среди будними и нерабочими сутками, дневной по времени и вечерней посещаемостью, разными источниками трафика. Обычно эксперимент должен захватывать полный период активности пользователей. Но при таком подходе чрезмерно продолжительный период проверки также неоптимален, в случае если окружающие обстоятельства могут существенно сдвинуться.
Зачем опасно изменять эксперимент в течение время проведения
Одна из типичных просчетов — вносить изменения по ходу тест после момента запуска. Когда по ходу середине теста поменять сообщение, аудиторию, интерфейс, условия демонстрации или метрику, показатели смешаются. Тогда окажется трудно понять, какой фактор именно повлияло в отношении эффект. Тест потеряет прозрачность, и заключения окажутся спорными 1win.
До момента запуском необходимо определить предположение, варианты, метрики, разбивку аудитории плюс критерии завершения. Вслед за начала правильнее не стоит корректировать тест без важной основания. Если выявлена неточность в настройке либо служебный проблема, разумнее прервать проверку, починить сбой а также начать новый проверку, нежели пробовать объяснять некорректные наблюдения.
Одновременное сравнение нескольких правок
В отдельных случаях появляется идея проверить одновременно несколько изменений: новый headline, другую CTA, упрощенную анкету а также измененный порядок секций. Подобный подход способен выдать суммарный результат, но не покажет раскроет, какой точно блок сказался в отношении показатель. В случае если обновленная вариация выиграла, сохранится неочевидно, что сработало лучше всего.
С целью корректной оценки как правило меняют один существенный элемент в 1вин одну проверку. В случае если необходимо сравнить несколько комбинаций, применяется мультивариантное тестирование. Оно многоуровневее, требует большего трафика и корректной расшифровки. Ради основной части задач A/B эксперимент с одной единственной ясной идеей дает намного более понятный плюс полезный результат.
Примеры A/B тестирования в UI
Внутри UI-средах А/Б тестирование нередко применяется для оптимизации понятности шагов. К примеру, можно сопоставить несколько версии анкеты: объемную с множеством элементов ввода и краткую с небольшим сокращенным комплектом сведений. Если краткая форма повышает количество оконченных регистраций без риска ухудшения качества заявок, этот вариант допустимо оценивать более удачной.
Следующий случай — тестирование формулировки CTA. Нейтральная надпись может стать менее понятной, по сравнению с конкретное объяснение результата. Кроме того тестируют расположение элементов действия, последовательность смысловых разделов, подачу 1 win подсказок, присутствие прогресс-бара, метод отображения ошибок плюс число шагов на протяжении процессе. Любой подобный объект сказывается в отношении степень того, насколько удобно выполнить целевое шаг.
А/Б проверка внутри содержании
Внутри материалах проверка помогает определить, какие headline-блоки, анонсы, схемы и типы сильнее сохраняют интерес. Получается проверять отличающиеся первые абзацы, длину текста, логику объяснений, присутствие списков, подачу элементов, представление преимуществ либо стиль объяснения непростой задачи. При этом существенно оценивать не только нажатия, а также также следующее поведение.
Название может увеличить количество кликов, однако когда содержание не совпадает интересам, увеличится процент отказов. Поэтому текстовые тесты обязаны анализировать качество взаимодействия: время просмотра, скролл, перемещения внутри ресурса, возвращения и совершение нужных результатов. Качественный эффект — это не только лишь привлечение интереса, вместо этого соответствие интереса плюс содержания.
A/B тестирование в email-кампаниях
На уровне email-рассылках обычно тестируют subject-строки рассылок, название отправителя, стартовые предложения, период рассылки, размер email, расположение элементов действия и формулировки предложений. Часть получателей получает одну версию сообщения, другая часть — тестовую. Вслед за этого анализируются open rate, переходы, отказы от подписки, негативные сигналы а также последующие действия внутри платформе.
Необходимо не сводить анализ показателем просмотров письма. Subject-строка email может стать выразительной а также получать реакцию, но когда тема не сможет соответствует контенту, нажатия плюс доверие способны уменьшиться. Следовательно корректный почтовый эксперимент оценивает полную воронку: открытие, переход, поведение сразу после перехода и отклик получателей касательно сообщение.
