Rfm анализ в продажах кейс. Применение RFM для базы данных корпоративных клиентов

Что это

RFM анализ - это метод анализа клиентской базы, основаный на поведенческих факторах группы или сегмента существующих клиентов.

RFM анализ позволяет оценить общее состояние базы, более эффективно организовать e-mail маркетинг и выгодно отличаться от большинства других методик наглядностью и простотой применения.

Как это работает?

Все просто. Клиентская база разбивается на сегменты по трем параметрам:

Recency (R) - давность последней покупки

То есть, сколько времени прошло со времени последней покупки в днях, неделях или месяцах. Рассчитывается от момента последнего заказа до текущей даты.

Сегменты разбиваются на 3 условные: хорошо - норма - плохо. Еще можно интерпретировать как:

«новички» - «пора покупать вновь» - «давно это было».

Так как бизнес у всех разный, то и условные «хорошо - норма - плохо» тоже будут у всех разные. У кого-то цикл повторных продаж 1 неделя, у кого то 1 мес., а у кого то и год. Поэтому в зависимости от вашей специфики бизнеса (или поставленных целей) вы можете настраивать свои «хорошо - норма - плохо» в нужных вам диапазонах.

Чтобы было проще определить, надо ответить для себя на несколько вопросов:

  • Какой естественный период покупки?
  • Какая сезонность?
  • За какое время большинство клиентов успевает совершить повторную покупку?
  • Какой период неактивности клиента можно считать, что мы потеряли клиента (длина жизненного цикла клиента)

Клиенты, которые недавно совершали у вас покупки, более предрасположены к повторным заказам, чем те, кто давно уже не проявлял никаких действий. Пользователей, которые покупали давно, можно возобновить только предложениями, которые привлекают вернуться обратно.

Frequency (F) - суммарная частота покупок

Показывает сколько взаимодействий (покупок) в заданный период времени было у вас с клиентом. Если обе стороны остались довольны - есть шанс поддержать частоту покупок или увеличить в свою пользу. Чем больше клиент совершал покупок у вас, тем больше вероятность, что он их будет повторять и в будущем. Обычно, этот показатель тесно взаимосвязан с давностью покупки.

Здесь также, как и в сегменте давность есть свои условные «хорошо - норма - плохо». Для кого то «хорошо» - это 10-20 покупок, «норма» 5-10, а «плохо» - 1-5. А кому то а для кого-то и 5 покупок - «очень хорошо!»

Вы можете настраивать это количество по своему усмотрению, в зависимости от поставленной цели.

Monetary (M) - объём покупок

Как и предыдущие показатели, рассчитывается за определенный период или количество взаимодействий. Показывает какой была так называемая «денежная ценность клиента», проще говоря - сумма денег, которая была потрачена клиентом у вас. Сгруппированные по денежным показателям анализы часто получают представление клиентов, чьи покупки отражают более высокую ценность для вашего бизнеса.

Все вышеуказанные показатели важно рассчитывать за период, который наиболее точно отобразит нужные данные. Допустим, можно взять выборку за один год и разделить её на кварталы.

Зачем нужен RFM анализ

Как правило, большинство клиентов слабо реагирует на общие рекламные предложения.

RFM является отличным методом сегментации клиентов для прогнозирования реакции клиента и улучшения взаимодействия с ним, а также повышение повторных продаж.

Этот метод использует поведение покупателей, чтобы определить, как работать с каждой группой клиентов.

Иногда встречается название RF сегментация, когда показатель Monetary не используется, потому что его значение часто зависит от Frequency.

Сегментация клиентской базы по такому принципу позволяет выделить тех с кем вам действительно надо работать, разделяя их на сегменты клиентов (активный, спящий, растущий), разрабатывая целевые маркетинговые предложения для:

  • Наиболее активной группы клиентов.
  • Тех клиентов, которым «уже пора опять покупать» - например, пора менять линзы или купить новую пачку корма, потому что прошел месяц
  • Кому мы хотим сделать «особенное» предложение
  • Кого мы рискуем потерять
  • Даже для тех, кого скорее всего уже потеряли (реактивация)

Не менее важно следить за количественным составом важных нам сегментов во времени. Например, хорошая новость, что растет ваш сегмент «Золотые» клиенты и плохая - сегменты «Риск потерять» и «Разовые клиенты» тоже растут.

Как это использовать?

Наиболее наглядно стратегию работы с каждым сегментом отображает следующая таблица.

Таб.1 Пример работы с RFM сегментами

Сегмент

Активность

Благодарность, научить пользоваться, рассказать о ваших основных плюсах

Активные

Обычный режим маркетинговой активности, плановая рассылка

Перспективные

Особое внимание

Приглашение в особый клуб, предложить особые условия и льготы, особый сервис

Не дать уйти

Программа лояльности, Удержание, реактивация

Разовая покупка

Напоминание, реактивация, новинки

Риск потерять

Реактивация, новинки, живой контакт - выявление проблемы

Стоит помнить, что это лишь один из примеров использования RFM сегментов. В каждом бизнесе свои особенности и одного универсального решения не бывает.

Несколько важных замечаний или советов:

  • Никогда не раздавайте скидки сразу после первой покупки (сегмент Новички). Ничего кроме потери прибыли это не даст. Главная задача на этом этапе - понравиться! Сервисом, продуктом, вниманием. Подсказать какие ваши продукты могут идеально дополнить покупку клиента
  • Внимательно отслеживайте количество клиентов в критически важных для вас сегментах: «Золотые», «активные», «Перспективные» и «Не дать уйти»
  • Сегмент «Разовая покупка» в большинстве торговых бизнесов - самый большой. Это нормально, хоть и надо стремиться к уменьшению доли этого сегмента

В другой статье. Я подготовил RFM анализ для нашего сервиса eSputnik, чтобы понять картину с нашими клиентами. Мне понравился этот метод, как очень простой способ визуализации поведения клиентов. Да, это было интересно, но очень скоро я понял, что в этой картинке нет практической пользы.

В цифрах вообще нет пользы, если они не меняют наших действий на завтра.

RFM анализ в email маркетинге

В этот раз я поделюсь с вами опытом и наблюдениями как извлекать пользу из RFM даже не имея трёхлетней истории продаж . Мы провели RFM анализ для десятков различных магазинов и столкнулись с рядом преград на пути к получению реальных результатов. До того как описать их все, давайте ещё раз вспомним, что нам даёт RFM. RFM анализ основан на 3 показателях:

  • R ecency - давность последней покупки
  • F requency - суммарная частота покупок
  • M onetary - средний чек

Мне кажется, показатель Monetary не обязательно привязывать к деньгам. Это может быть любой фильтр, наложенный на основные показатели этого метода: Давность и Частота. Например, для информационного портала можно взять время просмотра страницы или глубину просмотра страниц на сайте. RF матрицу можно рассматривать отдельно для разных типов клиентов, фильтруя по источнику клиента, по регионам, по категориям купленых товаров, по возрасту и многое другое.

Как провести RFM анализ?

Если разбить всех ваших клиентов по давности последней покупки на несколько групп и по количеству сделанных покупок, то можно построить матрицу из которой видно как разбить ваших клиентов по группам, на основании их активности:

  • Новички
  • Одноразовые покупатели
  • Растущие
  • Потерянные клиенты

На самом деле групп гораздо больше, но об этом потом. Обычно я строю шкалы по частоте и давности, по принципу: от плохого к хорошему. Получается:

  • По давности : слева те, кто покупал очень давно, а справа - кто покупал недавно.
  • По частоте: снизу те, кто сделал одну покупку, а сверху - много. Тогда визуально разделение групп будет выглядеть примерно так:

Об этом мы уже писали и раньше, но давайте посмотрим детальнее как разбить базу на группы и разметить шкалы, сколько групп выделить и что с ними делать дальше.

Самый важный показатель - «Давность». Чем больше времени прошло с момента последней продажи, тем меньше вероятность следующей покупки. И падает эта вероятность очень стремительно. Давайте разберёмся с «Давностью» с самого начала. К примеру, у нас есть 3 клиента (квадрат, круг, треугольник), и на графике мы отметим время когда каждый клиент делал покупку.

Важно , прошу прощения, я почему-то нарисовал график давности в обратном направлении от хорошего к плохому, исправлю, но чуть позже:(

Задача - определить сколько клиентов по «Давности» попадёт в каждый из периодов. Важно понимать, что давность - это показатель, который принимает во внимание только последнюю покупку, предыдущие покупки будут отмечены в частоте. Таким образом правильным ответом на задачку будет:

  • Период 1: 1 (только круг)
  • Период 2: 1 (только треугольник)
  • Период 3: 1 (только квадрат, потому что круг и треугольник покупали и после того)
  • Период 4: 0 (все делали покупку после этого)

И снова вопрос: какой из трёх вариантов лучше?

Часто я слышу что «красный (3)» - потому что он стабильный. На самом деле, он показывает что мы постоянно привлекаем клиентов, которые делают покупку и не возвращаются снова. Хорошо что показатель немного нарастает, но всё же «сиреневый (1)» - лучше. По нему видно, что большинство нашей аудитории недавно покупали и сильно вовлечены в процесс покупки. Конечно, самый плохой - «зеленый (2)» график.В этом случае у нас был всплеск активности (может быть Новый год или сильные инвестиции в контекст), а потом всё растеряли.

В большинстве книг по анализу, в том числе в популярном издании «Маркетинг на основе баз данных» Артура М. Хьюза, предлагается очень простой механизм разделения «Давности» по сегментам: отсортировать все контакты по давности и разбить на 5 равных групп. То же самое рекомендуется сделать и с Частотой и с Деньгами:

Этот способ работает и помогает разбить всех клиентов на: покупали только что, недавно, так себе, давно, очень давно относительно друг друга. Но что значит «когда»? Если мы не можем сказать точно «когда», то и оценивать эту группу тоже тяжело. Например, в соседние группы могут попасть контакты покупавшие в один и тот же день. Это лишь значит, что для одинаковых клиентов мы будем по разному себя вести... Зачем тогда вообще такой анализ? Всю глубину проблемы я постараюсь показать на двух примерах:

Пример 1 : В вашем магазине всё было хорошо, и вдруг в течение месяца ни одной покупки. Всё плохо, но если разбивать на равные части - ничего не изменится и всё те же последние покупатели попадут в сегмент «только что покупали».

Пример 2 : Если у вас ещё нет данных о продажах за несколько лет, а Вы только начали свой бизнес, то границы с каждым днём будут очень сильно отличаться и пользоваться результатом такого анализа вообще нет смысла.

Сезонности, акции и праздники тоже сильно влияют на общую картину.

Любой сегмент контактов, о которых вы не можете сказать что-то определённое - плохой сегмент

Мне кажется логичнее фиксировать не количество, а время. Тогда оптимизация количества в группах и будет нашей задачей. Надо как можно больше получить контактов в группе «только что» и как можно меньше «давно».

Осталось только определить какие временные пределы лучше выставить. Для этого надо ответить для себя на несколько вопросов:

  • Какой естественный период покупки?
  • Какая сезонность?
  • За какое время большинство клиентов успевает совершить повторную покупку?
  • Какой период неактивности клиента можно считать, что мы потеряли клиента (длина жизненного цикла клиента)

Для компаний, у которых нет данных, можно предположить эти периоды. Для компаний «с историей» очень помогут несколько графиков (о которых я расскажу дальше) с разницей между покупками.


Я привёл пример графика с разницей в месяцах между первой и второй покупками. У большинства магазинов он выглядит примерно также, как на рисунке. Тут видно, что 50% всех повторных покупок делаются в течение 2 первых месяцев. За полгода 75% процентов делают свой второй заказ и 90% из тех кто покупают снова - покупают в течение 13 месяцев. Какой из этого можно сделать практический вывод? Мне кажется, ненадо спешить давать скидку тем, кто купит и так, без нашей помощи. Предлагать скидку надо через 2 месяца после первой покупки. До этого надо показывать релевантные предложения, быть на слуху и главное - быть полезным клиенту.

Если построить матрицу разности между любыми соседними покупками, то получится примерно следующая картина:

Интересно, что разница между первой и второй покупкой всегда больше, чем между второй и третьей. А между второй и третьей больше, чем между третьей и четвёртой, но чем дальше, тем меньше влияет количество покупок на разницу между ними. Выходит, что вначале человеку надо время, чтобы поверить. Возможно, в следующий раз он попробует купить в другом месте или просто подождёт. Но чем чаще он покупает, тем время между покупками становится меньше. Джим Ново в своей книге Drilling Down говорит, что этот график сначала падает, потом стабилизируется, потом начинает расти. Это очень похоже на жизненный цикл клиента, когда он понемногу перестаёт быть клиентом, все реже покупая. Но я ни разу не видел этой картины на практике.

Важно : для получения этих цифр лучше использовать не среднее, а медиану. Сейчас быстро попытаюсь объяснить разницу. Среднее - это сумма всех значений делённая на их количество, а медиана - это значение элемента, который находится посередине в отсортированной последовательности. То есть гарантировано 50% всех значений меньше или равны медиане, и 50% больше или равны медиане. Медиана лучше среднего, потому что в средних значениях сильное влияние имеют «аномальные значения». Те значения, которые очень редкие, но сильно выходящие за пределы большинства. Обычно медианы значительно меньше средних.

Ещё хорошо бы посмотреть на сезонность - часто это 12 месяцев. Посмотрев на все цифры можно сделать вывод, какой период поставить для групп, например:

  • до 1 месяца
  • до полугода
  • до года
  • до двух лет
  • более двух лет

Но даже с таким подходом есть вопросы. А что если у одних клиентов естественный период покупки маленький, а у других большой? В таком случае я создаю каждому из клиентов профиль и для каждого профиля создаю свою градацию, которую нормализую по оси Давности в относительные категории:

  • ожидаемого времени покупки
  • если не купил - что-то странное
  • мы его теряем
  • мы его потеряли, но есть последний шанс
  • наверняка мы его потеряли

Точно такая же история и для «Частоты», только почти всегда у меня получается приблизительно одна и та же шкала. Те, кто сделали:

  • 1 покупку (этих большинство)
  • 2 покупки (преодолели психологический барьер и пришли снова, уже зная о том, как работает магазин)
  • 3-4 покупки (несмотря ни на что, продолжают покупать. Надо удержать любой ценой)
  • 5-15 покупок (поверили, на них вся надежда. Тут верхняя граница бывает очень разная)
  • больше 15 покупок (маньяки, часто это перекупщики, партнёры, т.п. К ним надо присмотреться отдельно)

Ну вот и весь RF анализ. Если посмотреть на матрицу RF, зная как разбиты сегменты, то сразу понятно кто такие новички: совершили одну покупку совсем недавно. Одноразовые - совершили покупку давно, и уже наверняка забыли об этом. Вряд ли они придут к нам снова. Джим Ново говорит, что таких клиентов всегда 50-60% от всей базы клиентов и с этим надо смириться. Я обычно вижу 70% от всей базе в этом грустном сегменте. Для того, чтобы убедиться, что сегмент грустный можно попробовать вернуть кого-то и для этого Джим Ново предлагает стратегию - «смириться», но если не верите, то начните с:

  1. Тех у кого несколько товаров в чеке
  2. Тех у кого чек больше
  3. Одноразовые покупатели, которые вернули товар - вероятнее придут к вам за второй покупкой, чем те, кто «всем доволен».

Если не удается их вернуть - вам никого не получится вернуть.

Единственная возможность вернуть покупателей за второй покупкой - обратиться к ним как можно быстрее. Но не слишком рано

Обратитесь слишком рано и будете навязчивым и будете предлагать лишние убийственные для бизнеса скидки.

Давайте посмотрим на RF в динамике. Интересно, что по шкале давности мы всегда начинаем с хорошего (только что купили) и скатываемся к плохому (давно не покупал). И как только сделана покупка, мы всегда возвращаемся снова в самый оптимистичный сегмент:

С частотой все наоборот. Начинаем всегда с самого плохого сегмента (1 покупка) и с каждой покупкой становимся лучше. Шансов вернуться обратно практически нет (если считать частоту за какое-то окно (например, 2 года), то частота может уменьшаться)

А теперь посмотрим на всю картину целиком в матрице RF:

Мы всегда начинаем в сегменте «Только что» и с «1 покупки». А мечтаем, чтобы все клиенты попали в сегмент VIP. И самый короткий путь для этого - постоянные покупки. Если со старта клиент ничего не делает, он «сползает» по Давности в «редко», в сегмент «Одноразовых клиентов». Наша цель - не дать ему уйти. Для этого и созданы автоматические реанимационные письма;)

Есть ещё один тонкий момент: что делать если пауза «затянулась» и клиент не покупал очень давно (значительно превышая жизненный цикл клиента). Мне кажется, в таком случае если он и придет к нам снова, то только если мы снова его «купим» контекстом, сео или разонравится тот магазин, где он все это время покупал. В любом случае к нам придёт совсем другой человек с другими интересами и возможностями. Поэтому мы предлагаем как в детской игре сделать «сброс».

Особенности такого подхода к RFM в том, что его можно применять в первый же день использования магазина. Сразу настроить триггера основанные на неактивности клиента. Следить за динамикой активности ваших клиентов. Кого вы теряете? Что надо сделать, чтобы вернуть клиентов тогда, когда это ещё возможно?

На этом я обзорную статью заканчиваю, и обещаю написать следующую, в которой постараюсь дать ответы на такие вопросы:

  • Как каждый из сегментов читает почту? Сегмент «потерянные» вообще реагируют на почту?
  • Какая доля в продажах каждого сегмента?
  • Какое типичное соотношение клиентов по сегментам?
  • Как изменяется стратегия работы с каждым сегментом?
  • Кому продавать, а кому не мешать покупать?

Хороших клиентов вам, пусть они все идут по самому короткому пути от Новичков в VIP:)

Офтоп: с тегом RFM на Хабре лишь 2 статьи, и обе из корпоративных блогов. Странно, почему так мало контента по тематике, ведь на Хабре много людей из e-commerce related area?

Однако, бросаю лить воду и предлагаю, для начала, договориться о терминах. Далее под RFM-анализом подразумевается анализ ценности клиента для компании. По сути, слегка продвинутый вариант ABC-анализа , только с фокусом не на товарах, а на клиентах. Во главу угла ставится формализация размера пользы каждого клиента для бизнеса. С целью выявления это пользы каждый клиент рассматривается по следующим параметрам:

R ecency - новизна (время с момента последней покупки)
F requency - частота (частота покупок за период)
M onetary - монетизация (стоимость покупок за период)

Дано :

1. История продаж интернет-магазина в виде.xlsx выгрузки, наподобие

Sic! Не ищите смысла в цифрах, все полу-рандомно изменено на 1-2 порядка

2. ТЗ от собственника, полная версия которого звучит не сложнее фразы «RFM-анализ сделать можешь?»

Результат :

Поначалу, полдня потратил на раздумья «Как все это сделать при помощи вычисляемых объектов сводной таблицы, чтобы было красиво». В итоге, забил на красоту и за час сделал с помощью промежуточного листа и обычных формул типа "=ЕСЛИ" и т.д.

3. Промежуточные вычисления

Для вычисления времени с момента последней покупки необходима текущая дата (стандартная функция в Excel =ТДАТА()) и дата последней покупки клиента. Поскольку выгрузка представляла собой неупорядоченный массив «Дата-Клиент-сумма_покупки», существовала сложность выявления последней даты покупки по каждому из клиентов. Проблема была решена сортировкой по всему объему дат в выгрузке (прошу не винить за «колхозный стиль», но в тот момент на красоту забил, так как хотел максимально быстро реализовать имевшееся в голове решение). Зеленым отмечены колонки первоначальной информации. В первой строке оставил формулы для понимания, а сортировал по колонке в порядке убывания (колонка создана при помощи сцепить)

4. Составные части листа «Итог»

Теперь собираем результат RFM-анализа на одном листе. Начинаем со списка клиентов (сортировка не имеет значения) - копируем с первого листа список клиентов оставляем только уникальные записи при помощи стандартного функционала (Данные - Удалить дубликаты). В колонку B при помощи ВПР тянем дату последнего заказа клиента. Формула в колонке С считает количество заказов клиента по всей выгрузке. В колонке D похожим образом считается сумма заказов по клиенту. А столбец E вычисляет для нас количество дней с момента последней покупки клиентом.


Sic! пример формулы для колонки E указан в ячейке K1, а в самом столбце E сохранены лишь значения для демонстрации результата

5. Recency (время с момента последней покупки)

Суть выделенной формулы в следующем: смотрим в каком из пяти равных промежутков от 0 до максимума (подсвечено в формуле красным) находится значение каждой ячейки колонки Е и проставляем оценку от 1 (клиент, купивший у нас нечто год назад) до 5 (клиент купивший что-либо в последнее время).

6. Frequency (частота покупок за период) и Monetary (cтоимость покупок за период).

Формулы идентичны, поэтому рассмотрим на примере Frequency. В данном случае мы разделили всю совокупность на 3 равных по количеству членов совокупности промежутка и смотрим к какому из этих промежутков относится значение в колонке С с выставлением оценок 1(клиент покупающий у нас реже остальных), 3, 5 (клиент покупающий у нас чаще остальных).

Для тех кому сложно или лениво понять определение медианы в википедии : медиана - это значение, делящее совокупность данных на 2 равные по количеству части. Пример: cреднее арифметическое значение 5 клиентов совершивших 1, 2, 2, 2, 100 покупок = 21,4 (ничего не говорящая нам средняя температура по больнице); медиана для этого же ряда = 2.

Заключение : про сложение всех показателей вместе и сортировку в порядке убывания самой правой колонки листа «Итог» писать не стал - думаю, итак понятно)) Моя цель - создать систему «на коленке», была полностью достигнута. Отдаю «как есть» . Дописывая эти строчки понимаю, что мое определение медианы и пример тоже не самые легкие (для тех у кого не было в университете мат.статистики). Если кто предложит более простой и понятный вариант - заменю.

С тех пор как в компании Mindbox впервые произнесли Machine Learning, общей целью стала Большая Зеленая Кнопка. Это такая кнопка во весь экран, при нажатии на которую всё работает само и приносит прибыль.

В аналитическом проекте «RFM» цель менее амбициозная — Маленькая зеленая кнопка. Нажимаешь, и база автоматически делится на сегменты, по которым запускается отправка писем (например).

Новая кнопка в нашей системе

Чтобы добиться цели, мы написали автоматический RFM-сегментатор и разработали специальный отчет, чтобы наглядно представлять результаты.

Рассказываем, как это все случилось и почему теперь можно обойтись без аналитиков уделять больше времени менее тривиальным задачам.

Что такое RFM-анализ

Результат email-рассылки зависит от охвата аудитории и качества самой рассылки. Бесконечно увеличивать охват нельзя, а значит, нужно увеличивать качество. Для этого рассылку нужно персонализировать, так как все люди разные и каждому нужно что-то свое.


Потребителей обычно много, сделать индивидуальное письмо под каждого сложно. Чтобы справиться с проблемой, маркетологи делят потребителей на группы — сегменты.

Делить можно по-разному. Один из вариантов — RFM-анализ .

То есть RFM-анализ — это способ сегментации. Сегментами называются непересекающиеся группы потребителей. RFM-анализ предлагает для каждого покупателя выделить три признака:

  • R (Recency) — насколько давно клиент сделал последний заказ.
  • F (Frequency) — сколько всего заказов сделал клиент.
  • M (Monetary) — сколько денег клиент потратил.

Многие маркетинговые компании делают и используют RFM-анализ. Мы в том числе. В статье про RFM-сегментацию рассказали, какой отчет умеем делать, и как он может помочь маркетологам.

Существующие подходы к RFM-анализу

Существующие подходы к RFM-анализу у всех примерно схожи.

Клиентов делят на группы по каждому признаку. Обычно таких групп не больше пяти. Пересечения групп называют сегментами.

Так выглядит сегментация потребителей с помощью RFM-анализа. Здесь каждый признак разбит на три группы, а некоторые группы разбиты на подгруппы

Например, при делении на четыре группы по каждому из трех признаков образуется 64 (4x4x4) сегмента потребителей, а на пять — уже 125 сегментов.

Основная сложность — определить границы групп, потому что нет определенного правила, как это делать.

Рассмотрим наиболее популярные подходы на примере одной базы клиентов:


Пример распределения потребителей по количеству потраченных денег (M) и давности последнего заказа (R)

Мы используем только два измерения (R и M) из трех для удобства восприятия.

В нашем примере:

  • Сумма покупок лежит в диапазоне от 0 до 15 тысяч рублей.
  • Давность покупки лежит в диапазоне от 1 часа до 240 дней.

Подход 1. Разделение на равные части по диапазонам значений

При этом подходе разделение делается исходя из из значений признаков. В нашем случае выделяем три группы по тратам: до 5 тысяч рублей, от 5 до 10 тысяч и от 10 тысяч. И три группы по давности срока покупки: до 80 дней, от 80 до 160 дней, от 160 дней.

Получаем девять сегментов.


При разделении на равные части по диапазонам значений в «угловой» сегмент попадает бо́льшая часть потребителей

Плюсы метода:

  • Легко автоматизировать.
  • Можно выявить «самых-самых»: покупающих больше всех, чаще всех и не покупавших дольше всех.

Минусы метода:

  • Распределение по группам неравномерное: в примере 86% потребителей в одном сегменте, 13% — во втором, 1% распределился по оставшимся семи сегментам.
  • Много сегментов (помним, что даже при разделении на 3 части по каждому признаку, сегментов будет 27).

Подход 2. Разделение на равные части по количеству потребителей

При таком подходе разделение по каждому признаку выполняется так, чтобы в группы попадало одинаковое количество потребителей.

Вот так распределяются покупатели из нашего примера (по-прежнему делим на три части по каждому признаку):


При разделении на равные по количеству людей группы в один сегмент могут попасть как клиенты, потратившие тысячу рублей, так и клиенты, которые потратили 15 тысяч рублей

Плюсы метода:

  • Легко автоматизировать.
  • Обычно, нет сильного дисбаланса между группами.

Минусы метода:

  • Плохо выделяются «особые» клиенты.
    В примере в одном сегменте оказались потребители, купившие на 1 тыс. рублей и на 15 тысяч. При этом те, кто покупал на действительно крупные суммы, в отдельную группу не выделились (в отличие от предыдущего метода).
  • Количество групп по каждому признаку одинаковое.
  • Много сегментов.

Подход 3. Ручной

Аналитик изучает базу данных и подбирает правильное разделение.

Плюсы метода:

  • Хорошее разделение на сегменты.

Минусы метода:

  • Нужен специалист.
  • Нужно много времени.

RFM-отчет одной кнопкой с помощью Machine Learning

Мы решили избавиться от недостатков старых подходов. Для этого пришлось прибегнуть к алгоритмам .

Используя методы кластеризации, мы автоматически определяем, сколько же на самом деле сегментов потребителей в базе и что это за сегменты. А с помощью решающего дерева приводим эти сегменты к удобному для восприятия виду. Как это работает, рассказали в статье про устройство сегментатора .

Для примера выше мы получили вот такой результат:


Чтобы все это было удобным и понятным для маркетологов, мы разработали отчет, в котором удобно и понятно (как нам кажется) описаны результаты сегментации.

Чтобы получить его, достаточно нажать одну кнопку — и система все сделает сама.

Отчет помещается на одну страницу и состоит из трех таблиц.

Часть 1. Оценка состояния базы

Первая таблица — сводная. В ней собрана информация по всем сегментам базы, полученная на основе RFM-анализа. Ключевые показатели: активность потребителей в сегменте и их ценность.

Активность определяется давностью последней покупки, а ценность — потраченной суммой.

Каждый сегмент относится к одной из категорий. В каждой категории может быть несколько сегментов или вообще не быть ни одного. В ячейках указано общее количество потребителей из всех сегментов категории.

P.S. Здесь выражения “Отток” и “Риск оттока” используются как сокращения для “Давно не покупавшие клиенты” и “Клиенты, покупавшие среднее количество времени назад” и не означают отток в прямом смысле этого слова. Аналогично, “Активные” — обозначение для “Клиенты, недавно сделавшие покупку”.

В примере выше 80% клиентов не имеют покупок, почти треть высокоценных — в оттоке, еще треть — в группе риска.

Оценка состояния базы помогает выбрать категорию, с которой важно работать в первую очередь.

Чтобы показать, как пользоваться отчетом, возьмем клиентов с высокой ценностью, то есть клиентов, потративших больше всего денег.

Часть 2. Изучение сегментов

Во второй таблице отчета выводятся: размер сегментов, оборот, то есть сумма, потраченная всеми потребителями в сегменте, и средний чек.

Все сегменты потребителей представляются списком. Например, вот список сегментов покупателей, имеющих покупки.


В нашей базе получилось 12 сегментов покупателей с покупками

Чтобы вывести в отчет только потребителей с высокой ценностью, используем фильтр.


Так выглядит настройка фильтра для поиска сегментов потребителей с высокой ценностью

В результате применения фильтра получаем семь сегментов потребителей с высокой ценностью.


Результат применения фильтра для поиска сегментов потребителей с высокой ценностью

На основе этой информации можно сделать разные выводы.

Например, сегмент №2 имеет значительно больший оборот, чем другие, при умеренном среднем чеке. Это говорит о большом числе покупок потребителей в этом сегменте и их высокой лояльности. Не опасаясь оттока клиентов, им можно рассылать письма и рассказывать, например, о новинках.

Теперь обратим внимание на средний чек: сегмент №7 с самым большим средним чеком находится в оттоке, а сегмент №9 со вторым по величине средним чеком — в группе риска. Потребители из данных сегментов готовы покупать на крупные суммы, но не покупали уже давно. Возможно, имеет смысл побудить их к действиям с помощью промокода или информационного письма.

Изучение сегментов нужно, чтобы понять, с какими сегментами стоит усиленно поработать.

Часть 3. Детальная информация по сегментам

В последней таблице показаны границы сегментов по каждому признаку (R, F, M) и средние значения по ним


Подробное описание в третьей таблице помогает получить больше информации по заинтересовавшим сегментам. Например, из этой таблицы видно, что потребители из сегмента №2 действительно имеют больше покупок, чем другие — в среднем 12

Нам нужно выбрать, с каким сегментом мы хотим работать первым. Допустим, нас заинтересовали сегменты с самыми большими средними чеками: №7 и №9. Рассмотрим их подробнее.

В сегменте №7 клиенты не делали покупки почти год — вернуть их будет нелегко. Но, возможно, попробовать стоит, поскольку в среднем потребители из данного сегмента покупали 2,1 раза — это значит, что первая покупка их не разочаровала. Вполне вероятно, что хорошая скидка поможет им снова активно заинтересоваться брендом.

С сегментом №9 проще — средняя давность покупки у клиентов из него составляет всего три месяца, а среднее количество покупок — 2,8. Скорее всего, эти клиенты достаточно лояльны и не требуют по отношению к себе никаких действий. Но можно отправить письмо с рекламой или небольшой скидкой, чтобы напомнить о бренде.

Когда сегменты для дальнейших действий выбраны, можно запускать нужные маркетинговые кампании.

До настоящей Зеленой Кнопки осталось совсем немного

Мы создали автоматический RFM-сегментатор и остались довольны — нужно 20 секунд времени человека, чтобы получить распределение базы клиентов по сегментам.

Мы собираемся автоматизировать настройку маркетинговых кампаний для сегментов, чтобы человеку и на это не нужно было тратить время.

Конечно, жалко будет, что никому больше не понадобится наш отчет, но технический прогресс не щадит никого.

Команда Mindbox

Специалист по машинному обучению

Лана Шакирова
Контент-маркетолог

Каждый предприниматель в процессе развития бизнеса сталкивается с вопросом: как сделать своего клиента более лояльным и не дать ему уйти к конкуренту?

Существует два типа данных, которые можно узнать о покупателях: кто они такие (демографические данные) и что они делают (поведенческие данные). Как правило, маркетологи пытаются предугадать именно поведение клиентов. Ведь если вы планируете продать товар или услугу своим клиентам, то знание, что кто-то из них недавно приобрел несколько предметов общей стоимостью 10000 рублей, ценнее, чем знание их возраста, дохода, семейного положения или другой подобной информации.

Обычно для предсказания поведения клиентов специалисты по директ-маркетингу используют RFM-анализ. Главным становится вопрос, как формализовать размер пользы, принесенной каждым клиентом. Для этой цели изучаются три показателя:

  • Recency - давность продажи (сколько времени прошло с момента последней покупки клиента);
  • Frequency - частота покупок (общее количество покупок в периоде);
  • Monetary - сумма продаж за всю историю (иногда используют средний чек).

Причем, показатель Monetary не обязательно привязывать к деньгам. Это может быть любой фильтр, наложенный на основные показатели этого метода: Давность и Частота. Монетизацию не всегда удается свести к покупкам. Например, для информационного портала можно взять время просмотра страницы или глубину просмотра страниц на сайте.

Как правило, процент покупателей, реагирующий на общие рекламные предложения, невелик. RFM-анализ – это простой и, в то же время, эффективный метод. Используя его, можно предсказать реакцию покупателя, улучшить взаимодействие и повысить прибыль. В зависимости от принадлежности клиента к одной из выделенных групп применяются разные способы воздействия. Важность показателей ранжируется согласно последовательности: Давность, Частота, Сумма продаж.

Применение RFM для базы данных частных клиентов

Рассмотрим небольшую компанию по продаже учебных пособий, которая использовала RFM-анализ для извлечения максимальной прибыли с каждого покупателя. Ежегодно лето всем клиентам рассылались письма с предложением приобрести их продукцию. Затраты на рассылку составляли 15 руб. на одно письмо, прибыль же от каждой продажи - 550 руб. Таким образом, чтобы оправдать затраты на рассылку, необходимо получать более 3% откликов. Но на протяжении нескольких лет доля откликов не превышала 1,6%, что не давало прибыли. Применив RFM, всю существующую базу данных клиентов разбили по 125 ячейкам (5х5х5) и определили долю откликов по каждой из ячеек. Далее рассылку писем стали осуществлять по ячейкам с долей откликов более 3%, что позволило компании в итоге получить прибыль.

Стоит отметить, что непрерывное использование RFM-анализа не пойдет на пользу бизнесу. Если постоянно его применять для решения вопроса: кому из клиентов написать или позвонить, - то некоторые из них вообще никогда не получат от вас известий, а другие - наиболее активно реагирующие, будут испытывать усталость от постоянного внимания, поскольку вы будете связываться с ними слишком часто. Необходимо разрабатывать стратегию контактирования и подумать, с каким предложением можно обратиться к менее восприимчивым клиентам, просто чтобы они знали, что о них помнят.

На практике встречается упрощенный RFM-анализ, который называют RF-сегментация, когда показатель Сумма продаж не используется, потому что его значение часто зависит от Частоты. С помощью такого анализа несложно выделить тех, с кем нужно проводить активную работу, и именно для них разрабатывать специальные предложения.


Применение RFM для базы данных корпоративных клиентов

Рассмотрим применение RFM-анализа к базе данных корпоративных клиентов. Такая база, в большинстве случаев, гораздо меньше базы частных клиентов, и можно прибегнуть к сокращению количества групп. Например, для базы в 10000 записей 125 ячеек RFM-анализа будут иметь всего 80 записей в каждой ячейке, а этого мало для получения статистических результатов. Сократим количество RFM-ячеек до 20 с уменьшенным количеством групп, отсортированных по Частоте и Сумме продаж. Например, 5 - по Давности покупки, 2 - по Частоте и 2 - по Сумме продаж.

В теории RFM-анализа предполагается очень простой механизм разделения Давности, Частоты и Суммы продаж по сегментам: отсортировать все контакты и разбить на 5 равных групп для каждого показателя. Этот способ работает и помогает разбить всех клиентов относительно друг друга на:

  • покупали только что
  • недавно
  • давно
  • очень давно

Но на практике возникает проблема изменения этих показателей во времени.

Бизнес развивается хорошо, но вдруг в течение месяца не совершается ни одной покупки - это плохо. Но если разбить базу данных на равные части - ничего не изменится и всё те же последние покупатели попадут в сегмент «покупали только что».

Новый бизнес ещё не имеет данных о продажах за несколько лет. В этом случае границы с каждым днём будут сильно отличаться и пользоваться результатом такого RFM-анализа вообще нет смысла.

Сезонности, акции и праздники тоже сильно влияют на качество анализируемых данных. Поэтому время стоит фиксировать. Для того, чтобы определиться какие временные интервалы лучше выставить, стоит ответить для себя на ряд вопросов:

  • Какая длина жизненного цикла клиента?
  • Какой естественный период покупки?
  • Какая сезонность?
  • За какое время большинство клиентов успевает совершить повторную покупку?

Действенность RFM-анализа совсем не означает, что он может полностью заменить менеджера по продажам. Личное общение с заказчиком позволяет сотруднику хорошо понимать его и многое знать о нем. Правильно будет сосредоточить внимание менеджера на ключевых клиентах, а с остальными вести работу по электронной почте, с помощью сообщений и социальных сетей. RFM-анализ в этом случае становится отличным инструментом, помогающим провести сегментацию покупателей.



Поделиться