Напишите нам
Оставьте ваши контактные данные и вопрос, и мы свяжемся с вами в течение одного рабочего дня.
*
*
*
*

Как обнаружить 70% оттекающих клиентов банка с помощью аналитики больших данных и ML

100 $ и больше — в среднем, тратит банк на привлечение одного клиента, согласно данным Unicom. Удержание базы обходится в разы дешевле, поэтому компании стремятся не только привлекать новую аудиторию, но и сохранять существующую. Главный вопрос — как найти тех, кто собирается уйти?
 
Ответ находится в клиентских данных, которые гигантскими массивами крутятся в процессах каждой энтерпрайз-компании. Eastwind проанализировал данные российского банка с помощью собственных ML-моделей и выявил оттекающих клиентов, когда на их решение ещё можно было повлиять правильным NBO (Next Best Offer).


Ключевые результаты



 

Зачем предсказывать отток

Предсказание оттока клиентов помогает:

●  снизить затраты на привлечение новых клиентов
●  повысить лояльность существующей базы
●  уменьшить финансовые риски, так как доход от долгосрочных клиентов легче прогнозировать
●  увеличить LTV клиента (Life Time Value)



Решение перейти в другую компанию формируется у клиента постепенно: вокруг него всё время мелькают предложения ваших конкурентов, подталкивающих к этому шагу. Аналитика больших данных позволяет выявить момент, когда сомнения только зарождаются у потребителя. Она фиксирует важные индикаторы поведения клиента, которые показывают, что он намерен уйти, но ещё не принял окончательное решение.
 

Формат проекта

В пилотном проекте с банком, чья база оценивается в сотни тысяч человек, наш заказчик хотел понять, насколько эффективно можно предсказывать отток клиентов и реально ли это сделать на ограниченном наборе данных. Специалисты Eastwind создали предиктивную модель, которая составила прогноз оттока, и затем сравнили результаты анализа с реальными данными.

В рамках пилота использовали EW DataFlow — платформу для работы с большими данными и моделями AI/ML. Проект прошёл в четыре этапа:
 
  1. Постановка задачи: каких именно клиентов ищем
  2. Сбор информации: какие данные нас интересуют
  3. Анализ данных: по каким признакам определяем потенциальный отток
  4. Подведение итогов: насколько точно составлено предсказание

Узнать больше про DataFlow


Первый этап: постановка задачи

Клиент выделял внутри своего банка три типа оттока:
 
  1. Преднамеренный: клиент решает перейти к конкуренту
  2. Ротационный: клиент уходит по не зависящим от него причинам — например, переезжает
  3. Принудительный: банк разрывает договор с клиентом

Вместе со специалистами банка мы приняли решение, что за оттекающих клиентов будем считать только первые две группы.

Затем мы определили, за какое время до фактической даты оттока ещё могут сработать меры по удержанию клиента. Установили, что за два месяца до предполагаемого ухода клиент уже обычно уверен в решении, и удержать его почти невозможно. Поэтому мы анализировали действия клиента за пять месяцев до оттока. Три из них — более ранние — вошли в модель машинного обучения (на схеме выделены зелёным).


Именно за первые месяцы произошли события, из-за которых клиент решил сменить банк. Нам нужно было выявить, что это за события и как отслеживать их заранее
 

Второй этап: сбор информации

После того, как мы определили, что именно считать оттоком и в какой момент его нужно предсказывать, мы начали собирать информацию для анализа.
 
  1. Банк выгружал из своих информационных систем данные о клиентах за 9 месяцев.
  2. Данные обезличивались и шифровались, чтобы исключить передачу персональной информации.
  3. Банк передавал специалистам Eastwind данные в текстовых файлах.
  4. Мы преобразовывали все файлы в необходимый формат и структурировали их для дальнейшей работы в EW DataFlow.


В обезличенном виде мы собрали историю клиентской активности:

●  общая информация о клиентах
●  общая информация о счетах клиентов
●  договоры с клиентами, в том числе тарифы
●  остатки на счетах и движение средств в разрезе каждого дня
●  переводы внутри банка и внешним контрагентам
●  операции с банковскими картами
●  коммуникации между банком и клиентами
●  заявки на закрытие счетов


Третий этап: анализ данных


Фильтрация

После сбора данных мы отфильтровали их и оставили только нужные для построения модели. Например, отсеяли неблагонадёжных клиентов, удерживать которых банк не планировал. Также исключили тех, у кого история операций составляет менее 30 дней.

После фильтрации в нашей базе осталось несколько сотен клиентов банка. По информации об их активности мы начали строить алгоритм обучения модели.
 

Подготовка обучающей выборки

Чтобы составить прогноз оттока, аналитики Eastwind сформировали обучающую выборку — это группа клиентов, о которых нам известно, оттекли они или нет. Мы визуализировали историю активности каждого участника выборки и сравнили графики поведения ушедших и не ушедших от банка клиентов.
 
Как меняются операции
Выяснилось, что количество операций у клиента, планирующего уйти, постепенно снижается. Как правило, у оттекающих клиентов более месяца отсутствуют дебетовые обороты и очень мало кредитовых оборотов.


Зелёные точки — кредитовые операции, оранжевые — дебетовые. Здесь и дальше на верхнем графике представлены операции клиента, который не планирует уходить; на нижнем — оттекающего
 
Как снижается активность
Если клиент регулярно пользуется услугами банка, его линия активности на графике далека от нулевой отметки. Чем реже активен клиент, тем он более склонен к оттоку.


У клиента, который хочет уйти (нижний график), активность становится близка к нулевой отметке
 
Как изменяется баланс
Ещё один маркер оттекающих — накануне ухода из банка клиент почти не пополняет баланс.


Черная линия отображает значения баланса, синяя — сглаживание черной линии. У оттекающего клиента пополнения счетов становятся всё более редкими и незначительными
 

Анализ активности

Помимо изучения финансовой активности, мы исследовали шаблоны поведения в группах клиентов: кто с кем взаимодействует и как часто. Для этого мы изучили их социальные графы.


Синими точками на графе отмечены клиенты банка-заказчика, красными — клиенты конкурентов. Транзакции между ними показаны линиями

Один из показателей потенциального оттока — отсутствие транзакций с клиентами того же банка. Если у человека отсутствуют взаимодействия внутри вашего банка, зато есть движение средств с другими контрагентами, то клиент склонен к оттоку. На графе это может выглядеть так:

«Заказчику особенно понравилась идея визуализации клиентских взаимодействий. По его словам, в традиционном формате не хватает наглядности, поэтому иногда сложно заметить очевидное. В рамках пилота мы написали небольшую программу, в которую можно ввести идентификатор контракта и посмотреть, с кем он взаимодействует».


Павел Олифер, директор по развитию Eastwind

Создание ML-модели

После формирования тестовой выборки мы разработали алгоритм машинного обучения для предсказания оттока. ML-модель анализировала клиентов, размеченных вручную, и выявляла закономерности в их поведении. В дальнейшем модель искала в базе всех существующих клиентов, чьё поведение соответствует этим паттернам. Так машина формировала прогноз, кто из существующих клиентов склонен уйти.
 

Четвертый этап: оценка результата

Результат нашей предиктивной модели мы оценивали постфактум: запросили в банке данные о клиентах, которые ушли к намеченной дате, и сравнили их совпадение с нашим прогнозом.

Заказчик остался доволен результатом предсказания и выкупил ML-модель для её дальнейшего масштабирования. Далее банку предстояло разработать комплекс мер, которые помогут удерживать оттекающих клиентов.

«Модель можно сделать еще точнее, если анализировать больше данных — например, полезной будет информация об активности клиентов в интернет-банке. А если мы будем знать эмоциональную окраску обращений, скорость обработки заявок и результаты опросов ушедших клиентов — сможем определять не только факт, но и предполагаемую причину оттока».
 

Андрей Плющенко, руководитель группы анализа данных Eastwind

Для каких ещё задач можно использовать EW DataFlow

Предсказание оттока — лишь один из тысяч возможных сценариев использования аналитики данных, которую банк смог провести благодаря EW DataFlow. Платформа даёт возможность по-новому взглянуть на маркетинг: 

— проанализировать активность клиентов,
— составить глубокий профиль для каждого пользователя,
— максимально точно сформировать таргет-группы,
— определить потенциальный фрод,
— выстроить NPTB-модели (Next Product to Buy).

И самое важное: всё это можно сделать из уже имеющихся у компании данных, без огромного штата специалистов по разным ресурсам. Все манипуляции с данными в EW DataFlow дата-сайентисты проводят внутри одной системы.

Заказать бесплатное демо EW DataFlow и обсудить задачи