Выиграем или проиграем сделку?

Такой вопрос возникает каждый день или несколько раз в день у рядового продавца, руководителя продающего подразделения и ТОП-менеджеров компании, потому что не будет продаж означает, что не будет и бизнеса (премии, зарплаты и т.п.). Если такой вопрос возникал и у Вас, то ниже будет короткий текст о том, как можно искать ответ на этот вопрос с помощью методов машинного обучения или нейронных сетей.
Мы уже анализировали воронку продаж в одной из публикаций, поэтому возьмем оттуда только одну диаграмму с деревом решений, чтобы напомнить исходные условия.

Имеется информация о сделках:
Канал продаж/регион
Товарная группа/ подгруппа
Масштаб клиента по к-ву сотрудников/выручке
Наличие конкурента в продаже
Время на каждой стадии воронки продаж
К-во изменений стадии продаж
Выручка от клиента за последние два года
Сумма сделки и т.п.
Мы построили дерево решений и вывели правила классификации сделок.
Примеры правил классификации:
Если выручка от клиента за последние два года больше 1,5 млн. и сделка длится менее 10 дней, то вероятность успеха 60%, если больше 10 дней, то 37%
Если клиент ранее ничего не покупал, то вероятность успеха сделки 19%, длительность процесса роли не играет.
Если сделка продолжается менее 38 дней и сумма предыдущих покупок больше 0, но меньше 400 тыс., то вероятность успеха 80%
Если выручка от клиента за последние два года от 400 тыс. до 1,5 млн, и длительность менее 15 дней, то вероятность 73%, иначе 41%
И т.п.
Дерево решений и правила позволяют нам сделать первичную оценку влияющих факторов и их взаимосвязи, но не дают ответ на вопросы:
Какие факторы влияют на успешность сделки?
Насколько и как влияет тот или иной фактор?
Будет ли выиграна конкретная сделка?
Какова вероятность выигрыша конкретной сделки?
Какие факторы и насколько влияют на выигрыш конкретной сделки?
Поэтому обратимся к методам машинного обучения. Можем использовать random forest или нейронную сеть. В первом случае меньше времени уйдет на подготовку данных, но результат может быть менее точным. Для нейронных сетей данные необходимо готовить дольше, но и результат может быть гораздо лучше.
Покажем, что можно получить, используя метод random forest.
Разделим набор данных на две части в пропорции 80:20. Первую (большую) часть будем использовать для тренировки нашей модели, а вторую для тестирования.
Построим модель из 500 деревьев и посмотрим на результаты ее обучения.

Посчитаем матрицу неточностей (confusion matrix)

Как видим, точность модели в предсказании проигрыша сделки почти 88%, вигрыша - 73%. Неплохие показатели.
Начнем отвечать на вопросы, обозначенные в самом начале публикации.
1. Какие факторы влияют на успешность сделки?

Мы видим, что наибольшее влияние оказывает сумма денег, полученная от клиента за последние два года, а также факторы, связанные с длительностью сделки.
2. Насколько и как влияет тот или иной фактор?
Проведем корреляционный анализ и визуализируем результаты.

Перейдем теперь к конкретным сделкам.
Построим тепловую карту влияния параметров на сделки.

Мы видим наиболее значимые факторы, влияющие на успех конкретных сделок, например, №16 – вероятно будет выиграна:
•Новый клиент – снижает вероятность
•Прогноз завершения 65 дней – повышает вероятность
•Стадия идентификации больше 24 дней – снижает вероятность
•Изменение стадий продаж больше 3-х – повышает вероятность
•и т.п.
Для каждой сделки мы можем вывести такую диаграмму

Имея такие данные продавцу или руководителю будет проще работать с потенциальным клиентом потому, что в явном виде указаны риски и их величина. Например, мы видим, что главным барьером является новизна клиента. Значит необходимо в презентационных материалах уделить больше внимания вопросам надежности, квалификации, качества компании как поставщика. Предоставить клиенту больше фактических данных о качестве поставок, выполнения работ, качестве продаваемых товаров и т.п.
Такую же диаграмму можно построить по группе сделок (например, сгруппировав их по клиенту, или продавцу, или другому параметру)

И в самом конце мы можем вывести информацию по всем сделкам в фиде файла или передать ее в аналитическую систему, или систему отчетности или другую информационную систему.

Имея такие данные в информационной системе можно настраивать различные варианты бизнес-процессов и задач, которые будут зависеть от вероятности успеха сделки.
Также такая информация будет полезна для более точной настройки процессов прогнозирования продаж.
Как мы видим, использование методов машинного обучения для анализа и прогнозирования воронки продаж позволяет использовать полученные данные для улучшения уровня конверсии и точности прогноза продаж.
Требуется консультация по увеличению продаж на основе анализа воронки продаж и клиентской базы? Напишите нам или назначьте встречу.
#предсказательнаяаналитика #маркетинг #deeplearning #R #бизнес #продажи