Постановка задачи
Основная задача заключалась в построении модели классификации, способной прогнозировать вероятность снижения активности клиента в ближайшие три месяца. На основе этих прогнозов и данных о прибыльности клиентов необходимо было провести сегментацию для разработки персонализированных предложений. Используемые модели
В ходе исследования с использованием пайплайнов и подбора гиперпараметров были обучены и протестированы следующие модели:
KNeighborsClassifier (метод k-ближайших соседей);
DecisionTreeClassifier (дерево решений);
LogisticRegression (логистическая регрессия);
SVC (метод опорных векторов).
Результат применения
Лучшая модель: Наиболее эффективной оказалась модель SVC с ядром rbf и гиперпараметром C=1.0.
Метрики качества: На тестовой выборке модель показала высокие результаты:
F1-score: 0.91;
ROC AUC: 0.97;
Точность (Precision) для класса снижения активности: 0.95 (модель крайне редко ошибается, помечая лояльного клиента как уходящего).
Анализ важности признаков: Метод SHAP показал, что ключевыми факторами для прогноза являются длительность пользования сервисом, прибыльность клиента и объем выручки в текущем месяце.
Бизнес-рекомендации: Был выделен сегмент прибыльных клиентов с высоким риском ухода. Анализ показал их высокую чувствительность к акциям, в связи с чем им рекомендованы персонализированные скидочные предложения для сохранения лояльности.