Skip to content

nikitabalakin/supervised-learning-project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 

Repository files navigation

Постановка задачи

Основная задача заключалась в построении модели классификации, способной прогнозировать вероятность снижения активности клиента в ближайшие три месяца. На основе этих прогнозов и данных о прибыльности клиентов необходимо было провести сегментацию для разработки персонализированных предложений. Используемые модели

В ходе исследования с использованием пайплайнов и подбора гиперпараметров были обучены и протестированы следующие модели:

KNeighborsClassifier (метод k-ближайших соседей);

DecisionTreeClassifier (дерево решений);

LogisticRegression (логистическая регрессия);

SVC (метод опорных векторов).

Результат применения

Лучшая модель: Наиболее эффективной оказалась модель SVC с ядром rbf и гиперпараметром C=1.0.

Метрики качества: На тестовой выборке модель показала высокие результаты:

F1-score: 0.91;

ROC AUC: 0.97;

Точность (Precision) для класса снижения активности: 0.95 (модель крайне редко ошибается, помечая лояльного клиента как уходящего).

Анализ важности признаков: Метод SHAP показал, что ключевыми факторами для прогноза являются длительность пользования сервисом, прибыльность клиента и объем выручки в текущем месяце.

Бизнес-рекомендации: Был выделен сегмент прибыльных клиентов с высоким риском ухода. Анализ показал их высокую чувствительность к акциям, в связи с чем им рекомендованы персонализированные скидочные предложения для сохранения лояльности.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors