프로젝트 2

[개인프로젝트] CLV(Customer Lifetime Value) 예측 - 데이터 전처리

이번 포스팅에서는 해당 데이터를 전처리한 과정을 소개합니다. 사용한 데이터는 kaggle의 e-commerce 데이터입니다. * 전처리 전체 코드는 여기에서 확인하실 수 있습니다. 📃 데이터 전처리 내가 원하는 분석을 하기에 앞서 먼저 데이터를 가공해야 합니다. 이번 프로젝트의 목적이 "CLV 예측"이라는 점을 유념하면서, LTV 예측 결과가 편향되지 않도록 전처리를 하려고 합니다. 보통 전처리 과정에서 outlier 등을 확인하기 위해 boxplot을 그려보거나, 데이터의 전체적인 분포를 보기 위해 간단한 groupby나 그래프를 그리면서 제가 분석할 데이터와 좀 더 친숙해지는 것 같아요. 어떤 순서로 데이터를 전처리하는 게 좋을까요? 물론 데이터 by 데이터/ 사람 by 사람이겠지만, 저는 아래의 순..

[개인프로젝트] CLV(Customer Lifetime Value) 예측 - 목표 및 계획

e-commerce 데이터를 이용한 인사이트 도출 연습 및 공부를 목적으로 진행한 프로젝트입니다. 본 포스팅에서는 프로젝트 1일차에 진행한, '프로젝트 목표 및 계획 수립'에 대한 내용을 담고 있습니다. 프로젝트 목표 고객이 다음에 얼마를 구매할지 예측할 수 있을까? LifeTime Value(LTV)는 현재 유저들의 미래 가치를 예측하여 중장기적인 성과를 측정하기 위한 지표입니다. "고객 생애 가치"라고도 불리는 LTV를 근거로 유저 유입 마케팅 예산을 적절히 책정하여 인앱 구매, 인앱 광고, 앱 구독과 같은 수입원의 흐름을 최적화하고 수익성을 유지할 수 있습니다. 데이터 분석가는 직접 지표를 정의하고 분석을 진행하기도 합니다. LTV는 중요하게 여겨지는 지표이고 저도 여러 번 들어본 적이 있는데, 직..