데이터 분석/부트캠프

[패스트캠퍼스 데이터분석 부트캠프] 3주차 학습일지 - 케이스스터디 (스타벅스 서베이)

용이 (young) 2023. 7. 6. 23:56

3주차(7/3~ 7/7) 학습일지입니다. 이번주에는 실시간 강의에서 파이썬 기초 문법을, 온라인 강의에서는 기초/실전 중 선택하여 파이썬을 활용한 데이터 분석 강의를 수강하였어요! 

 

사실 저는 파이썬 기초를 이미 알고 있기 때문에 실시간 강의를 따라가는 데는 매우 수월했어요. 아직 실시간 강의에서는 데이터 분석까지 연관시켜서 수업을 진행하고 있지는 않아 아쉬운 부분이 있었지만, 대신 운영 측에서 제공해주는 강의를 통해 궁금했던 부분 중심으로 학습을 진행할 수 있었습니다 :) 

 

  • 이번주에 수강한 온라인 강의 - 한 번에 끝내는 데이터 사이언스 초격차 패키지, 직장인을 위한 데이터 분석 초격차 패키지 

한 번에 끝내는 데이터사이언스 초격차 패키지에서 진행한 케이스스터디 - 스타벅스 서베이 프로젝트에 대하여 정리해보도록 하겠습니다. 

 


본 케이스 스터디는 강의 내용 + 저의 생각으로 재구성하였습니다. 

 

🙄 스타벅스 이벤트 분석

시나리오 : 스타벅스는 자체적으로 운영하는 모바일 앱을 통하여 프로모션을 진행합니다. 유저들은 앱 푸쉬를 통한 프로모션에 대하여 어떻게 반응하고 있을까요? 최종 구매까지 도달하는 유저는 얼마나 많이 있으며, 그러한 유저들은 어떠한 특성을 가지고 있는지 분석하여 마케팅 부서에게 다음 프로모션 구상에 대한 인사이트를 제공하고자 합니다.  
  • 분석 목적: 1) 고객 반응 분석 2) 프로모션 개선방안 인사이트 제시 
  • 데이터 살펴보기 
    • Profile: 프로모션에 반응한 고객들의 개인 정보 
    • Transcript: 프로모션에 대한 고객들의 반응 (offer received, offer viewed, transaction, offer completed) 
    • Portfolio: 진행했던 각 프로모션에 대한 정보

보고서 목차  

  • 분석목적 및 데이터 살펴보기 
  • 문제해결 프로세스 정의 
  • Part 1 - 「데이터 확인 및 전처리」
  • Part 2 - 「EDA 및 분석」
  • Part 3 - 「인사이트 도출」

 

 

📌 Part 1 - 데이터 확인 및 전처리 

 

각 dataframe에 대한 기본적인 정보를 확인합니다 

(1) Data shape(형태) 확인
(2) Data type 확인
(3) Null값 확인 (※ 빈 값의 Data)
(4) Outlier 확인 (※ 정상적인 범주를 벗어난 Data)

Data 확인 

Transcript - 결측치 없음, value 컬럼 필요 시 dict로 처리 필요 

Profile - 확인 결과 gender 컬럼에 결측치 존재 

Portfolio 

 

Data 전처리 

고려해야 할 부분 (우선 순위)
1. profile : gender, income에 결측치 존재 ✅
2. transcript : value가 딕셔너리 형태 (key: offer_id, amount) - 보류
3. portfolio : channels가 리스트 형태 - 보류

transcript의 결측치는 이미 어떤 이유에 의해 처리된 것으로 보임, 따라서 다른 정보를 얻을 수 없으므로 drop 

 


📌 Part 2 - EDA 및 분석

설문 응답자 분석 

- Profile 데이터 활용
- 설문에 참여한 사람 중 정상적인 데이터로 판단된 데이터에 대한 분석을 수행
- 각 컬럼마다 원하는 통계량을 찾은 뒤, 해당 통계량을 시각화해줄 plot을 seaborn에서 가져와 구현

📍 어떤 값이 몇 개 있는지 보기 위해서는 sns.countplot 활용 

📍 정확한 수치를 보기 위해서는 [데이터프레임].[컬럼이름].value_counts() 

📍 평균적인 값을 보기 위해서는 pd.pivot_table 활용할 수 있음 

 

 성별 분석 

연령대 분석 

📍 age와 같이 고유값이 많은 경우는 countplot 대신 sns.histplot을 그릴 수 있습니다 

다시 확인해보니 age도 outlier 제거가 필요할 것 같습니다

 

회원가입 날짜 

수입에 대한 분석 


 

이벤트 분석

 

이벤트별 소요시간

 


📌 Part 3 - 인사이트 도출 

- 강의 내용을 기반으로 인사이트 도출까지 진행하고 있습니다. 

- 진행 중인 코드는 github에서 확인하실 수 있습니다. 

 

 

 


3주차 소감 

이번주는 컨디션 난조로 조금 힘들었습니다.. ㅎㅎ

저는 지금까지 EDA가 많이 어렵다고 느꼈는데, 온라인 강의에 케이스 스터디 자료가 잘 되어있어서 앞으로도 여러 번 연습해볼 수 있을 것 같아요. 

 

스타벅스 서베이 프로젝트는 제 관점을 더 녹여내서 완성해보도록 하겠습니닷 

 

 

 

#국비지원 #데이터분석 #데이터분석부트캠프 #패스트캠퍼스 #패스트캠퍼스데이터분석부트캠프 #패스트캠퍼스부트캠프 #학습일지