데이터분석 5

[패스트캠퍼스 데이터분석 부트캠프] OT 솔직 후기 (기자단)

※ 본 포스팅은 패스트캠퍼스 데이터분석 부트캠프 9기 기자단 활동으로 작성되었습니다 안녕하세요! 오늘은 패스트캠퍼스 기자단 활동으로, 지난 6월 19일(부트캠프 첫날)에 진행하였던 OT에 대한 후기를 작성해보려고 합니다. 아무래도 부트캠프가 처음이고, 첫날이니만큼 긴장을 정말 많이 했는데요, 부트캠프 활동 전반에 대하여 알 수 있었던 날이라서 좋았던 것 같아요. 혹시 부트캠프를 앞두고 있으신 분들이라면 반드시 OT는 참여하시길 권장드립니다. 패스트캠퍼스 데이터분석 부트캠프(이하 BDA)는 100% 비대면, 실시간&온라인 강의 병행으로 이루어집니다. 실시간 강의의 경우는 zoom으로 카메라를 켜고 풀타임(보통 9-16)으로 진행하며, 온라인 강의는 패스트 캠퍼스의 강의를 활용하여 커리큘럼에 따라 자체적으로..

[아티클] PM/PO가 단 2개의 그래프만 봐야 한다면?

본 게시물은 PAP Community에 게시된 김민겸 님의 글을 정리한 포스팅입니다. 이 글의 작성자 분은 검색에 기반을 두는 광고 PM입니다. 서비스 특성 상 봐야 하는 키워드가 10만개에 달할 정도로 많아서 효율적으로 일하는 방법을 고민하다가 크게 2가지 그래프를 그려보는 방식을 채택하게 되었다고 설명하십니다. EDA의 목적은? 내가 작업할 대상과 데이터의 분포를 파악하는 것 1) 상자수염플롯 주요 통계량을 한번에 보여줌 하나의 그림으로 여러 가지 이야기를 할 수 있다 아웃라이어의 분포와 중위수를 보고 평균을 대푯값으로 설정해야 하는지 여부에 대하여 결정한다거나 2) 파레토 플롯 히스토그램의 상위버전 - 정해진 개수의 구간을 만들거나 적당한 수준의 구간을 자동으로 설정 관측값이 많은 구간 -> 적은 ..

[패스트캠퍼스 데이터분석 부트캠프] 1주차 학습일지 - 빅데이터 리터러시와 엑셀

이번주 월요일(6/19)부터 패스트캠퍼스의 ✨데이터분석 부트캠프✨과정을 시작하게 되었습니다. 앞으로 10월 27일까지, 약 4개월 간 4가지 툴(엑셀, Python, SQL, 태블로)을 배우고 기업연계 프로젝트를 포함해 총 4번의 프로젝트를 수행하게 됩니다! 사실 부트캠프를 할까말까 고민이 되었지만, 마침 상반기 취준을 끝내고 공백기가 생긴 상황이기도 했고 부트캠프 자체에 대한 호기심도 있었습니다. 여러 군데의 커리큘럼을 보고 고민을 하였는데, 다음의 이유로 패스트캠퍼스의 부트캠프를 선택하게 되었어요. 1) AI 전문가 양성이 아닌 데이터 분석 역량을 기르는 데 목적이 있다는 점 (데이터 분석 '목적'에 대해 강조하는 점) 2) 중요하다고 생각하는 툴이 모두 커리큘럼에 포함되어있는 점 3) 기업연계 프로..

[개인프로젝트] CLV(Customer Lifetime Value) 예측 - 데이터 전처리

이번 포스팅에서는 해당 데이터를 전처리한 과정을 소개합니다. 사용한 데이터는 kaggle의 e-commerce 데이터입니다. * 전처리 전체 코드는 여기에서 확인하실 수 있습니다. 📃 데이터 전처리 내가 원하는 분석을 하기에 앞서 먼저 데이터를 가공해야 합니다. 이번 프로젝트의 목적이 "CLV 예측"이라는 점을 유념하면서, LTV 예측 결과가 편향되지 않도록 전처리를 하려고 합니다. 보통 전처리 과정에서 outlier 등을 확인하기 위해 boxplot을 그려보거나, 데이터의 전체적인 분포를 보기 위해 간단한 groupby나 그래프를 그리면서 제가 분석할 데이터와 좀 더 친숙해지는 것 같아요. 어떤 순서로 데이터를 전처리하는 게 좋을까요? 물론 데이터 by 데이터/ 사람 by 사람이겠지만, 저는 아래의 순..

[개인프로젝트] CLV(Customer Lifetime Value) 예측 - 목표 및 계획

e-commerce 데이터를 이용한 인사이트 도출 연습 및 공부를 목적으로 진행한 프로젝트입니다. 본 포스팅에서는 프로젝트 1일차에 진행한, '프로젝트 목표 및 계획 수립'에 대한 내용을 담고 있습니다. 프로젝트 목표 고객이 다음에 얼마를 구매할지 예측할 수 있을까? LifeTime Value(LTV)는 현재 유저들의 미래 가치를 예측하여 중장기적인 성과를 측정하기 위한 지표입니다. "고객 생애 가치"라고도 불리는 LTV를 근거로 유저 유입 마케팅 예산을 적절히 책정하여 인앱 구매, 인앱 광고, 앱 구독과 같은 수입원의 흐름을 최적화하고 수익성을 유지할 수 있습니다. 데이터 분석가는 직접 지표를 정의하고 분석을 진행하기도 합니다. LTV는 중요하게 여겨지는 지표이고 저도 여러 번 들어본 적이 있는데, 직..