EDA 4

[아티클] PM/PO가 단 2개의 그래프만 봐야 한다면?

본 게시물은 PAP Community에 게시된 김민겸 님의 글을 정리한 포스팅입니다. 이 글의 작성자 분은 검색에 기반을 두는 광고 PM입니다. 서비스 특성 상 봐야 하는 키워드가 10만개에 달할 정도로 많아서 효율적으로 일하는 방법을 고민하다가 크게 2가지 그래프를 그려보는 방식을 채택하게 되었다고 설명하십니다. EDA의 목적은? 내가 작업할 대상과 데이터의 분포를 파악하는 것 1) 상자수염플롯 주요 통계량을 한번에 보여줌 하나의 그림으로 여러 가지 이야기를 할 수 있다 아웃라이어의 분포와 중위수를 보고 평균을 대푯값으로 설정해야 하는지 여부에 대하여 결정한다거나 2) 파레토 플롯 히스토그램의 상위버전 - 정해진 개수의 구간을 만들거나 적당한 수준의 구간을 자동으로 설정 관측값이 많은 구간 -> 적은 ..

[클론 프로젝트] 타이타닉 시각화/랜덤포레스트로 생존 여부 예측하기

본 게시물은 youhan lee 님의 유튜브 영상을 기반으로 클론코딩을 진행한 뒤 정리한 글입니다. (유튜브 링크: https://youtu.be/_iqz7tFhox0) 제가 작성한 전체 코드는 깃허브에서 확인하실 수 있어요. 🙄 Titanic 탑승객의 생존 여부를 예측해봅시다 목적: titanic 탑승객의 정보를 바탕으로 생존 여부 예측하기 결과물: 랜덤포레스트로 예측 모델 구현 (정확도 87%), 가장 중요한 변수: Fare로 나타남 python 시각화 연습과 분석 프로세스를 익히기 위해 진행한 클론 프로젝트입니다. titanic 데이터는 정말 유명하죠! 아마 데이터 시각화, 데이터 분석에 대한 강의나 이야기를 한 번이라도 들었다면 이 데이터는 아마 익숙할 것입니다. 저도 익숙하게 들어온 데이터셋이지..

[패스트캠퍼스: 데이터시각화] Sales Analytics Dashboard

* 본 포스팅은 기존 네이버블로그에서 2023-03-14에 작성한 글을 옮긴 것입니다. * [패스트캠퍼스] 세계 3등에게 배우는 실무 밀착 데이터 시각화 강의를 보고 진행한 예제 프로젝트입니다. [ 비즈니스 시나리오 ] 문제 정의: 매출 및 수익 감소 > 서브카테고리 수준 세부 분석 기존 충성 고객 경험 향상 필요 목적: 매출, 수익 전월 대비 성장률(+전년 동월 대비)의 서브카테고리 수준 분석 및 Top N 고객 현황 파악 ​ 1) 유저: 경영진, 결과형 대시보드 2) 기능: 비즈니스 목표: 매출 신장 / 수익 향상 / 고객 경험 향상 요구사항 1. 전월 대비 & 전년 동월 대비 비교가 가능할 것 2. 트렌드에 따른 변화를 함께 보여줄 것 3. 서브 카테고리별 / Top N 고객 분석 필요 3) 디자인..

[패스트캠퍼스: 데이터시각화] Weekly KPI Dashboard

* 본 포스팅은 기존 네이버블로그에서 2023-03-11에 작성한 글을 옮긴 것입니다. * [패스트캠퍼스] 세계 3등에게 배우는 실무 밀착 데이터 시각화 강의를 보고 진행한 예제 프로젝트입니다. [ 비즈니스 시나리오 ] 문제 정의: 전주 대비 성장률 및 타겟 달성률, 위클리 모니터링 및 관리의 어려움 목적: 지역별 매장의 위클리 KPI 와 타겟 달성 여부를 직관적으로 확인 1) 유저: 경영진, 결과형 대시보드 2) 기능: 비즈니스 목표 - 매출 신장 / 수익 향상 / 비용 절감 요구사항 - 전주 대비 KPI 성장률을, 트렌드에 따른 변화, 지역별 / 세그먼트별 필터링 기능 3) 디자인 메인 컬러 Blue (톤 조절해서 3단계로 나눔) 글꼴 통일 레이아웃 & 디테일- 필터 좌측 / 여백 컨테이너 활용 / ..