본 게시물은 PAP Community에 게시된 김민겸 님의 글을 정리한 포스팅입니다. 이 글의 작성자 분은 검색에 기반을 두는 광고 PM입니다. 서비스 특성 상 봐야 하는 키워드가 10만개에 달할 정도로 많아서 효율적으로 일하는 방법을 고민하다가 크게 2가지 그래프를 그려보는 방식을 채택하게 되었다고 설명하십니다. EDA의 목적은? 내가 작업할 대상과 데이터의 분포를 파악하는 것 1) 상자수염플롯 주요 통계량을 한번에 보여줌 하나의 그림으로 여러 가지 이야기를 할 수 있다 아웃라이어의 분포와 중위수를 보고 평균을 대푯값으로 설정해야 하는지 여부에 대하여 결정한다거나 2) 파레토 플롯 히스토그램의 상위버전 - 정해진 개수의 구간을 만들거나 적당한 수준의 구간을 자동으로 설정 관측값이 많은 구간 -> 적은 ..