분류 전체보기 30

[패스트캠퍼스: 데이터시각화] Weekly KPI Dashboard

* 본 포스팅은 기존 네이버블로그에서 2023-03-11에 작성한 글을 옮긴 것입니다. * [패스트캠퍼스] 세계 3등에게 배우는 실무 밀착 데이터 시각화 강의를 보고 진행한 예제 프로젝트입니다. [ 비즈니스 시나리오 ] 문제 정의: 전주 대비 성장률 및 타겟 달성률, 위클리 모니터링 및 관리의 어려움 목적: 지역별 매장의 위클리 KPI 와 타겟 달성 여부를 직관적으로 확인 1) 유저: 경영진, 결과형 대시보드 2) 기능: 비즈니스 목표 - 매출 신장 / 수익 향상 / 비용 절감 요구사항 - 전주 대비 KPI 성장률을, 트렌드에 따른 변화, 지역별 / 세그먼트별 필터링 기능 3) 디자인 메인 컬러 Blue (톤 조절해서 3단계로 나눔) 글꼴 통일 레이아웃 & 디테일- 필터 좌측 / 여백 컨테이너 활용 / ..

[python] 프로그래머스 완전탐색 - 모의고사

👀 문제 수포자는 수학을 포기한 사람의 준말입니다. 수포자 삼인방은 모의고사에 수학 문제를 전부 찍으려 합니다. 수포자는 1번 문제부터 마지막 문제까지 다음과 같이 찍습니다. 1번 수포자가 찍는 방식: 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, ... 2번 수포자가 찍는 방식: 2, 1, 2, 3, 2, 4, 2, 5, 2, 1, 2, 3, 2, 4, 2, 5, ... 3번 수포자가 찍는 방식: 3, 3, 1, 1, 2, 2, 4, 4, 5, 5, 3, 3, 1, 1, 2, 2, 4, 4, 5, 5, ... 1번 문제부터 마지막 문제까지의 정답이 순서대로 들은 배열 answers가 주어졌을 때, 가장 많은 문제를 맞힌 사람이 누구인지 배열에 담아 return 하도록 solution 함수를 작성..

알고리즘 2023.04.24

[개인프로젝트] CLV(Customer Lifetime Value) 예측 - 데이터 전처리

이번 포스팅에서는 해당 데이터를 전처리한 과정을 소개합니다. 사용한 데이터는 kaggle의 e-commerce 데이터입니다. * 전처리 전체 코드는 여기에서 확인하실 수 있습니다. 📃 데이터 전처리 내가 원하는 분석을 하기에 앞서 먼저 데이터를 가공해야 합니다. 이번 프로젝트의 목적이 "CLV 예측"이라는 점을 유념하면서, LTV 예측 결과가 편향되지 않도록 전처리를 하려고 합니다. 보통 전처리 과정에서 outlier 등을 확인하기 위해 boxplot을 그려보거나, 데이터의 전체적인 분포를 보기 위해 간단한 groupby나 그래프를 그리면서 제가 분석할 데이터와 좀 더 친숙해지는 것 같아요. 어떤 순서로 데이터를 전처리하는 게 좋을까요? 물론 데이터 by 데이터/ 사람 by 사람이겠지만, 저는 아래의 순..

[python] 프로그래머스 정렬 - H index

👀 문제 H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다. 어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다. 어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요. 🌻 아이디어 1) 내림차순으로 정렬 2) enumerate로 (index, value) 값 추출 / 이때 나보다 큰 애들 몇 개인지 알기 위해 start = 1 3) ..

알고리즘 2023.04.21

[python] 프로그래머스 정렬 - 가장 큰 수

👀 문제 0 또는 양의 정수가 주어졌을 때, 정수를 이어 붙여 만들 수 있는 가장 큰 수를 알아내 주세요. 예를 들어, 주어진 정수가 [6, 10, 2]라면 [6102, 6210, 1062, 1026, 2610, 2106]를 만들 수 있고, 이중 가장 큰 수는 6210입니다. 0 또는 양의 정수가 담긴 배열 numbers가 매개변수로 주어질 때, 순서를 재배치하여 만들 수 있는 가장 큰 수를 문자열로 바꾸어 return 하도록 solution 함수를 작성해주세요. 🌻 아이디어 str와 int의 정렬 기준이 다른 것을 활용 (numbers의 각 원소를 str로 변환) numbers의 원소가 < 1000이므로 각 원소*3을 정렬 기준으로 활용 리스트의 각 요소를 join으로 이어 붙임 ( https://bl..

알고리즘 2023.04.20

[개인프로젝트] CLV(Customer Lifetime Value) 예측 - 목표 및 계획

e-commerce 데이터를 이용한 인사이트 도출 연습 및 공부를 목적으로 진행한 프로젝트입니다. 본 포스팅에서는 프로젝트 1일차에 진행한, '프로젝트 목표 및 계획 수립'에 대한 내용을 담고 있습니다. 프로젝트 목표 고객이 다음에 얼마를 구매할지 예측할 수 있을까? LifeTime Value(LTV)는 현재 유저들의 미래 가치를 예측하여 중장기적인 성과를 측정하기 위한 지표입니다. "고객 생애 가치"라고도 불리는 LTV를 근거로 유저 유입 마케팅 예산을 적절히 책정하여 인앱 구매, 인앱 광고, 앱 구독과 같은 수입원의 흐름을 최적화하고 수익성을 유지할 수 있습니다. 데이터 분석가는 직접 지표를 정의하고 분석을 진행하기도 합니다. LTV는 중요하게 여겨지는 지표이고 저도 여러 번 들어본 적이 있는데, 직..

[python] 프로그래머스 스택/큐 - 프린터

👀 문제 일반적인 프린터는 인쇄 요청이 들어온 순서대로 인쇄합니다. 그렇기 때문에 중요한 문서가 나중에 인쇄될 수 있습니다. 이런 문제를 보완하기 위해 중요도가 높은 문서를 먼저 인쇄하는 프린터를 개발했습니다. 이 새롭게 개발한 프린터는 아래와 같은 방식으로 인쇄 작업을 수행합니다. 1. 인쇄 대기목록의 가장 앞에 있는 문서(J)를 대기목록에서 꺼냅니다. 2. 나머지 인쇄 대기목록에서 J보다 중요도가 높은 문서가 한 개라도 존재하면 J를 대기목록의 가장 마지막에 넣습니다. 3. 그렇지 않으면 J를 인쇄합니다. 예를 들어, 4개의 문서(A, B, C, D)가 순서대로 인쇄 대기목록에 있고 중요도가 2 1 3 2 라면 C D A B 순으로 인쇄하게 됩니다. 내가 인쇄를 요청한 문서가 몇 번째로 인쇄되는지 알..

알고리즘 2023.04.19

[python] 프로그래머스 스택/큐 - 올바른 괄호

👀 문제 괄호가 바르게 짝지어졌다는 것은 '(' 문자로 열렸으면 반드시 짝지어서 ')' 문자로 닫혀야 한다는 뜻입니다. 예를 들어 "()()" 또는 "(())()" 는 올바른 괄호입니다. ")()(" 또는 "(()(" 는 올바르지 않은 괄호입니다. '(' 또는 ')' 로만 이루어진 문자열 s가 주어졌을 때, 문자열 s가 올바른 괄호이면 true를 return 하고, 올바르지 않은 괄호이면 false를 return 하는 solution 함수를 완성해 주세요. 🌻 아이디어 stack을 이용 -> '(' 일 경우만 append ')'인 경우 -> stack에 '(' 이 없다면 False stack의 요소가 모두 소진되어야 함 ** 문자열 s의 길이 : 100,000 이하의 자연수 주로 stack 또는 queu..

알고리즘 2023.04.18

Case Interview Framework - 2편

Case Interview Frameworks Are Overrated! - MConsulting Prep 영상을 보고 작성한 글입니다. [목차] 0. 데이터분석가 준비생이 컨설팅을 왜 공부해야 할까? 1. Framework란? 2. Framework에 대한 4가지 오해 3. "Building-Block" Frameworks 3-1. Comprehensive Frameworks 3-2. Mini-Frameworks 3. "Building-Block" Frameworks 3-1. Comprehensive Framework 1) Profitability 충분한 정보를 얻을 때까지 profit을 수학적으로 쪼개나간다. Profit 감소 등의 case에서 적용할 수 있다. 목적은 다음과 같다. 문제를 결론짓기 ..

Case Interview Framework - 1편

Case Interview Frameworks Are Overrated! - MConsulting Prep 영상을 보고 작성한 글입니다. [목차] 0. 데이터분석가 준비생이 컨설팅을 왜 공부해야 할까? 1. Framework란? 2. Framework에 대한 4가지 오해 3. "Building-Block" frameworks 3-1. Comprehensive frameworks 3-2. Mini frameworks 0. 데이터분석가 준비생이 컨설팅을 왜 공부해야 할까? 데이터분석가의 궁극적인 목표는 비즈니스 문제를 해결하는 것이다. 데이터 자체가 목적이 되어서는 안된다. 데이터만 들여다보는 '데이터 덕후'는 위험하다. 때로는 복잡한 데이터 분석 과정을 거치지 않고도 EDA만으로도 문제가 해결되는 경우가 ..