데이터의 바다로, 긴 항해를 떠나면서 | 시각화 분석 사이클을 이해하다. 데이터 분석으로 무엇을 해결할지 정의한다 (Task)태스크를 따라 사이클을 빠르게 돌린다 ▶ Get Data : 필요한 매출 데이터를 수집한다. ▶ Choose Visual Mapping : 제품 카테고리별 매출을 시각화한다. ▶ View Data : 제품 카테고리별 매출 규모와 이익을 본다 ▶ Develop Insight : 매출에서 중간 규모의 하위 카테고리 'XX' 의 이익이 적자라는 사실을 알았다. ▶ Art/Share : 결과를 공유해서 이익을 개선하기 위한 행동을 촉구한다. 시각화 분석 사이클을 수행하는데 필요한 요점 정리 각 단계를 간단히 조작하고 빠르게 응답함으로써 사고의 플로우가 단절되지 않도록 한다전체 사이클 ..
21세기 미래 역량, 4C Communication 의사소통 능력, Collaboration 협업 능력, Critical thinking 비판적 사고, Creativity 창의성 이 네가지의 앞 글자를 따서 4C 라고 하며, 이것들을 '미래 역량' 이라고 합니다. Communication 의사소통 능력 에서 의사소통을 정의하는 글에서는 '공유Sharing가 핵심 키워드 입니다. 생각과 질문, 아이디어와 문제 해결 방법을 함께 나누는 것이 의사소통 이라고 설명하고 있습니다. Critical thinking 비판적 사고 어떤 문제를 새로운 관점으로 바라보고, 기존에 알고 있던 과목과 다른 학문들을 서로 연결시킬 수 있는 역량이 바로 비판적 사고라고 설명합니다. Creativity 창의성 , 창의성이란 무언가..
우리는 팀으로 일합니다. 팀원들 각자 서로 잘하고 즐기는 분야가 다르기 때문입니다. 팀원의 구성과 성향이 다양할수록 더 좋은 팀이 될 확률이 높습니다. 팀원들이 각자 최고의 능력을 발휘할 수 있는 역할을 맡아 수행하며 서로의 역할을 존중하고 지식과 경험을 공유함으로써, 팀의 생산성은 올라가고 팀원 모두 성장 할 수 있습니다. 하지만 팀으로 일한다는 것이 쉬운 일은 아닙니다. 사람마다 커뮤니케이션 방식도 다양해서, 서로 선호하는 방식이 다르기라도 하면 피로가 누적됩니다. 누구는 텍스트 기반의 메시지를 선호하고, 누구한테는 이메일을 보내면 전화가 걸려 오고, 누구는 얼굴 보고 이야기해야 진정한 커뮤니케이션 이라고 생각합니다. 또한 사람마다 상식과 기준이 다르기 때문에, 오해가 생기고 감정을 다치기도 합니다...
2024.03.19 - [분류 전체보기] - 당신을 야근에서 구해줄 무기 데이터 리터러시 매출을 이루는 과정의 퍼널 분석에 집중한다면 어느 페이지에서 고객 이탈이 가장 많이 이루어졌는지를 통해 이탈을 막는 설계로 이어질 수 있습니다. 결국 매출을 위해 내가 할 수 있는 액션이 무엇인지에 따라 매출을 바라보는 방식이 모두 다를 수 밖에 없습니다. 마케팅을 담당하는 부서라면 광고 집행 비용 대비 매출이 나오는 채널이 어디인지 알고 해당 채널에 집중할지, 아니면 신규 고객이 많지만 광고 집행 비용 대비 매출이 적은 채널에 다른 방식으로 콘텐츠 마케팅을 할지 정 할 수있겠죠. 매출액 구매 고객수 X 고객당 구매액 상품 카테고리 X 카테고리별 매출 유입채널 X 유입채널당 매출 유입 고객 수 X 구매 전환율 ※ 매..
이상치(Outlier) 란 보통 관측된 데이터 범위에서 많이 벗어난 아주 작은 값 혹은 큰 값을 말해요 . 1. Extrems Studentized Deviation(ESD) 이용한 이상치 발견 데이터가 정규분포를 따른다고 가정할 떄, 평균에서 표준편차의 3배 이상 떨어진 값 모든 데이터가 정규 분포를 따르지 않을 수 있기 때문에 다음 상황에서는 제한됨 -데이터가 크게 비대칭 일 때 , 샘플 크기가 작을 경우 2. IQR (inter Quantile Range) 를 이용한 이상치 발견 ESD 와 동일하게 데이터가 비대칭적이거나 샘플사이즈가 작은 경우 제한됨 Box plot : 데이터의 사분위 수를 포함하여 분포를 보여주는 시각화 그래프, 상자-수염 그림이라고도 함 사분위 수 : 데이터를 순서에 따라 4등..
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd tips_df = sns.load_dataset('tips' tips_df.head(3) tips_df.describe(include = 'all') tips_df.head(3) #X축, Y 축에 필요한 정보를 넣어서 시각화 #범주형 데이터, 연속형 자료형, 관측치 Y 축 sns.countplot(data =tips_df, x ='day' barplot : X축이 범주형, Y축이 연속형 값 sns.barplot(data = tips_df, x ='sex', y = 'tip', estimator = 'mean') sns.boxplot(data = tips_df, x='time..
탐색적 데이터 분석 (EDA) 탐색적 데이터 분석 (Exploratory Data analysis, EDA ) 는 데이터의 시각화, 기술통계 등의 방법을 통해 데이터를 이해하고 탐구하는 과정 입니다. 이 과정에서 데이터에 대한 정보를 얻을 수도 있고, 적절한 모델링에 대한 정보도 얻을 수 있습니다. 예측 모델링이 아니더라도 데이터 분석에서는 반드시 필요한 과정입니다. 다만, 이전 데이터 분석과 시각화 강의에서 들었다고 가정하고 시각화는 Seaborn 라이브러리를 활용 간단하게 알아보도록 할게요. tips.describe() - include='all' 옵션을 통해 범주형 데이터도 확인 가능 1.countplot : 범주형 자료의 빈도 수 시각화 방법 : 범주형의 데이터의 각 카테고리별 빈도수를 나타낼 때..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 데이터분석가
- 아무일 없는것처럼
- 프로덕트 분석가
- 그로스 해킹
- 데이터 리터러시
- 프로덕트 매니저
- ADsP
- 데이터 분석 주니어
- 설레다
- 데이터 분석
- PM
- 아하 모먼트
- 북극성 지표
- 빅테크
- 머신러닝
- 방법론
- 책 추천
- BA
- 데이터 분석가 주니어
- 데이터 시각화
- 알고리즘
- BI
- 기획자
- 통계학
- 퍼포먼스 마케터
- 빅데이터
- 프로젝트 매니저
- A/B테스트
- 퍼포먼스 마케팅
- 데이터 분석가
- Total
- Today
- Yesterday