![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/bVVPK0/btsGdEQLkii/eJGTjn6dRksyHZzs6j9Gi0/img.png)
앞의 t-test에서, 이상치와 왜도를 통해 그 결과가 건강한지 살펴보았습니다. ANOVA 는 이러한 제약이 조금 더 타이트하며, 다른 통계학 모형들 또한 그런 경우가 많습니다. ANOVA와 많은 모형들은 원본 Raw 데이터가 아닌 잔차Residual 에 대한 가정을 가집니다. 정규성 Normality 잔차의 분포가 정규분포를 따름을 가정합니다. 가장 흔한 문제는 앞에서 보았던 왜도Skewnes와 이상치Outlier이며, 가장 중대한 문제입니다. QQplot 을 통해 시각적으로 확인할 수 있습니다. 통계적 검사를 통해 이를 진단할 수도 있습니다. -Shapiro 는 소표본 (N1,000,000) 는 샘플링하여 검사한느 것도 좋습니다. 로그 변환 Log transformation 와 이상치 제거로 해결되는..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/sCJtK/btsGev6maTC/AIC7EeEqeUaMRyej4kr9O1/img.png)
고객 세그멘테이션의 정의 비지도 학습이 가장 많이 사용되는 분야는 고객 관계 관리 (Customer Relationship Management, CRM) 분야 입니다 . 이중 고객 세그멘테이션(Custmer Segmentation) 은 다양한 기준으로 고객을 분류하는 기법입니다. 주로 타겟 마케팅 이라 불리는 고객 특성에 맞게 세분화 하여 유형에 따라 맞춤형 마케팅 이나 서비스를 제공하는 것을 목표로 둡니다. RFM 의 개념 - Recency(R) : 가장 최근 구입 일에서 오늘 까지의 시간 - Frequency(F) : 상품 구매 횟수 - Monetary value(M) : 총 구매 금액 https://archive.ics.uci.edu/dataset/352/online+retail UCI Machin..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/vByDv/btsGee35BHH/bHNK2thZ587b9RewiwC81K/img.png)
의사결정 나무는 과적합과 불안정성 대한 문제가 대두 되었어요. 이를 해결하기 위한 아이디어는 바로 나무(Tree) 를 여러 개 만들어 숲(Forest)를 만드는 것이에요. 배깅(Bagging)의 원리 언제나 머신러닝은 데이터의 부족이 문제 이를 해결 하기 위한 Bootstrapping + Aggregationg 방법론 - Bootstrapping : 데이터를 복원 추출해서 유사하지만 다른 데이터 집단을 생성하는 것 - Aggregationg : 데이터의 예측, 분류 결과를 합치는 것 - Ensemble(앙상블) : 여러 개의 모델을 만들어 결과를 합치는 것 더보기 Bootstrap은 " 자기 스스로 해낸다" 의 뜻의 유래를 가지고 있으면서, 영단어로는 부츠 신발 끈을 의미해요. 이를 차용하여 데이터를 복..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/8NT8A/btsF7R88dNC/HhTSvJzBrE9nchLozNzlYK/img.png)
우리는 팀으로 일합니다. 팀원들 각자 서로 잘하고 즐기는 분야가 다르기 때문입니다. 팀원의 구성과 성향이 다양할수록 더 좋은 팀이 될 확률이 높습니다. 팀원들이 각자 최고의 능력을 발휘할 수 있는 역할을 맡아 수행하며 서로의 역할을 존중하고 지식과 경험을 공유함으로써, 팀의 생산성은 올라가고 팀원 모두 성장 할 수 있습니다. 하지만 팀으로 일한다는 것이 쉬운 일은 아닙니다. 사람마다 커뮤니케이션 방식도 다양해서, 서로 선호하는 방식이 다르기라도 하면 피로가 누적됩니다. 누구는 텍스트 기반의 메시지를 선호하고, 누구한테는 이메일을 보내면 전화가 걸려 오고, 누구는 얼굴 보고 이야기해야 진정한 커뮤니케이션 이라고 생각합니다. 또한 사람마다 상식과 기준이 다르기 때문에, 오해가 생기고 감정을 다치기도 합니다...
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/Y2RrZ/btsFS1Mht1F/DKxU6jYFtJyrKmgYXRDo7K/img.png)
데이터 리터러시란 무엇인가? '데이터 리터러시(Data Literacy)' 라는 말입니다. 데이터 문해력 이라는 이름으로 최근 많이 사용하고 있는 단어 입니다. 데이터를전문적으로 다루는 사람이 아니더라도 데이터를 통해 업무를 향상시키는 이해도를 총칭한 말로 쓰입니다. 보다 정확하게는 데이터를 읽고 이해하며 정보로 변환하여 커뮤니케이션 할 수 있는 능력을 말하는 개념으로 사용 됩니다. 데이터를 정보로 바꾸고, 정보를 지식으로 바꾸는 단계에서 데이터 밖 세상에 영향을 주는 것은 사람의 몫 입니다. 따라서 데이터 리터러시의 핵심은 개념적인 도구의 사용이 아닌 데이터 자체에 대한 이해, 이해가 뒷받침된 해석에 포커스가 맞춰져야 합니다. 상관관계나 평균 판단과 같은 간단한 통계 작업을 해석할 수 있는 조직 내 구..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 퍼포먼스 마케팅
- ADsP
- 머신러닝
- 통계학
- 데이터 분석 주니어
- 아무일 없는것처럼
- 프로덕트 분석가
- PM
- 데이터 분석가 주니어
- 데이터 시각화
- 프로젝트 매니저
- 데이터 리터러시
- 아하 모먼트
- BI
- A/B테스트
- BA
- 데이터 분석
- 알고리즘
- 그로스 해킹
- 데이터 분석가
- 책 추천
- 방법론
- 데이터분석가
- 퍼포먼스 마케터
- 빅테크
- 북극성 지표
- 설레다
- 프로덕트 매니저
- 기획자
- 빅데이터
- Total
- Today
- Yesterday