
앞의 t-test에서, 이상치와 왜도를 통해 그 결과가 건강한지 살펴보았습니다. ANOVA 는 이러한 제약이 조금 더 타이트하며, 다른 통계학 모형들 또한 그런 경우가 많습니다. ANOVA와 많은 모형들은 원본 Raw 데이터가 아닌 잔차Residual 에 대한 가정을 가집니다. 정규성 Normality 잔차의 분포가 정규분포를 따름을 가정합니다. 가장 흔한 문제는 앞에서 보았던 왜도Skewnes와 이상치Outlier이며, 가장 중대한 문제입니다. QQplot 을 통해 시각적으로 확인할 수 있습니다. 통계적 검사를 통해 이를 진단할 수도 있습니다. -Shapiro 는 소표본 (N1,000,000) 는 샘플링하여 검사한느 것도 좋습니다. 로그 변환 Log transformation 와 이상치 제거로 해결되는..
카테고리 없음
2024. 3. 31. 19:13
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
최근에 올라온 글
최근에 달린 댓글
글 보관함
링크
TAG
- 퍼포먼스 마케팅
- 데이터 분석 주니어
- 통계학
- A/B테스트
- 데이터 분석가 주니어
- 그로스 해킹
- 빅테크
- BI
- 설레다
- 프로덕트 매니저
- BA
- 데이터 분석
- 데이터 리터러시
- 프로젝트 매니저
- 퍼포먼스 마케터
- PM
- 아하 모먼트
- 북극성 지표
- 프로덕트 분석가
- 책 추천
- ADsP
- 기획자
- 머신러닝
- 데이터 분석가
- 아무일 없는것처럼
- 방법론
- 빅데이터
- 데이터분석가
- 알고리즘
- 데이터 시각화
- Total
- Today
- Yesterday