![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/dxBcSx/btsGesA8Jz3/KpQgvNYTMRmfQZo7d1yPk1/img.png)
부스팅 알고리즘 수행 방법 가장 최근의 알고리즘인 부스팅 알고리즘 부스팅(Boosting) 알고리즘은 여러 개의 약한 학습기 (weak learner) 를 순차적으로 학습하면서 잘못 예측한 데이터에 가중치를 부여하여 오류를 개선해 나가는 학습 방식 입니다. 부스팅 알고리즘 종류 Gradient Boosting Model 특징 : 가중치 업데이트를 경사하강법 방법을 통해 진행 python 라이브 러리 sklearn.ensemble.GradientBoostingClassifier sklearn.ensemble.GradientBoostingRegressor XGBoost 특징 : 트리기반 앙상블 기법으로, 가장 각광받으며 Kaggle 의 상위 알고리즘 병렬 학습이 가능해 속도가 빠름 Xboost.XGBRCla..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/doRMWQ/btsGc4VyaVq/tnpM3uPFWHtfHkXv354w3k/img.png)
최근접 이웃 알고리즘 수행 방법 더보기 유유상종이란 같은 집단끼리 서로 다르고 사귄다는 뜻이죠. 이와 비슷한 아이디어에서 착안한 것이 바로 K-Nearest Neighbor(KNN, KNN) 이랍니다. 주변의 데이터를 보고 내가 알고 싶은 데이터를 예측하는 방식입니다. K = 3 이라면, 별 1개와 세모 2개이므로 ? 는 세모로 예측 될 것 K = 7이라면, 별 4개와 세모 3개이므로 ? 는 별로 예측 될 것 위와 같이 확인할 주변 데이터 K 개를 선정 후에 거리 기준으로 가장 많은 것으로 예측하는 것이 바로 KNN 의 기본 원리 그럼 K 는 몇으로 정해야 하는 걸까요? 또 거리는 어떻게 측정 해야 하는 것 일까요 ? 하이퍼 파라미터의 개념 파라미터(Parameter) : 머신러닝 모델이 학습 과정에서 ..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/uZ6xu/btsGdSfXJTj/9sNG1UxepIVxI3yzny3ZAk/img.png)
의사결정나무 (Decision Tree, DT) 의사 결정 규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 입니다. 명칭 루트 노드 (Root Node) : 의사 결정나무의 시작점. 최초의 분할조건 리프노드 (Leaf Node) : 루트 노드로부터 파생된 중간 혹은 최종 노드 분류기준(Criteria) : Sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로,남성인 경우 우측 노드로 불순도(impurity) 불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄 리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/EnGWF/btsF3WEbesR/DK2nEu9tmZ4lLYFKKZNyy0/img.png)
일반적으로 데이터를 분석하는 목적은 두 가지 입니다. 예측과 추론이죠. 예측 Prediction 은 결과를 맞히는 것이고, 추론Inference 은 원인과 결과 사이의 관계를 분석 하는 것이다. 추론을 해도 결과를 도출하기는 하지만, 추론에서는 원인과 결과 간 관계에 더 초점을 두죠. '왜 우산을 들고 있는가?' 를 맞히는 것, 즉 비를 피하기 위해서 인지 아니면 햇볕을 피하기 위해서인지를 분석하는 것은 추론 입니다. 예측은 사물을 정확하게 인식하는 것에 목적이 있다. 사물을 왜 이렇게 인식했는지에 대해서는 별로 관심이 없다. 분석의 목적이 예측인지 추론인지에 따라 접근이 완전히 달라집니다. P-value 는 분석 결과의 유의성을 확인하는 첫 번째 절차입니다. p-value가 0.05 보다 클 확률은 희..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/ezhiQu/btsFVU68kzW/pGBwim9INIjVQfNWO4kL31/img.png)
고객은 물건이 아닌 가치를 사러 온다 Keeping Customer Values 큐레이션과 같이 고객 가치의 특화를 위해서는 고객을 정확히 정의하는 작업이 출발점이 된다. 이를 타기팅(Targeting) 이라고 한다. 그렇다면 마켓컬리의 핵심 타깃은 누구일까? 그들이 집중한 고객은 '좋은 품질에 대한 선호도가 높은 사람들' 이다 가족들의 건강한 식사를 위해 식재료의 질을 중시하는 주부, 믿을 수 있는 상품을 편안하게 받아보길 원하는 맞벌이 부부, 그리고 자신을 위한 소비에 가치를 두는 1~2인 가구 등이다. 자신이 정의한 고객에 기업이 집중하기 시작하면 어떤 서비스를 해야 하고 어떤 커뮤니케이션을 해야 할지가 더 명확해진다. 어떻게 품질검증을 보장할지, 어떤 이미지와 어떤 콘텐츠를 제공하는 게 좋을지 처..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/b0b9D2/btsFWtABOuB/n0eksJhFTucupJWWqWMulk/img.png)
2024.03.19 - [분류 전체보기] - 당신을 야근에서 구해줄 무기 데이터 리터러시 매출을 이루는 과정의 퍼널 분석에 집중한다면 어느 페이지에서 고객 이탈이 가장 많이 이루어졌는지를 통해 이탈을 막는 설계로 이어질 수 있습니다. 결국 매출을 위해 내가 할 수 있는 액션이 무엇인지에 따라 매출을 바라보는 방식이 모두 다를 수 밖에 없습니다. 마케팅을 담당하는 부서라면 광고 집행 비용 대비 매출이 나오는 채널이 어디인지 알고 해당 채널에 집중할지, 아니면 신규 고객이 많지만 광고 집행 비용 대비 매출이 적은 채널에 다른 방식으로 콘텐츠 마케팅을 할지 정 할 수있겠죠. 매출액 구매 고객수 X 고객당 구매액 상품 카테고리 X 카테고리별 매출 유입채널 X 유입채널당 매출 유입 고객 수 X 구매 전환율 ※ 매..
![](http://i1.daumcdn.net/thumb/C148x148/?fname=https://blog.kakaocdn.net/dn/dtOlmg/btsFm328sac/watA0GDkchM9oYNwEPQynk/img.png)
더보기 실무에서 마주치는 물음표들 "이번 상반기 회계 결산 해야 하는데 Revenue(매출액), Gross Margin(매출 총이익 = 매출액 - 매출 원가) 이 얼마나 나왔는지 알 수 있을까요 ? 더보기 "이번주 서울 지역과 지방 지역의 Conversion(상품 주문 전환율 = 전환수 / 클릭수 *100) 의 차이는 어떻게 되나요 ? 데이터 분석가는 현업에서 질문을 던지기 위해 수많은 물음표 살인마가 되기도하고 수많은 물음표와 마주하기도 합니다. 이번 상반기 회계 결산을 해야 되는데 매출액과, 구루스 마진이 얼마 나왔는지 알 수 있을까요 ? 프로덕트 분석가 때 요청받았던 질문 중 이번주 서울 지역과 지방 지역의 상품 주문 전환율에 차이는 어떻게 되나요?가 있는데요. 이렇게 현업에서 데이터 분석가는 비즈..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 데이터분석가
- 데이터 분석 주니어
- 그로스 해킹
- 방법론
- 데이터 분석가 주니어
- 빅데이터
- A/B테스트
- 아하 모먼트
- 통계학
- 북극성 지표
- 데이터 리터러시
- 알고리즘
- 프로젝트 매니저
- PM
- 데이터 분석
- BA
- 프로덕트 분석가
- ADsP
- 머신러닝
- 프로덕트 매니저
- 퍼포먼스 마케팅
- 책 추천
- 설레다
- 빅테크
- 데이터 시각화
- 기획자
- 아무일 없는것처럼
- 데이터 분석가
- BI
- 퍼포먼스 마케터
- Total
- Today
- Yesterday