
고객 세그멘테이션의 정의 비지도 학습이 가장 많이 사용되는 분야는 고객 관계 관리 (Customer Relationship Management, CRM) 분야 입니다 . 이중 고객 세그멘테이션(Custmer Segmentation) 은 다양한 기준으로 고객을 분류하는 기법입니다. 주로 타겟 마케팅 이라 불리는 고객 특성에 맞게 세분화 하여 유형에 따라 맞춤형 마케팅 이나 서비스를 제공하는 것을 목표로 둡니다. RFM 의 개념 - Recency(R) : 가장 최근 구입 일에서 오늘 까지의 시간 - Frequency(F) : 상품 구매 횟수 - Monetary value(M) : 총 구매 금액 https://archive.ics.uci.edu/dataset/352/online+retail UCI Machin..
import pandas as pd import seaborn as sns import matplotlib.pyplot as plt iris_df = sns.load_dataset('iris') iris.head(3) iris_df.info() sns.scatterplot(data = iris_df, x = 'sepa_length', y = 'sepal_width') sns.scatterplot(data = iris_df, x = 'sepal_length', y='sepal_width', hue ='species') iris_df2 = iris_df[['sepal_length', 'sepal_width', 'petal_length', 'petal_width']] iris_Df2.head(3) from s..

비지도 학습 예시 - 고객 특성에 따른 그룹화 ex : 헤비유저, 일반유저 - 구매 내역별로 데이터 그룹화 Ex: 생필품 구매 더보기 다시 말해 비지도 학습은 데이터 기반으로 레이블링을 하는 작업이라고 하겠습니다. 정답이 없는 문제이기 때문에 지도 학습보다 조금 어렵고 주관적인 판단이 개입하게 됩니다. 붓꽃 데이터를 이용한 군집화 예시 K - 평균 군집화 혹은 알고리즘은 가장 일반적으로 사용되는 알고리즘 입니다. 쉬운 예시를 위해서 붓꽃 데이터 (IRis) 데이터로 살펴 보겠습니다. sepal_length : 꽃 받침의 길이 sepal_width : 꽃 받침의 너비 petal_length : 꽃 잎의 길이 petal_width : 꽃 잎의 너비 species(Y, 레이블) : 붓꽃 종 (setosa, v..

부스팅 알고리즘 수행 방법 가장 최근의 알고리즘인 부스팅 알고리즘 부스팅(Boosting) 알고리즘은 여러 개의 약한 학습기 (weak learner) 를 순차적으로 학습하면서 잘못 예측한 데이터에 가중치를 부여하여 오류를 개선해 나가는 학습 방식 입니다. 부스팅 알고리즘 종류 Gradient Boosting Model 특징 : 가중치 업데이트를 경사하강법 방법을 통해 진행 python 라이브 러리 sklearn.ensemble.GradientBoostingClassifier sklearn.ensemble.GradientBoostingRegressor XGBoost 특징 : 트리기반 앙상블 기법으로, 가장 각광받으며 Kaggle 의 상위 알고리즘 병렬 학습이 가능해 속도가 빠름 Xboost.XGBRCla..

최근접 이웃 알고리즘 수행 방법 더보기 유유상종이란 같은 집단끼리 서로 다르고 사귄다는 뜻이죠. 이와 비슷한 아이디어에서 착안한 것이 바로 K-Nearest Neighbor(KNN, KNN) 이랍니다. 주변의 데이터를 보고 내가 알고 싶은 데이터를 예측하는 방식입니다. K = 3 이라면, 별 1개와 세모 2개이므로 ? 는 세모로 예측 될 것 K = 7이라면, 별 4개와 세모 3개이므로 ? 는 별로 예측 될 것 위와 같이 확인할 주변 데이터 K 개를 선정 후에 거리 기준으로 가장 많은 것으로 예측하는 것이 바로 KNN 의 기본 원리 그럼 K 는 몇으로 정해야 하는 걸까요? 또 거리는 어떻게 측정 해야 하는 것 일까요 ? 하이퍼 파라미터의 개념 파라미터(Parameter) : 머신러닝 모델이 학습 과정에서 ..

의사결정 나무는 과적합과 불안정성 대한 문제가 대두 되었어요. 이를 해결하기 위한 아이디어는 바로 나무(Tree) 를 여러 개 만들어 숲(Forest)를 만드는 것이에요. 배깅(Bagging)의 원리 언제나 머신러닝은 데이터의 부족이 문제 이를 해결 하기 위한 Bootstrapping + Aggregationg 방법론 - Bootstrapping : 데이터를 복원 추출해서 유사하지만 다른 데이터 집단을 생성하는 것 - Aggregationg : 데이터의 예측, 분류 결과를 합치는 것 - Ensemble(앙상블) : 여러 개의 모델을 만들어 결과를 합치는 것 더보기 Bootstrap은 " 자기 스스로 해낸다" 의 뜻의 유래를 가지고 있으면서, 영단어로는 부츠 신발 끈을 의미해요. 이를 차용하여 데이터를 복..

의사결정나무 (Decision Tree, DT) 의사 결정 규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 입니다. 명칭 루트 노드 (Root Node) : 의사 결정나무의 시작점. 최초의 분할조건 리프노드 (Leaf Node) : 루트 노드로부터 파생된 중간 혹은 최종 노드 분류기준(Criteria) : Sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로,남성인 경우 우측 노드로 불순도(impurity) 불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄 리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스..

Activation : 고객의 행복한 경험 전환율이 아닌 다음 퍼널로 넘어가는지 기간이 중요 - 전환율을 볼때, 버튼 단위로 드릴다운 해서 봐야 한다. 복귀(부활)유저 : CC 에 도달하면 부활 유저 유저, 바이럴, 네트워크 효과 오가닉 유저, Paid 유저 바이럴 그로스 Network effect(네트워크 효과) 적용해볼 수 있는 부분 태블로 과제에서 적용 할 수 있는 부분 프로젝트에 적용할 수 있는 부분 회사에서 적용할 수 있는 부분 포트폴리오 - 마지막 단에, 추가적으로 포트폴리오 회고를 하거나, 비즈니스 임팩트 부분을 추가 해주면 좋다. Growth Loop 유저 세그먼트 New Users (신규 유저) : 우리 서비스를 처음 사용하는 유저 Current Users(현재 사용자) : 일정 기간 동..

시장 점유율을 분석한느 목적은 크게 네 가지 이다. 첫째, 제품의 매력도를 파악 할 수 있다. 둘째, 경쟁사 제품의 위치를 파악 할 수 있다. 셋째, 시장의 규모와 질적 수준을 파악할 수 있다. 마지막으로 경쟁 우위 제품을 파악하고 선별하는 데 유용하다. 시장 점유율 분석의 목적 - 제품의 매력도 확인, 경쟁사 파악, 경쟁 우위 제품 선별, 시장의 규모 및 질적수준 시장 점유율 분석 대상에 따라 비용 측면 / 양적 측면 시장 점유율 분석 기준에 따라 상대적 측면 / 절대적 측면 매출액 기준 절대적 시장 점유율 = 전체 시장 매출액 / 당사 매출액 (%) BCC 매트릭스는 성장률과 시장 점유율을 기준으로 사업 또는 상품의 가치를 네 가지 등급으로 분류하는 평가 도구이다. 네 가지 분류란 계속 투자해야 할 ..

우리는 팀으로 일합니다. 팀원들 각자 서로 잘하고 즐기는 분야가 다르기 때문입니다. 팀원의 구성과 성향이 다양할수록 더 좋은 팀이 될 확률이 높습니다. 팀원들이 각자 최고의 능력을 발휘할 수 있는 역할을 맡아 수행하며 서로의 역할을 존중하고 지식과 경험을 공유함으로써, 팀의 생산성은 올라가고 팀원 모두 성장 할 수 있습니다. 하지만 팀으로 일한다는 것이 쉬운 일은 아닙니다. 사람마다 커뮤니케이션 방식도 다양해서, 서로 선호하는 방식이 다르기라도 하면 피로가 누적됩니다. 누구는 텍스트 기반의 메시지를 선호하고, 누구한테는 이메일을 보내면 전화가 걸려 오고, 누구는 얼굴 보고 이야기해야 진정한 커뮤니케이션 이라고 생각합니다. 또한 사람마다 상식과 기준이 다르기 때문에, 오해가 생기고 감정을 다치기도 합니다...
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 머신러닝
- 방법론
- 책 추천
- 북극성 지표
- 기획자
- 알고리즘
- 데이터 분석
- 빅테크
- 데이터분석가
- 그로스 해킹
- BI
- 데이터 분석 주니어
- 빅데이터
- 프로젝트 매니저
- 데이터 분석가 주니어
- 통계학
- PM
- 데이터 시각화
- 퍼포먼스 마케팅
- 데이터 리터러시
- ADsP
- 퍼포먼스 마케터
- 아무일 없는것처럼
- 프로덕트 매니저
- BA
- 아하 모먼트
- 프로덕트 분석가
- A/B테스트
- 데이터 분석가
- 설레다
- Total
- Today
- Yesterday