최근접 이웃 알고리즘 수행 방법 더보기 유유상종이란 같은 집단끼리 서로 다르고 사귄다는 뜻이죠. 이와 비슷한 아이디어에서 착안한 것이 바로 K-Nearest Neighbor(KNN, KNN) 이랍니다. 주변의 데이터를 보고 내가 알고 싶은 데이터를 예측하는 방식입니다. K = 3 이라면, 별 1개와 세모 2개이므로 ? 는 세모로 예측 될 것 K = 7이라면, 별 4개와 세모 3개이므로 ? 는 별로 예측 될 것 위와 같이 확인할 주변 데이터 K 개를 선정 후에 거리 기준으로 가장 많은 것으로 예측하는 것이 바로 KNN 의 기본 원리 그럼 K 는 몇으로 정해야 하는 걸까요? 또 거리는 어떻게 측정 해야 하는 것 일까요 ? 하이퍼 파라미터의 개념 파라미터(Parameter) : 머신러닝 모델이 학습 과정에서 ..
의사결정 나무는 과적합과 불안정성 대한 문제가 대두 되었어요. 이를 해결하기 위한 아이디어는 바로 나무(Tree) 를 여러 개 만들어 숲(Forest)를 만드는 것이에요. 배깅(Bagging)의 원리 언제나 머신러닝은 데이터의 부족이 문제 이를 해결 하기 위한 Bootstrapping + Aggregationg 방법론 - Bootstrapping : 데이터를 복원 추출해서 유사하지만 다른 데이터 집단을 생성하는 것 - Aggregationg : 데이터의 예측, 분류 결과를 합치는 것 - Ensemble(앙상블) : 여러 개의 모델을 만들어 결과를 합치는 것 더보기 Bootstrap은 " 자기 스스로 해낸다" 의 뜻의 유래를 가지고 있으면서, 영단어로는 부츠 신발 끈을 의미해요. 이를 차용하여 데이터를 복..
의사결정나무 (Decision Tree, DT) 의사 결정 규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 입니다. 명칭 루트 노드 (Root Node) : 의사 결정나무의 시작점. 최초의 분할조건 리프노드 (Leaf Node) : 루트 노드로부터 파생된 중간 혹은 최종 노드 분류기준(Criteria) : Sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로,남성인 경우 우측 노드로 불순도(impurity) 불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄 리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스..
Activation : 고객의 행복한 경험 전환율이 아닌 다음 퍼널로 넘어가는지 기간이 중요 - 전환율을 볼때, 버튼 단위로 드릴다운 해서 봐야 한다. 복귀(부활)유저 : CC 에 도달하면 부활 유저 유저, 바이럴, 네트워크 효과 오가닉 유저, Paid 유저 바이럴 그로스 Network effect(네트워크 효과) 적용해볼 수 있는 부분 태블로 과제에서 적용 할 수 있는 부분 프로젝트에 적용할 수 있는 부분 회사에서 적용할 수 있는 부분 포트폴리오 - 마지막 단에, 추가적으로 포트폴리오 회고를 하거나, 비즈니스 임팩트 부분을 추가 해주면 좋다. Growth Loop 유저 세그먼트 New Users (신규 유저) : 우리 서비스를 처음 사용하는 유저 Current Users(현재 사용자) : 일정 기간 동..
시장 점유율을 분석한느 목적은 크게 네 가지 이다. 첫째, 제품의 매력도를 파악 할 수 있다. 둘째, 경쟁사 제품의 위치를 파악 할 수 있다. 셋째, 시장의 규모와 질적 수준을 파악할 수 있다. 마지막으로 경쟁 우위 제품을 파악하고 선별하는 데 유용하다. 시장 점유율 분석의 목적 - 제품의 매력도 확인, 경쟁사 파악, 경쟁 우위 제품 선별, 시장의 규모 및 질적수준 시장 점유율 분석 대상에 따라 비용 측면 / 양적 측면 시장 점유율 분석 기준에 따라 상대적 측면 / 절대적 측면 매출액 기준 절대적 시장 점유율 = 전체 시장 매출액 / 당사 매출액 (%) BCC 매트릭스는 성장률과 시장 점유율을 기준으로 사업 또는 상품의 가치를 네 가지 등급으로 분류하는 평가 도구이다. 네 가지 분류란 계속 투자해야 할 ..
우리는 팀으로 일합니다. 팀원들 각자 서로 잘하고 즐기는 분야가 다르기 때문입니다. 팀원의 구성과 성향이 다양할수록 더 좋은 팀이 될 확률이 높습니다. 팀원들이 각자 최고의 능력을 발휘할 수 있는 역할을 맡아 수행하며 서로의 역할을 존중하고 지식과 경험을 공유함으로써, 팀의 생산성은 올라가고 팀원 모두 성장 할 수 있습니다. 하지만 팀으로 일한다는 것이 쉬운 일은 아닙니다. 사람마다 커뮤니케이션 방식도 다양해서, 서로 선호하는 방식이 다르기라도 하면 피로가 누적됩니다. 누구는 텍스트 기반의 메시지를 선호하고, 누구한테는 이메일을 보내면 전화가 걸려 오고, 누구는 얼굴 보고 이야기해야 진정한 커뮤니케이션 이라고 생각합니다. 또한 사람마다 상식과 기준이 다르기 때문에, 오해가 생기고 감정을 다치기도 합니다...
일반적으로 데이터를 분석하는 목적은 두 가지 입니다. 예측과 추론이죠. 예측 Prediction 은 결과를 맞히는 것이고, 추론Inference 은 원인과 결과 사이의 관계를 분석 하는 것이다. 추론을 해도 결과를 도출하기는 하지만, 추론에서는 원인과 결과 간 관계에 더 초점을 두죠. '왜 우산을 들고 있는가?' 를 맞히는 것, 즉 비를 피하기 위해서 인지 아니면 햇볕을 피하기 위해서인지를 분석하는 것은 추론 입니다. 예측은 사물을 정확하게 인식하는 것에 목적이 있다. 사물을 왜 이렇게 인식했는지에 대해서는 별로 관심이 없다. 분석의 목적이 예측인지 추론인지에 따라 접근이 완전히 달라집니다. P-value 는 분석 결과의 유의성을 확인하는 첫 번째 절차입니다. p-value가 0.05 보다 클 확률은 희..
우리는 살아가면서 다양한 인연을 만난다. 하지만 우리는 스쳐 보내야 할 인연에 불필요한 공력을 쏟고, 붙잡아야 할 인연에 무심하게 행동하는 실수를 종종 저지르곤 한다. 모든 사람에게 신경을 쓰려 노력하면 결국 쓸만한 인연을 만나지 못하고 어설픈 인연만 지속시키며 우리의 삶을 낭비할 수 밖에 없다. 옷깃만 스쳐도 인연이라고 하지만, 인연이라고 해서 모두 품어야 할 필요는 없다. 살마에게 헤퍼지지 말자. 당신에게 정말 필요한 사람은 생각보다 그리 많지 않다. 모든 일의 인과관계에서 명확한 건 오직 시작과 끝이 있따는 것뿐, 나머지는 복잡하게 얽힌 실타래나 마찬가지 이 안에서 정확한 원인을 찾기란 불가능하다. 요컨대, 불행을 가져온 원인에 집착하는 건 아무런 의미가 없다는 것이다. 불행의 인과관계를 찾으려 애..
고객은 물건이 아닌 가치를 사러 온다 Keeping Customer Values 큐레이션과 같이 고객 가치의 특화를 위해서는 고객을 정확히 정의하는 작업이 출발점이 된다. 이를 타기팅(Targeting) 이라고 한다. 그렇다면 마켓컬리의 핵심 타깃은 누구일까? 그들이 집중한 고객은 '좋은 품질에 대한 선호도가 높은 사람들' 이다 가족들의 건강한 식사를 위해 식재료의 질을 중시하는 주부, 믿을 수 있는 상품을 편안하게 받아보길 원하는 맞벌이 부부, 그리고 자신을 위한 소비에 가치를 두는 1~2인 가구 등이다. 자신이 정의한 고객에 기업이 집중하기 시작하면 어떤 서비스를 해야 하고 어떤 커뮤니케이션을 해야 할지가 더 명확해진다. 어떻게 품질검증을 보장할지, 어떤 이미지와 어떤 콘텐츠를 제공하는 게 좋을지 처..
2024.03.19 - [분류 전체보기] - 당신을 야근에서 구해줄 무기 데이터 리터러시 매출을 이루는 과정의 퍼널 분석에 집중한다면 어느 페이지에서 고객 이탈이 가장 많이 이루어졌는지를 통해 이탈을 막는 설계로 이어질 수 있습니다. 결국 매출을 위해 내가 할 수 있는 액션이 무엇인지에 따라 매출을 바라보는 방식이 모두 다를 수 밖에 없습니다. 마케팅을 담당하는 부서라면 광고 집행 비용 대비 매출이 나오는 채널이 어디인지 알고 해당 채널에 집중할지, 아니면 신규 고객이 많지만 광고 집행 비용 대비 매출이 적은 채널에 다른 방식으로 콘텐츠 마케팅을 할지 정 할 수있겠죠. 매출액 구매 고객수 X 고객당 구매액 상품 카테고리 X 카테고리별 매출 유입채널 X 유입채널당 매출 유입 고객 수 X 구매 전환율 ※ 매..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 데이터 분석
- 데이터 리터러시
- 책 추천
- 퍼포먼스 마케팅
- 프로덕트 매니저
- 통계학
- 데이터 분석가
- 빅데이터
- 머신러닝
- 데이터 시각화
- 프로젝트 매니저
- 설레다
- 데이터 분석가 주니어
- 아무일 없는것처럼
- 알고리즘
- 방법론
- 그로스 해킹
- 북극성 지표
- 빅테크
- 데이터 분석 주니어
- 기획자
- 아하 모먼트
- ADsP
- A/B테스트
- 데이터분석가
- BI
- PM
- 프로덕트 분석가
- BA
- 퍼포먼스 마케터
- Total
- Today
- Yesterday