최근접 이웃 알고리즘 수행 방법 더보기 유유상종이란 같은 집단끼리 서로 다르고 사귄다는 뜻이죠. 이와 비슷한 아이디어에서 착안한 것이 바로 K-Nearest Neighbor(KNN, KNN) 이랍니다. 주변의 데이터를 보고 내가 알고 싶은 데이터를 예측하는 방식입니다. K = 3 이라면, 별 1개와 세모 2개이므로 ? 는 세모로 예측 될 것 K = 7이라면, 별 4개와 세모 3개이므로 ? 는 별로 예측 될 것 위와 같이 확인할 주변 데이터 K 개를 선정 후에 거리 기준으로 가장 많은 것으로 예측하는 것이 바로 KNN 의 기본 원리 그럼 K 는 몇으로 정해야 하는 걸까요? 또 거리는 어떻게 측정 해야 하는 것 일까요 ? 하이퍼 파라미터의 개념 파라미터(Parameter) : 머신러닝 모델이 학습 과정에서 ..
의사결정 나무는 과적합과 불안정성 대한 문제가 대두 되었어요. 이를 해결하기 위한 아이디어는 바로 나무(Tree) 를 여러 개 만들어 숲(Forest)를 만드는 것이에요. 배깅(Bagging)의 원리 언제나 머신러닝은 데이터의 부족이 문제 이를 해결 하기 위한 Bootstrapping + Aggregationg 방법론 - Bootstrapping : 데이터를 복원 추출해서 유사하지만 다른 데이터 집단을 생성하는 것 - Aggregationg : 데이터의 예측, 분류 결과를 합치는 것 - Ensemble(앙상블) : 여러 개의 모델을 만들어 결과를 합치는 것 더보기 Bootstrap은 " 자기 스스로 해낸다" 의 뜻의 유래를 가지고 있으면서, 영단어로는 부츠 신발 끈을 의미해요. 이를 차용하여 데이터를 복..
의사결정나무 (Decision Tree, DT) 의사 결정 규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석 방법 입니다. 명칭 루트 노드 (Root Node) : 의사 결정나무의 시작점. 최초의 분할조건 리프노드 (Leaf Node) : 루트 노드로부터 파생된 중간 혹은 최종 노드 분류기준(Criteria) : Sex는 여성인 경우 0, 남성인 경우 1로 인코딩. 여성인 경우 좌측 노드로,남성인 경우 우측 노드로 불순도(impurity) 불순도 측정 방법 중 하나 인 지니 계수는 0과 1사이 값으로 0이 완벽한 순도(모든 샘플이 하나의 클래스), 1은 완전한 불순도(노드의 샘플의 균등하게 분포) 됨을 나타냄 리프 노드로 갈수록 불순도가 작아지는(한쪽으로 클래스..
세상에서 가장 독한 사람은 자신의 실패를 복기해보는 사람이다. 실패는 마주하는 것만으로 고통스럽다. 하지만 다음에 똑같은 실패를 반복하지 않기 위해서는 내가 냈던 아이디어의 민낯을 마주하고 실패의 과정을 복기해보아야만 한다. 그것이 연애이든,스타트업이든 말이다. 행동과 책임의 균형 프리토타이핑은 내 아이디어가 정말 고객에게 가치를 주는지 검증하는 매우 효과적인 도구다. 구글과 같은 테크 기업뿐 아니라, 식음료나 소매업부터 정유,조선업 등 다양한 분야에 적용해볼 수 있는 아주 유연한 도구다. 또 많은 돈과 인원이 필요하지 않아 작은 규모의 스타트업에 특히 적합하다. 스타트업에서 빠른 실행력은 매우 중요하지만 무턱대고 빠른 속도로 밀어붙이다 보면 실행력이라는 부스터뿐만 아니라, 제대로 도니 길을 알려주는 지..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 책 추천
- PM
- 아하 모먼트
- 북극성 지표
- 그로스 해킹
- 프로덕트 매니저
- ADsP
- BA
- 데이터 리터러시
- 데이터 분석가
- BI
- 설레다
- 빅테크
- 빅데이터
- 퍼포먼스 마케팅
- 통계학
- 프로덕트 분석가
- 방법론
- 아무일 없는것처럼
- 데이터 분석 주니어
- 알고리즘
- 머신러닝
- 데이터 분석가 주니어
- 데이터 시각화
- A/B테스트
- 기획자
- 퍼포먼스 마케터
- 프로젝트 매니저
- 데이터분석가
- 데이터 분석
- Total
- Today
- Yesterday