
머신 러닝의 세가지 지도 학습 회귀 / 분류 비지도 학습 강화 학습 예측 모델링 프로세스 데이터 수집 데이터 전처리 -이상치 처리, 결측치 처리, 인코딩, 스케일링, 데이터 분리 EDA - 기술 통계, 시각화 모델링 & 평가 -최적화 배포 데이터 수집에 따른 프로세스 데이터 수집 단계는 예제 데이터 혹은 회사에 있는 데아터로 진행되기 때문에, 지나치는 경우가 많답니다. 실제로 데이터를 수집하려면 개발을 통해 데이터를 적재하고 수집하는 데이터 엔지니어링 역량이 필요한데, 이 부분은 개발자가 직접 설계하고 저장하게 됩니다. 데이터분석가 는 이미 존재하는 데이터를 SQL 혹은 Python 로 통해 추출하고 리포팅 혹은 머신러닝을 통한 예측을 담당한다고 할 수 있습니다 1. Data Source OLTp Dat..
가트너그룹(Gartner Group)의 더그래니(Doun Laney) 의 정의 3V 빅데이터는 데이터의 양 (Volume), 데이터 유형과 소스 측면의 다양성(Variety), 데이터 수집과 처리 측면에서 속도(Velocity) 가 급격히 증가하면서 나타난 현상이다. 빅데이터의 새로운 특징 4V 더그 래니의 3V 에 추가로 Value(가치) 또는 Veracity(정확성) 를 포함해 4V 빅데이터의 특징을 설명하기도 하는데요. 여기에 Visualization(시각화), Variability(가변성) 등을 추가하는 견해도 있습니다. 빅데이터 3가지 출현 배경 출현배경내용 산업계고객 데이터 축적 -산업계에서 일어난 빅데이터 현상을 양질 전환 법칙으로 설명 할 수 있다. - 이는 양적인 변화가 축적되면 질 적..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 데이터 시각화
- 빅테크
- 퍼포먼스 마케터
- 그로스 해킹
- 머신러닝
- 데이터분석가
- 프로덕트 분석가
- 설레다
- 북극성 지표
- PM
- 알고리즘
- 통계학
- 아하 모먼트
- A/B테스트
- 데이터 리터러시
- 데이터 분석 주니어
- 방법론
- 프로젝트 매니저
- 아무일 없는것처럼
- BA
- 책 추천
- ADsP
- BI
- 퍼포먼스 마케팅
- 빅데이터
- 기획자
- 데이터 분석가
- 프로덕트 매니저
- 데이터 분석가 주니어
- 데이터 분석
- Total
- Today
- Yesterday