기술 통계 자료의 특성을 표 , 그림, 통계량 등을 사용하여 쉽게 팡가할 수 있도록 정리/요약 하는것 데이터 분석에 앞서 데이터의 대략적인 통계적 수치를 계산해 보며 분석에 대한 통찰력을 얻을 수 있다. 예시 이미지 상자그림 (상자수염 그림, Box Plot)더보기다섯 숫자 요약을 통해 그림으로 표현한 것 (최솟값, Q1, Q2, Q3, 최댓값) 보통 이상점 (Mild Qutlier) : 안쪽 울타리와 바깥 울타리 사이에 있는 자료 극단 이상점 (Extreme Outlier) : 바깥 울타리 밖의 자료 종속 변수 (반응 변수, y)다른 변수의 영향을 받는 변수 어떤 실험이나 조사에서 변화의 결과로 나타나는 변수이며 이러한 변화는 독립변수들에 의해 영향을 받는다. 예시 : 학업 성정을 예측하고자 할 때..
탐색적 데이터 분석 (EDA : Exploratory Data Analysis) 이란, 데이터를 본격 분석하기 전에 데이터의 대략적인 특성을 파악하고 의미 있는 관계를 찾아내기 위해 다각도로 접근 하는 것을 의미 합니다. 더보기결측값 : 데이터셋에서 특정한 값이 없는 상태 더보기이상값 : 일반적인 데이터 분포에서 벗어나 있는 값으로 다른 데이터와 비교했을 때 통계적으로 불규칙한 값을 의미 데이터 분석 시 자주 사용하는 함수 head / tail시작 또는 마지막 6개 record 만 조회 head(,) 숫자를 넣어주면 원하는 개수만큼 확인 가능 summary수치형 변수 : 최댓값, 최솟값, 평균, 1사분위수, 2사분위수(중앙값), 3사분위수 명목형 변수 : 명목값, 데이터 개수 더보기명목형 변수란 ? ..
정합 Alignment : 방향성, 리더십, 문화 분위기 ) 구성원들이 조직의 비전, 전략 ,가치를 중심으로 정렬(Align) 돼 있는가 ? 실행 (Execution : 책임소재, 조율 ,통제 , 역량, 동기부여 ) 조직 구조 ,프로세스 ,역량 ,동기부여 수준이 실행력을 담보하는가 ? 변화적응 혁신 (Renewal : 외부 지향성, 혁신 학습 ) 조직이 외부 환경 변화를 잘 파악하고 상호작용하며, 변화에 적절히 대응하는가? 포인트는 무엇을 개선하며, 어떻게 개선하는가다. 현재가 아닌 미래를 기준으로 개선 목표를 설정하고, 2~3개의 우선순위 영역에 집중해야 한다. 그리고 목표 달성을 위해 1. 전사적 소통을 통한 공감대와 확신의 형성 2. 리더의 롤모델링 3.조직 역량과 스킬강화 4. 목표 관리 체계와 ..
분석 마스터 플랜 수립 프레임 워크 마스터 플랜 수립 개요 분석 대상을 도출하고 우선순위를 평가하여 세부 이행 계획과 로드맵을 작성 분석 마스터 플랜을 수립하는 가장 첫 번째 단계는 우선 순위를 정하는 일이다. 우선순위는 전랸적 중요도, 비즈니스 성과 및 ROI, 분석 과제의 실행 용이성을 기준으로 설정한다. 그 다음, 분석 과제를 업무에 내재화 할 것인지, 분석 데이터를 내부의 데이터로 한정할 것인지, 외부의 데이터 까지 포함할 것인지 여부, 그리고 기술의 적용 수준까지의 설정을 포함하여 분석 과제의 적용 범위 및 방식을 설정한다. 분석 과제의 우선순위와 적용 범위 및 방식을 종합적으로 고려하여 최종적으로 분석 구현의 로드맵을 수립한다. 이러한 일련의 과정과 형식을 마스터플랜 수립 프레임워크라 부른다..
해결해야 할 문제, 분석 대상이 무엇인지 알고 분석 방법도 알고 있다면 '최적화'분석 대상이 무엇인지 알고 있지만 방법을 모른다면 '솔루션' 분석 대상이 무엇인지 모르고 분석 방법도 모른다면, 분석 대상 자체를 새롭게 도출하는 '발견'분석 대상이 무엇인지 모르지만 분석 방법은 알고 있다면 '통찰력' 목표 시점별 분석 기획 과제 중심적인 접근 방식 : 과제를 빠르게 해결해야 하는 경우 장기적인 마스터플랜 방식 : 지속적인 분석 내재화를 위한 경우 당면한 분석 주제의 해결(과제 단위)지속적 분석 문화 내재화(마스터 플랜 단위)1차 목표 Speed & Test Accuracy & Deploy과제 유형 Quick & win Long Term View접근 방식 problem SolvingProblem Defin..
가트너그룹(Gartner Group)의 더그래니(Doun Laney) 의 정의 3V 빅데이터는 데이터의 양 (Volume), 데이터 유형과 소스 측면의 다양성(Variety), 데이터 수집과 처리 측면에서 속도(Velocity) 가 급격히 증가하면서 나타난 현상이다. 빅데이터의 새로운 특징 4V 더그 래니의 3V 에 추가로 Value(가치) 또는 Veracity(정확성) 를 포함해 4V 빅데이터의 특징을 설명하기도 하는데요. 여기에 Visualization(시각화), Variability(가변성) 등을 추가하는 견해도 있습니다. 빅데이터 3가지 출현 배경 출현배경내용 산업계고객 데이터 축적 -산업계에서 일어난 빅데이터 현상을 양질 전환 법칙으로 설명 할 수 있다. - 이는 양적인 변화가 축적되면 질 적..
데이터를 가공하여 유의미한 정보를 도출하고 분석하는 방법론에 대해 학습 합니다.통계 이해가 필수인 머신러닝, 딥러닝을 이어가는 기초과정이며 데이터의 기본기를 가질 수 있습니다.ADsp 를 배우면현대 사회는 데이터 기반으로 모든 것이 이루어짐모든 IT 직무에서 활용 가능데이터 분석에 대한 기본적인 이해를 바탕으로 한 소통 가능정성적 데이터언어 문자 등설문 조사 , SNS 데이터 등정량적 데이터수치. 기호 도형 등41kg , 31세 , 29츠 등정형 데이터 ' 비정형 데이터 ' 반정형 데이터정형 데이터고정된 틀이 있으며 연산이 가능 (Ex.CSV, 엑셀, 스프레드 시트, 관계형 데이터베이스 등)비정형 데이터고정된 틀이 없으며 연산이 불가능 (EX.NoSQL, 영상, 음성 등)반정형 데이터고정된 틀을 가지고 ..
https://www.youtube.com/watch?v=tcrr2QiXt9M&t=1s 데이터 그로쓰 모델링 Total Customers 는 New Customer Today 와 Lost Customers Today, 단 두가지 요소만 영향을 미친다. (들어오는 유저 & 나가는 유저) Customer 에 대한 정의 a. Active 를 어떻게 정의 하나 ? i. 95% 이상의 Vistor 가 꼭 하게 되는 활동 ii. Page by Page, Repeatable 하고, Meaningul 한 Action 인가 ? b. Churn (이탈율) 은 어떻게 정의 하나 ? i. 얼마를 안써야 안오는 거라고 정의 할까? 1일? 4일? ii. 상싱적으로 이정도를 안썼으면 Loss 될 것 같다를 정한다. (나중에 바꾸면..
보호되어 있는 글입니다.
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 프로젝트 매니저
- 데이터분석가
- 데이터 분석
- 퍼포먼스 마케팅
- ADsP
- 프로덕트 분석가
- 데이터 시각화
- 아하 모먼트
- 설레다
- 그로스 해킹
- 아무일 없는것처럼
- BI
- 퍼포먼스 마케터
- 북극성 지표
- PM
- 책 추천
- 데이터 분석가
- BA
- 데이터 분석가 주니어
- 프로덕트 매니저
- 빅데이터
- 데이터 분석 주니어
- 빅테크
- 기획자
- 통계학
- 머신러닝
- 데이터 리터러시
- 방법론
- 알고리즘
- A/B테스트
- Total
- Today
- Yesterday