
일반적으로 데이터를 분석하는 목적은 두 가지 입니다. 예측과 추론이죠. 예측 Prediction 은 결과를 맞히는 것이고, 추론Inference 은 원인과 결과 사이의 관계를 분석 하는 것이다. 추론을 해도 결과를 도출하기는 하지만, 추론에서는 원인과 결과 간 관계에 더 초점을 두죠. '왜 우산을 들고 있는가?' 를 맞히는 것, 즉 비를 피하기 위해서 인지 아니면 햇볕을 피하기 위해서인지를 분석하는 것은 추론 입니다. 예측은 사물을 정확하게 인식하는 것에 목적이 있다. 사물을 왜 이렇게 인식했는지에 대해서는 별로 관심이 없다. 분석의 목적이 예측인지 추론인지에 따라 접근이 완전히 달라집니다. P-value 는 분석 결과의 유의성을 확인하는 첫 번째 절차입니다. p-value가 0.05 보다 클 확률은 희..
우리는 살아가면서 다양한 인연을 만난다. 하지만 우리는 스쳐 보내야 할 인연에 불필요한 공력을 쏟고, 붙잡아야 할 인연에 무심하게 행동하는 실수를 종종 저지르곤 한다. 모든 사람에게 신경을 쓰려 노력하면 결국 쓸만한 인연을 만나지 못하고 어설픈 인연만 지속시키며 우리의 삶을 낭비할 수 밖에 없다. 옷깃만 스쳐도 인연이라고 하지만, 인연이라고 해서 모두 품어야 할 필요는 없다. 살마에게 헤퍼지지 말자. 당신에게 정말 필요한 사람은 생각보다 그리 많지 않다. 모든 일의 인과관계에서 명확한 건 오직 시작과 끝이 있따는 것뿐, 나머지는 복잡하게 얽힌 실타래나 마찬가지 이 안에서 정확한 원인을 찾기란 불가능하다. 요컨대, 불행을 가져온 원인에 집착하는 건 아무런 의미가 없다는 것이다. 불행의 인과관계를 찾으려 애..

고객은 물건이 아닌 가치를 사러 온다 Keeping Customer Values 큐레이션과 같이 고객 가치의 특화를 위해서는 고객을 정확히 정의하는 작업이 출발점이 된다. 이를 타기팅(Targeting) 이라고 한다. 그렇다면 마켓컬리의 핵심 타깃은 누구일까? 그들이 집중한 고객은 '좋은 품질에 대한 선호도가 높은 사람들' 이다 가족들의 건강한 식사를 위해 식재료의 질을 중시하는 주부, 믿을 수 있는 상품을 편안하게 받아보길 원하는 맞벌이 부부, 그리고 자신을 위한 소비에 가치를 두는 1~2인 가구 등이다. 자신이 정의한 고객에 기업이 집중하기 시작하면 어떤 서비스를 해야 하고 어떤 커뮤니케이션을 해야 할지가 더 명확해진다. 어떻게 품질검증을 보장할지, 어떤 이미지와 어떤 콘텐츠를 제공하는 게 좋을지 처..

2024.03.19 - [분류 전체보기] - 당신을 야근에서 구해줄 무기 데이터 리터러시 매출을 이루는 과정의 퍼널 분석에 집중한다면 어느 페이지에서 고객 이탈이 가장 많이 이루어졌는지를 통해 이탈을 막는 설계로 이어질 수 있습니다. 결국 매출을 위해 내가 할 수 있는 액션이 무엇인지에 따라 매출을 바라보는 방식이 모두 다를 수 밖에 없습니다. 마케팅을 담당하는 부서라면 광고 집행 비용 대비 매출이 나오는 채널이 어디인지 알고 해당 채널에 집중할지, 아니면 신규 고객이 많지만 광고 집행 비용 대비 매출이 적은 채널에 다른 방식으로 콘텐츠 마케팅을 할지 정 할 수있겠죠. 매출액 구매 고객수 X 고객당 구매액 상품 카테고리 X 카테고리별 매출 유입채널 X 유입채널당 매출 유입 고객 수 X 구매 전환율 ※ 매..

데이터 리터러시란 무엇인가? '데이터 리터러시(Data Literacy)' 라는 말입니다. 데이터 문해력 이라는 이름으로 최근 많이 사용하고 있는 단어 입니다. 데이터를전문적으로 다루는 사람이 아니더라도 데이터를 통해 업무를 향상시키는 이해도를 총칭한 말로 쓰입니다. 보다 정확하게는 데이터를 읽고 이해하며 정보로 변환하여 커뮤니케이션 할 수 있는 능력을 말하는 개념으로 사용 됩니다. 데이터를 정보로 바꾸고, 정보를 지식으로 바꾸는 단계에서 데이터 밖 세상에 영향을 주는 것은 사람의 몫 입니다. 따라서 데이터 리터러시의 핵심은 개념적인 도구의 사용이 아닌 데이터 자체에 대한 이해, 이해가 뒷받침된 해석에 포커스가 맞춰져야 합니다. 상관관계나 평균 판단과 같은 간단한 통계 작업을 해석할 수 있는 조직 내 구..

데이터 분석가 흔한 분류 지원이 많음 N배수의 이력서가 들어옴 대부분 타 전공을 수료하고, 교육과정을 이수 사용할수 있는 언어가 SQL only 경우가 많음 (독립적으로 일할수 없다는 뜻) 귀한 분류 python, pandas, jupiter notebook 기준으로 일할수 있는사람이 생각보다 적다. 원천데이터가 RDMS나 클라우드에 있을때 백엔드와 코드를 작성해서 직접가져올수 있는 사람이 적다. 자신의 앞뒤 연결되는 영역까지 아는게 필요하다 데이터 스토리지 : Big Query, Oracle 데이터 수집 : Selenium(Python), request(Python), Beautifulsoup(Python), Scrapy(Python) 데이터 전처리 : Pandas (Python), SQL, Dask ..

DATA, DB, QUERY, SQL 기본 개념을 숙지합니다. SQL 의 작성순서 및 작동순서를 이해합니다. SQL 기본 구조 :SELECT, FROM 을 이용한 쿼리문을 작성합니다. 중복값을 제거하는 DISTINCT 함수를 숙지합니다 데이터는 문자, 숫자, 이미지, 영상, 음성 형태의 "정보" 흔히 우리가 이용하는 카카오톡을 연산해보면 이해가 쉬울 거에요. 이러한 정보를 기반으로, 컴퓨터는 데이터(정보)를 인식하고, 저장하게 됩니다. 데이터 저장차고는 DB (DataBase) 저장된 데이터의 모음을 DB 라고 생각해주세요. 카카오톡으로 지난 메시지 전송내역을 확인하거나, 은행 app 을 통해 일별 통장잔고를 확인하는 것이 곧 'DB'에 저장된 데이터를 확인한다' 는 의미 입니다. DB를 효율적으로 관리..
“전하께서 몇 번이고 저를 내치시든, 저는 계속해서 전하에게 다가갈 거예요. 그리고 전하께서 저를 돌아볼 수밖에 없도록, 엄청나게 멋진 사람이 될 거예요.” “고민하는 사람은, 설혹 길을 헤매더라도 결국은 옳은 방향으로 가기 마련이니까요.” 그저 멈추지 않는다. 뒤돌아볼지언정 앞으로 걸음을 내딛는다. 첫째 우르드. 둘째 베르단디. 셋째 스쿨드. 각자 과거, 현재, 미래를 뜻하는, 운명의 세 여신의 이름을 따온 왕녀들. 너의 장미를 그토록 중요하게 만든건 장미를 위해 네가 소비한 그 시간이야. 싸우면 바로 풀어야하는 사람 vs 시간을 두고 풀어야 하는 사람 조언을 해주고 싶은 사람 vs 공감을 원하는 사람 서운한게 있으면 말하는 사람 vs 말하지 않는 사람 간섭하지 않았으면 하는 사람 vs 간섭이 없으면 ..

이상치(Outlier) 란 보통 관측된 데이터 범위에서 많이 벗어난 아주 작은 값 혹은 큰 값을 말해요 . 1. Extrems Studentized Deviation(ESD) 이용한 이상치 발견 데이터가 정규분포를 따른다고 가정할 떄, 평균에서 표준편차의 3배 이상 떨어진 값 모든 데이터가 정규 분포를 따르지 않을 수 있기 때문에 다음 상황에서는 제한됨 -데이터가 크게 비대칭 일 때 , 샘플 크기가 작을 경우 2. IQR (inter Quantile Range) 를 이용한 이상치 발견 ESD 와 동일하게 데이터가 비대칭적이거나 샘플사이즈가 작은 경우 제한됨 Box plot : 데이터의 사분위 수를 포함하여 분포를 보여주는 시각화 그래프, 상자-수염 그림이라고도 함 사분위 수 : 데이터를 순서에 따라 4등..
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd tips_df = sns.load_dataset('tips' tips_df.head(3) tips_df.describe(include = 'all') tips_df.head(3) #X축, Y 축에 필요한 정보를 넣어서 시각화 #범주형 데이터, 연속형 자료형, 관측치 Y 축 sns.countplot(data =tips_df, x ='day' barplot : X축이 범주형, Y축이 연속형 값 sns.barplot(data = tips_df, x ='sex', y = 'tip', estimator = 'mean') sns.boxplot(data = tips_df, x='time..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 아무일 없는것처럼
- 아하 모먼트
- 그로스 해킹
- ADsP
- 프로덕트 분석가
- 데이터 시각화
- 빅테크
- 데이터 분석가 주니어
- BI
- 설레다
- 데이터분석가
- 알고리즘
- 데이터 리터러시
- 머신러닝
- 통계학
- 프로덕트 매니저
- 퍼포먼스 마케팅
- 기획자
- 방법론
- 프로젝트 매니저
- BA
- 데이터 분석
- 북극성 지표
- 퍼포먼스 마케터
- 데이터 분석가
- PM
- 책 추천
- 빅데이터
- A/B테스트
- 데이터 분석 주니어
- Total
- Today
- Yesterday