import seaborn as sns import matplotlib.pyplot as plt import pandas as pd tips_df = sns.load_dataset('tips' tips_df.head(3) tips_df.describe(include = 'all') tips_df.head(3) #X축, Y 축에 필요한 정보를 넣어서 시각화 #범주형 데이터, 연속형 자료형, 관측치 Y 축 sns.countplot(data =tips_df, x ='day' barplot : X축이 범주형, Y축이 연속형 값 sns.barplot(data = tips_df, x ='sex', y = 'tip', estimator = 'mean') sns.boxplot(data = tips_df, x='time..
탐색적 데이터 분석 (EDA) 탐색적 데이터 분석 (Exploratory Data analysis, EDA ) 는 데이터의 시각화, 기술통계 등의 방법을 통해 데이터를 이해하고 탐구하는 과정 입니다. 이 과정에서 데이터에 대한 정보를 얻을 수도 있고, 적절한 모델링에 대한 정보도 얻을 수 있습니다. 예측 모델링이 아니더라도 데이터 분석에서는 반드시 필요한 과정입니다. 다만, 이전 데이터 분석과 시각화 강의에서 들었다고 가정하고 시각화는 Seaborn 라이브러리를 활용 간단하게 알아보도록 할게요. tips.describe() - include='all' 옵션을 통해 범주형 데이터도 확인 가능 1.countplot : 범주형 자료의 빈도 수 시각화 방법 : 범주형의 데이터의 각 카테고리별 빈도수를 나타낼 때..
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 프로덕트 분석가
- 프로젝트 매니저
- 설레다
- 북극성 지표
- BA
- 데이터 시각화
- 프로덕트 매니저
- 퍼포먼스 마케팅
- 빅데이터
- 데이터분석가
- 데이터 분석 주니어
- 통계학
- 아무일 없는것처럼
- 책 추천
- 퍼포먼스 마케터
- 방법론
- 데이터 분석가 주니어
- 기획자
- 그로스 해킹
- 데이터 분석가
- 데이터 분석
- PM
- 머신러닝
- 데이터 리터러시
- 아하 모먼트
- ADsP
- A/B테스트
- BI
- 알고리즘
- 빅테크
- Total
- Today
- Yesterday