티스토리 뷰

카테고리 없음

EDA 실습

루돌푸다요 2024. 3. 14. 16:20

import seaborn as sns

import matplotlib.pyplot as plt

import pandas as pd

 

tips_df = sns.load_dataset('tips'

tips_df.head(3)

 

tips_df.describe(include = 'all')

 

tips_df.head(3)

 

#X축, Y 축에 필요한 정보를 넣어서 시각화

#범주형 데이터, 연속형 자료형, 관측치 Y 축 

 

sns.countplot(data =tips_df, x ='day'

 

barplot : X축이 범주형, Y축이 연속형 값 

sns.barplot(data = tips_df, x ='sex', y = 'tip', estimator = 'mean')

 

sns.boxplot(data = tips_df, x='time', y='total_bill')

 

sns.histplot(data= tips_df, x='total_bill)

 

tips_df['total_bill].hist()

tips_df['total_bill].plot.hist()

 

X축 : 수치형 변수 , Y 축 : 수치형 변수 

sns.scatterplot(data =tips_df, x = 'total_bill', y= 'tip)

 

sns.pairplot(data=tips_df)