티스토리 뷰
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
iris_df = sns.load_dataset('iris')
iris.head(3)
iris_df.info()
sns.scatterplot(data = iris_df, x = 'sepa_length', y = 'sepal_width')
sns.scatterplot(data = iris_df, x = 'sepal_length', y='sepal_width', hue ='species')
iris_df2 = iris_df[['sepal_length', 'sepal_width', 'petal_length', 'petal_width']]
iris_Df2.head(3)
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters = 3, init = 'K-means++', max_iter = 300, random_state = 42)
kmeans.fit(iris_df2)
kmeans.labels_
iris_df2['taget'] = iris_df['species']
iris_df2['cluster'] = kmeans.labels_
iris_df2
plt.figure(figsize = (12,6))
pltsubplot(1,2,1)
sns.scatterplot(data = iris_df2, x = 'sepal_length', y = 'sepal_width', hue = 'target, plaette = 'viridis')
plt.title('Original')
plt.subplot(1,2,2)
sns.scatterplot(data = iris_df2, x = 'sepal_length', y = 'sepal_width', hue = 'cluster')
plt.title('Clustering')
plt.show()
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
최근에 올라온 글
최근에 달린 댓글
글 보관함
링크
TAG
- ADsP
- 데이터 분석 주니어
- 프로젝트 매니저
- 프로덕트 매니저
- 데이터 분석가 주니어
- 아무일 없는것처럼
- 그로스 해킹
- 통계학
- 데이터 시각화
- 빅테크
- 데이터 분석
- 북극성 지표
- 기획자
- BI
- 방법론
- BA
- 알고리즘
- 설레다
- 아하 모먼트
- 책 추천
- PM
- 데이터 분석가
- 프로덕트 분석가
- A/B테스트
- 데이터 리터러시
- 퍼포먼스 마케터
- 데이터분석가
- 빅데이터
- 퍼포먼스 마케팅
- 머신러닝
- Total
- Today
- Yesterday