728x90
대표적인 데이터 시각화 패키지인 seaborn 패키지를 활용하여 데이터 분포와 상관관계 그래프를 그립니다.
# 커널 밀도 함수 + 히스토그램
import seaborn as sns # 데이터 시각화 패키지
sns.distplot(tr_y["hhb"], color="blue", label="hhb")
sns.distplot(tr_y["hbo2"], color="red", label="hbo2")
sns.distplot(tr_y["ca"], color="green", label="ca")
sns.distplot(tr_y["na"], color="yellow", label="na")
plt.legend(title = 'Ys')
# 상관관계
sns.heatmap(data = tr_y.corr(), annot=False, fmt = '.2f', linewidths=.5, cmap='Blues')
# annot : 상관계수
# fmt : 상관계수 출력 format
반응형
'Programming > Python' 카테고리의 다른 글
PyOD 라이브러리로 간단하게 이상치 탐지하기 (3) | 2022.10.19 |
---|---|
plotly와 dash로 만드는 python dashboard 기초 (0) | 2022.10.19 |
PyTorch란 무엇일까?! with GANomaly (0) | 2022.10.19 |
Pandas Cheat Sheet (0) | 2022.10.19 |
[EDA] 결측 데이터 분포 탐색 | missingno pkg. (0) | 2022.10.19 |