어쩌다통계

    Programming/Python 8

    [EDA] density plot, correlation plot | seaborn

    대표적인 데이터 시각화 패키지인 seaborn 패키지를 활용하여 데이터 분포와 상관관계 그래프를 그립니다. # 커널 밀도 함수 + 히스토그램 import seaborn as sns # 데이터 시각화 패키지 sns.distplot(tr_y["hhb"], color="blue", label="hhb") sns.distplot(tr_y["hbo2"], color="red", label="hbo2") sns.distplot(tr_y["ca"], color="green", label="ca") sns.distplot(tr_y["na"], color="yellow", label="na") plt.legend(title = 'Ys') # 상관관계 sns.heatmap(data = tr_y.corr(), annot=F..

    Programming/Python 2022.10.19

    [EDA] 결측 데이터 분포 탐색 | missingno pkg.

    데이터 분석을 하다 보면 fully 관측된 데이터를 받는 게 얼마나 감사하고 또 드물게 일어나는지 모두 잘 아실 텐데요. 저는 EDA 분석할 때 먼저 결측 데이터의 분포를 살펴보는 편입니다. 때로는 결측 값 자체로 어떠한 의미를 가지는 경우가 있기 때문이죠. 결측의 mechanism에는 4가지가 있습니다. 1. MCAR(missing completely at random) : 결측의 여부가 랜덤 2. MAR(missing at random) : 특정 변수의 결측 여부가 다른 변수와 관련 3. MNAR(missing not at random) : 특정 변수의 결측 여부가 다른 변수에 의해 결정 오늘은 Python 함수에 이런 결측의 분포를 쉽게 살펴보기 위한 missingno라는 패키지를 소개합니다. im..

    Programming/Python 2022.10.19
    이전
    1 2
    다음
    더보기
    • Data Science
      • Algorithm
      • Programming
        • Python
        • R
        • Others
      • Review
        • 논문 리뷰
        • 도서 리뷰
        • 대회 리뷰

    Tag

    fbprophet, anomaly detection, 2021, python, 이상치 탐지, 2023, bentoml, 모델 서빙, PyOD, 시계열 예측, 2020, 차원축소, MLOps 도입가이드, 2022, 쿠버네티스, 모델 배포, Introducing MLOps, mlops, 2024, PROPHET,

    최근글과 인기글

    • 최근글
    • 인기글

    방문자수Total

    • Today :
    • Yesterday :

    Copyright © Kakao Corp. All rights reserved.

    • SOTA
    • Dacon
    • Kaggle
    • 모두의MLOps
    • github_anomaly-detection-resou…
    • github_awesome-TS-anomaly-dete…
    • github_SOTA of Anomaly detecti…
    • github_Weekly Arxiv
    • github_DeepOD

    티스토리툴바