어쩌다통계

[논문 리뷰] 이상치 탐지 | Adversarial Autoencoder

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스트에서는 Autoencoder와 GAN이 결합된 Adversarial AutoEncoders(AAE) 논문을 리뷰해보려고 합니다. 2015년에 게재된 해당 논문은 2022년 10월 기준 2450회 인용될 만큼 많은 주목을 받고 있고 있습니다. 일반적인 Autoencoder(AE)나 Variational AutoEnocoder(VAE)와는 달리 어떤 구조를 가지는 지, 강점은 무엇인 지 차근차근 알아가 보겠습니다. 아래 내용은 논문을 바탕으로 작성하였으며, 중간중간 제가 이해하는데 도움이 되었던 내용(이활석님 자료)들도 추가하였습니다. AE/VAE에 대한 전반적 이해가 필요하시면 이활석님의 네이버 d2-오토인코더의 모든 것 강의를 추천합니다. 0..

Review/논문 리뷰 2022.11.03

Flask로 모델 서빙하기 | 실습

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스팅에서는 간단하게 Flask로 웹 모델 서빙 실습했던 노트북을 정리해보려고 합니다. 전체적인 코드는 아래 자료의 소스를 활용하여 진행하였으며, 중간중간 Flask 모델 서빙 구현에 필요한 개념이나 구조를 추가하였습니다. https://www.analyticsvidhya.com/blog/2020/04/how-to-deploy-machine-learning-model-flask/ How to Deploy Machine Learning Models using Flask (with Code) How can you deploy a machine learning model into production? That's where we use Flask, an..

Programming/Python 2022.11.01

[도서 리뷰] Introducing MLOps, MLOps 도입가이드 part2

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 아래 part1에 이어 MLOps 도입 가이드 도서 정리하였습니다. 본 포스팅에서는 상용 배포, 모니터링과 피드백 루프 챕터에 대한 내용을 다룹니다. 2022.10.27 - [Review/도서 리뷰] - [도서 리뷰] Introducing MLOps, MLOps 도입가이드 part1 [도서 리뷰] Introducing MLOps, MLOps 도입가이드 part1 ML모델 관련 구글링을 하다 보면 DevOps와 비슷한 MLOps라는 용어를 손쉽게 접할 수 있습니다. 저는 처음에는 당장 필요하지 않아 보여 관심을 두지 않았는데, 회사에서 모델을 배포/서빙을 하거나 slowsteadystat.tistory.com Ch6. 상용배포 머신러닝 상용 배포 시 알아..

Review/도서 리뷰 2022.10.27

[도서 리뷰] Introducing MLOps, MLOps 도입가이드 part1

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) ML모델 관련 구글링을 하다 보면 DevOps와 비슷한 MLOps라는 용어를 손쉽게 접할 수 있습니다. 저는 처음에는 당장 필요하지 않아 보여 관심을 두지 않았는데, 회사에서 모델을 배포/서빙을 하거나 개인 프로젝트를 하더라도 API를 만들어 서비스가 가능한 모델을 만들려면 MLOps에 대한 배경지식이 필요하게 됩니다. 본 포스팅은 Introducing MLOps, MLOps 도입 가이드를 읽으며 MLOps를 구상하는데 도움이 되는 부분을 정리하였습니다. https://product.kyobobook.co.kr/detail/S000001810502 MLOps 도입 가이드 | 데이터이쿠 - 교보문고 MLOps 도입 가이드 | MLOps의 개념부터 도입과 ..

Review/도서 리뷰 2022.10.27

DBSCAN 차근차근 이해하기

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 오늘은 클러스터링 방법 중에 널리 사용되는 DBSCAN에 대해 정리해보겠습니다. 성능이 괜찮다하니 그냥 무작정 코드만 갖다 쓰다가 이건 왜 predict가 안되는 걸까 의문이 생겨 DBSCAN이 어떻게 군집을 형성하는지 찾아보았는데요. 작은 개념부터 차근차근 살펴보도록 하겠습니다. 0. DBSCAN?! DBSCAN(Density-based spatial clustering of application with noise) 이름 그대로 밀도기반 클러스터링 방법 입니다. 비계층적 군집화 방법에는 크게 distance-based 방법과 density-based 방법이 있는데, 군집분석을 하면 가장 처음 접하는 k-means clustering은 distance..

Algorithm 2022.10.19

PyOD 라이브러리로 간단하게 이상치 탐지하기

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이상치 탐지를 하다 보면 데이터에 맞는 방법들이 있어 여러 가지 방법들을 적용해보는 편인데, 아무래도 일관성이 떨어지다 보니 이런 방법론들이 모여있는 라이브러리가 없을까?! 하고 찾던 중 PyOD를 발견하게 되어 정리를 해봅니다. 풀네임이 Python Outlier Detection인 PyOD는 다변량 데이터에 적용 가능한 이상치 탐지 방법론들이 30개 이상 구현되어 있는 라이브러리입니다. 가장 기본적인 LOF부터 HBOS, OCSVM, IForest와 제가 좋아하는 AutoEncoder와 VAE까지 방법론이 너무 많아 우선 여기 있는 이상치 탐지 방법론부터 공부해봐도 좋겠다 생각이 들었습니다. 예전에 나온 방법론뿐 아니라 2022년에 나온 ECOD라는..

Programming/Python 2022.10.19

어쩌다통계

전체 글 39

티스토리툴바