2021 8

Flask로 모델 서빙하기 | 실습

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스팅에서는 간단하게 Flask로 웹 모델 서빙 실습했던 노트북을 정리해보려고 합니다. 전체적인 코드는 아래 자료의 소스를 활용하여 진행하였으며, 중간중간 Flask 모델 서빙 구현에 필요한 개념이나 구조를 추가하였습니다. https://www.analyticsvidhya.com/blog/2020/04/how-to-deploy-machine-learning-model-flask/ How to Deploy Machine Learning Models using Flask (with Code) How can you deploy a machine learning model into production? That's where we use Flask, an..

Programming/Python 2022.11.01

plotly와 dash로 만드는 python dashboard 기초

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스팅에서는 실시간 데이터 현황 파악을 하거나 사용자의 목적에 맞게 데이터를 시각화해서 보여주기위해 python으로 dash board를 만드는 절차나 기본 구조가 어떻게 되어 있는지 정리해보려고 합니다. 참고한 도서는 파이썬을 이용한 인터랙티브 대시보드 만들기라는 책이고 POD 상품으로 주문하면 그 때 제작이 들어가서 살까말까 오랫동안 망설였는데, plotly나 dash에 대한 아무 개념이 없다면 충분히 사도 좋은 책이라고 생각합니다. 함수들이 어떤 구조로 어떤 절차로 진행되는 지 설명이 있어서 기초를 쌓는데 도움이 많이 되었습니다. http://www.yes24.com/Product/Goods/102267640 파이썬을 이용한 인터랙티브 대시보..

Programming/Python 2022.10.19

모델 앙상블 방법 | Stacking, Blending, Voting

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 본 포스팅은 아래 블로그를 번역하여 작성하였으며, 중간중간 이해가 잘 안 되는 부분들에 내용 추가하였습니다. https://towardsdatascience.com/ensemble-learning-stacking-blending-voting-b37737c4f483 Ensemble Learning: Stacking, Blending & Voting If you want to increase the effectiveness of your ML model, maybe you should consider Ensemble Learning towardsdatascience.com 앙상블 학습이란? 분류나 회귀 등의 문제를 풀기 위해 ML 알고리즘을 jointly ..

Algorithm 2022.10.19

[Kaggle] IEEE-CIS fraud detection, 이상거래 탐지 캐글 1등 솔루션

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스팅에서는 2년 전 캐글에서 3개월간 진행된 Fraud detection Competition에서 우승한 분의 분석 과정과 팁에 대해 배워보려고 합니다. 평소 관심 있었던 주제이기도 하고 1등 하는 사람들은 데이터 불균형 문제를 어떻게 해결하고 어떤 모델을 쓰는지가 무척 궁금했습니다. 이상치 탐지를 위한 새롭고 복잡한 방법론들이 많이 나오긴 했지만 실제 적용해봐도 성능이 좋은지 모르겠더라고요...ㅎ 제가 뭘 빠트리고 있는지 체크할 겸! IEEE-CIS fraud detection의 1등 솔루션을 번역 및 정리해보겠습니다. 0. Overview 식료품점의 계산대 앞에 긴 줄을 서고 계산원이 조용히 카드가 거부되었다고 발표한다고 상상해 보십시오. 이..

[논문 리뷰] 이미지 클러스터링 | Deep Adaptive Image Clustering(2017)

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 오늘은 이미지 클러스터링 방법론 중에 2017년 ICCV에 게재된 Deep Adaptive Image Clustering 논문을 리뷰해보려고 합니다. github에 코드도 공유되어서 가볍게 돌려보기도 좋습니다. 기존의 방법들과 어떤 게 다른지, 성능은 어떤지에 대해 간략하게 알아보도록 하겠습니다. 이번 포스팅에 사용된 사진과 문서는 모두 DAC 논문과 저자 발표 자료에서 발췌하였습니다. 0. basic approach 가장 일반적인? 기본적인? 이미지 군집화 방법은 CNN류의 레이어로 이미지들의 feature를 추출하고 그 feature들로 tabular 데이터에 사용하는 k-means와 같은 군집화 방법론을 적용하는 것입니다. 이 사이에 PCA를 추가..

[Linux] 리눅스 디렉토리 구조 초간단 살펴보기(+ 기본 단축키)

대용량의 데이터를 다루다 보면 로컬 컴퓨터가 아닌 서버에서 작업을 하게 되는데, 서버에 분석 환경을 구축하고 관리를 원활하게 하기 위해서 리눅스 공부를 시작했습니다. 이번 포스팅은 리눅스를 처음 접하는 사람들에게 좀처럼 익숙해지지않는 디렉터리 구조를 살펴보려고 합니다. 윈도우는 윈도우 탐색기에서 눈으로도 전체 구조를 볼 수 있고 마우스로 간편...하게 확인할 수 있는 반면, 리눅스는 명령어를 입력해서 무엇이 어디 있고 속성을 어떤지 확인을 해야 하기 때문에 보이지 않는 진입장벽이 저를 힘들게 하더군요. 저와 비슷한 어려움을 느끼시는 분들과 저를 위해 가장 기본이 되는 디렉토리 구조에 대해 살펴보도록 하겠습니다. 아래에서 설명드릴 내용은 모두를 위한 리눅스 프로그래밍이라는 책과 구글링을 바탕으로 작성되었습..

Programming/Others 2022.10.19