전체 글 39

Tabular Data 분류, 아직도 Tree모델을 사용하고 있는 이유는?!

딥러닝이 발전하면서 다양한 방법론들이 쏟아지고 있습니다. 하지만 Tabular data 분석에는 체감 상 아직 트리기반의 방법들이 많이 쓰이고 있습니다. 본 포스팅에서는 새로 나온 딥러닝 기반의 Tabular data 분류 방법에는 어떤 것들이 있는지 살펴보고, 아직도 트리기반의 방법론들이 강점을 보이는 이유에 대해 정리해보려고 합니다.  1. 딥러닝 기반 Tabular Classification 방법론TabTransformer- TabTransformer는 구글 리서치에서 발표한 모델로, Transformer 아키텍처를 기반으로 하여 탭형 데이터에 적용 - 카테고리형 데이터와 수치형 데이터를 함께 다룰 수 있음 - 특징: 카테고리형 데이터의 인코딩을 효과적으로 처리하며, 복잡한 상호작용을 학습 - 참고..

Algorithm 2024.12.16

[도서 리뷰] 코드 밖 커뮤니케이션

이번 포스트에서는 오랜만에 서점에 들렀다가 제목에 홀려서 읽게 된 "코드 밖 커뮤니케이션"이라는 도서를 리뷰해 보겠습니다. 코드를 잘 짜는 것도 물론 중요하지만 사람들과 같이 협업을 하다 보면 코딩 역량 만큼이나 중요하다 생각되는 부분이 있는데요. 바로 커뮤니케이션 능력입니다.  커뮤니케이션이라는 것을 무엇을 의미할까요? 정보, 소식, 아이디어, 감정 등을 공유 또는 교환한다는 의미로 많이들 생각하실 것 같은데, 이 책에서는 공유 또는 교환을 넘어 공동의 이해를 도모하는 것으로 정의하고 있습니다. "코드 밖 커뮤니케이션"에서는 4가지 챕터를 나눠 커뮤니케이션에 필요한 다양한 방법 및 이론 등을 소개하고 있습니다. 본 포스트는 첫 2개의 챕터인 "시각적 커뮤니케이션"과 "멀티모달 커뮤니케이션"을 읽으면서 ..

Poetry 분리환경 구축기 A-Z (docker-poetry-jupyter 조합)

이 글이 도움 되셨다면 광고 클릭 부탁드립니다 최근 pandas2.0/autogluon 등 새로운 라이브러리들이 써보고 싶어서 pip로 무지성 업그레이드를 해버렸고, 배치로 돌아가던 ML모델이 돌아가지 않는 이슈를 맞이했습니다;; 영영 옛 버전의 라이브러리를 사용할 수 없기에 분리 환경을 구축해보려고 합니다. 단순하게 분리되는 환경은 가상환경을 만들어 사용할 수 있겠지만, 라이브러리 간의 의존성 관리부터 패키징까지 편하게 도와주는 Poetry를 이번 기회에 셋팅해보려고 합니다. https://python-poetry.org/docs/Introduction | Documentation | Poetry - Python dependency management and packaging made easyIf yo..

Programming/Python 2024.04.07

[논문 리뷰] 이상치 탐지 | Deep Isolation Forest for Anomaly Detection

이 글이 도움 되셨다면 광고 클릭 부탁드립니다 : ) 오랜만에 이상치 탐지 방법론 리뷰를 해보려고 합니다. 어떤 방법론을 공부해볼까 하고 찾아보다 2023년에 나온 Deep Isolation Forest for Anomaly Detection, DIF라는 Isolation Forest 기반의 딥러닝 방법론이 있어 살펴보려고 합니다. PyOD 라이브러리에 들어가 있어서 실제 적용도 간단하게 해 볼 수 있을 것 같네요. https://slowsteadystat.tistory.com/25 PyOD 라이브러리로 간단하게 이상치 탐지하기 이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이상치 탐지를 하다 보면 데이터에 맞는 방법들이 있어 여러 가지 방법들을 적용해보는 편인데, 아무래도 일관성이 떨어지다 보니 ..

추천 시스템 | TensorFlow Recommenders 리뷰 & 실습

이 글이 도움되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스트에서는 2020년 9월에 공개된 추천시스템 라이브러리인 TensorFlow Recommenders의 대략적인 컨셉에 대해 알아보고 예제 데이터로 모델이 어떻게 돌아가지는 지 살펴보겠습니다. 최근 추천 관련 대회를 준비하면서 여러 가지 추천 방법론을 시도해 보았는데, 그중 나름 성능이 괜찮았던 TFRS에 대해 한번 정리해보려고 합니다. 추천 시스템?! 일상생활에서 많이 접해보셨을텐데요, 사용자의 취향에 맞는 상품, 컨텐츠를 추천해 주어 사용자에게는 맞춤 서비스를 제공할 수 있고 기업에서는 매출을 증가시키거나 사이트 체류시간을 높일 수 있을 것 입니다. McKindsey의 조사에 따르면, 아래와 같이 각종 서비스에서 추천 시스템은 주요한 역할을 ..

Algorithm 2023.11.14

[논문 리뷰] 이상치 탐지 | MemAE, Memorizing Normality to Detect Anomaly

이 글이 도움 되셨다면 광고 클릭 부탁드립니다 : ) 이번 포스트에서는 MemAE에 대해 정리해보려고 합니다. 작년에 봤던 논문이라 다소 설명이 부족한 부분이 있을 수도 있겠네요...! 그래도 더 잊어버리기 전에 간단하게 정리를 해보겠습니다. 우선 MemAE는 2019년에 발표된 논문으로 풀네임은 Memorizing Normality to Detect Anomaly : Memory-augmented Deep Autoencoder for Unsupervised Anomaly Detection입니다. 23년 4월 기준으로 816회 인용되었고 논문은 아래 링크로 확인 가능합니다. https://openaccess.thecvf.com/content_ICCV_2019/papers/Gong_Memorizing_No..