2024 3

Tabular Data 분류, 아직도 Tree모델을 사용하고 있는 이유는?!

딥러닝이 발전하면서 다양한 방법론들이 쏟아지고 있습니다. 하지만 Tabular data 분석에는 체감 상 아직 트리기반의 방법들이 많이 쓰이고 있습니다. 본 포스팅에서는 새로 나온 딥러닝 기반의 Tabular data 분류 방법에는 어떤 것들이 있는지 살펴보고, 아직도 트리기반의 방법론들이 강점을 보이는 이유에 대해 정리해보려고 합니다.  1. 딥러닝 기반 Tabular Classification 방법론TabTransformer- TabTransformer는 구글 리서치에서 발표한 모델로, Transformer 아키텍처를 기반으로 하여 탭형 데이터에 적용 - 카테고리형 데이터와 수치형 데이터를 함께 다룰 수 있음 - 특징: 카테고리형 데이터의 인코딩을 효과적으로 처리하며, 복잡한 상호작용을 학습 - 참고..

Algorithm 2024.12.16

[도서 리뷰] 코드 밖 커뮤니케이션

이번 포스트에서는 오랜만에 서점에 들렀다가 제목에 홀려서 읽게 된 "코드 밖 커뮤니케이션"이라는 도서를 리뷰해 보겠습니다. 코드를 잘 짜는 것도 물론 중요하지만 사람들과 같이 협업을 하다 보면 코딩 역량 만큼이나 중요하다 생각되는 부분이 있는데요. 바로 커뮤니케이션 능력입니다.  커뮤니케이션이라는 것을 무엇을 의미할까요? 정보, 소식, 아이디어, 감정 등을 공유 또는 교환한다는 의미로 많이들 생각하실 것 같은데, 이 책에서는 공유 또는 교환을 넘어 공동의 이해를 도모하는 것으로 정의하고 있습니다. "코드 밖 커뮤니케이션"에서는 4가지 챕터를 나눠 커뮤니케이션에 필요한 다양한 방법 및 이론 등을 소개하고 있습니다. 본 포스트는 첫 2개의 챕터인 "시각적 커뮤니케이션"과 "멀티모달 커뮤니케이션"을 읽으면서 ..

Poetry 분리환경 구축기 A-Z (docker-poetry-jupyter 조합)

이 글이 도움 되셨다면 광고 클릭 부탁드립니다 최근 pandas2.0/autogluon 등 새로운 라이브러리들이 써보고 싶어서 pip로 무지성 업그레이드를 해버렸고, 배치로 돌아가던 ML모델이 돌아가지 않는 이슈를 맞이했습니다;; 영영 옛 버전의 라이브러리를 사용할 수 없기에 분리 환경을 구축해보려고 합니다. 단순하게 분리되는 환경은 가상환경을 만들어 사용할 수 있겠지만, 라이브러리 간의 의존성 관리부터 패키징까지 편하게 도와주는 Poetry를 이번 기회에 셋팅해보려고 합니다. https://python-poetry.org/docs/Introduction | Documentation | Poetry - Python dependency management and packaging made easyIf yo..

Programming/Python 2024.04.07