본문 바로가기

반응형

Machine Learning Tasks

(67)
3d object 파일 읽기 최근 메타버스, AR/VR 솔루션이 각광받으면서 3차원 모델링에 대한 딥러닝 연구도 활발히 진행되고 있습니다. 3차원 데이터는 2차원인 이미지와 달리 Z 축을 포함한 3개의 축으로 데이터를 표현하기 때문에 카메라가 바라보는 각도에 따라 물체를 합성할 수 있고 뎁스 정보를 이용한 보다 정확한 이미지 변주가 가능합니다. 가장 간단한 예로는 여러 각도에서 촬영한 어떤 물체의 이미지를 통해 그 물체의 3차원 데이터를 모델링할 수 있다면 다른 각도에서 그 물체를 촬영했을 때의 이미지를 생성해 낼 수 있는 거죠. 이번 포스트에서는 3차원 모델링의 핵심은 3차원 데이터의 구조 및 해석 방법에 대해 알아보도록 하겠습니다. 3차원 데이터 이미지는 2차원, 높이/너비의 픽셀로 구성되어 있습니다. 특정 높이/너비 위치에 있..
RecSys - DeepFM RecSys - Factorization Machines (1) ResSys - Factorization Machines (2) RecSys - Field-aware Factorization Machines 유저가 추천된 아이템에 대하여 클릭할 확률을 예측하는 CTR (Click Through Rate) prediction은 온라인 광고, 유튜브 등의 모바일 어플리케이션에 유용하게 탑재되는 알고리즘으로 수많은 데이터가 존재하는 상황에서 플랫폼의 수익성 증대, 유저 관리 측면에서 매우 중요합니다. 지난 포스트에서 살펴본 FM (Factorization Machine)이나 FFM (Field-aware Factorization Machine)에서는 희박하고 (sparse) 고차원 (high-dimension..
RecSys - Field-aware Factorization Machines 지난 포스트 [Machine Learning/기타] - RecSys - Factorization Machines (1) [Machine Learning/기타] - ResSys - Factorization Machines (2) [Machine Learning/기타] - RecSys - Factorization Machines (3), Pytorch 구현 Factorization Machines (FM)은 sparse한 데이터 상황에서 각 feature 간의 상호관계를 모델링하기 위해 Equation 1과 같이 각 feature의 잠재벡터를 (임베딩 벡터) 학습하고 feature의 선형결합과 잠재벡터의 내적으로 타겟을 예측했습니다. CTR (Click Through Rate)을 예측하기 위한 Table 1..
RecSys - Factorization Machines (3), Pytorch 구현 RecSys - Factorization Machines (1) ResSys - Factorization Machines (2) 이번 포스트에서는 Factorization Machines (FM)을 Pytorch 프레임워크로 구현해보려 합니다. 먼저 추천 시스템에서 자주 쓰이는 벤치마크 데이터셋 MovieLens 20M을 다운받습니다. MovieLens 데이터셋은 다양한 종류가 있으며 여러 유저의 여러 영화에 대한 평가와 장르, 태그와 같은 메타 데이터가 csv 파일로 존재합니다. 그중 MovieLens 20M 데이터셋은 13만여명 유저의 3만여개의 영화에 대한 2백만개의 5-star 레이팅으로 구성되어 있습니다. (Figure 1, ratings.csv) Load datasets 먼저 Pytorch의 ..
ResSys - Factorization Machines (2) RecSys - Factorization Machines (1) Comparison to SVM SVM의 결과 $\hat{y} (x)$는 kernel $K$와 Equation 1으로 연관된, feature 공간 $R^n$ 에서 고차원 공간 $F$로 향하는 매핑함수 $\phi$와 모델 파라미터 $w$와의 내적 $$로 표현할 수 있습니다. 따라서 $K$를 어떻게 설정하느냐에 따라 입력 $x\in R^n$을 어떤 공간으로 매핑해서 hyperplane을 구할지 정해지게 되는데요, Linear kernel 먼저 가장 간단한 선형 커널 $K_l (x, z) := 1 + $ 를 생각해볼 수 있습니다. 이는 $\phi (x) := (1, x_1, ..., x_n)$ 와 같고 $\hat{y} (x)=$를 이용하여 Equ..
RecSys - Factorization Machines (1) 유튜브, 넷플리스, 이커머스 등의 플랫폼을 사용하다보면 연관된 영상과 제품이 여러 사용자의 다양한 데이터와 머신러닝 알고리즘에 기반하여 추천됩니다. 내가 이 플랫폼을 처음 사용한다거나 이러한 제품, 영상을 본 적이 없는데도 어떻게 새로운 컨텐츠를 추천할 수 있을까요? 일반적으로 추천 시스템에 (recommender systems) 사용되는 데이터는 Figure 1의 형태처럼 표현할 수 있을겁니다. 행이 유저가 되고 열이 컨텐츠가 되어 특정 인덱스의 행열 값은 유저의 컨텐츠에 대한 rating (score)가 되겠죠. 여기서의 추천 문제는 Figure 1의 데이터에 기반하여 어떤 유저가 어떤 컨텐츠를 얼마나 좋아할까를 예측하는 것입니다. 이러한 류의 문제는 기존의 행렬분해법 (Matrix Factoriza..
Object Detection - EfficientDet (2) 이전 포스트 [Machine Learning/Vision] - Object Detection - EfficientDet (1) Experiements Object detection COCO 2017 테스트 데이터셋에 대해 성능을 평가하고 data augmentation 기법으로 horizontal flipping 과 cropping 직전에 이미지를 0.1-2.0 사이로 리사이즈하는 scale jittering 을 사용합니다. 성능평가 방법으로 soft-NMS를 사용합니다. 성능평가 결과는 Table 2와 같습니다. Table 2는 비슷한 성능을 가진 다른 baseline 모델과 묶은 것으로 먼저 EfficientDet-D0는 YOLOv3 과 성능이 비슷하면서 FLOPS는 28배 정도 적습니다. Retin..
Object Detection - EfficientDet (1) CNN 모델의 속도-성능 tradeoff 문제는 굉장히 중요합니다. MobileNet, ShuffleNet, EfficientNet 모델과 같이 모델의 파라미터와 연산량을 (FLOPS) 줄이면서 컴퓨터 비젼의 다양한 태스크에 대한 성능을 높이려는 경량화 시도가 계속되고 있는데요, 여러 vision 관련 태스크 중에서도 object detection 태스크는 핸드폰, 자율주행, 로봇 등 다양한 분야에 적용되므로 모델의 연산량, 크기를 줄이면서 정확도를 높이는 것이 매우 중요합니다. 이번 포스트에서 살펴볼 내용은 구글에서 발표한 EfficientDet 으로 scalable, efficient object detection 을 위해 1) BiFPN detector, 2) EfficientNet compount..

반응형