본문 바로가기

반응형

분류 전체보기

(369)
리눅스 Operating System (OS)는 하드웨어나 네트워크를 제어하는 것으로 개발 업무 시스템으로는 대부분 리눅스를 사용합니다. 리눅스는 1991년에 리누스 토르발즈 (버젼관리 시스템 git 또한 만드신 분..) 이 개발한 Unix 호환 서버 OS로 자원봉사자나 기업의 엔지니어로 구성된 커뮤니티에 의해 지속적으로 수정 관리되는 오픈소스입니다. 대부분의 서버와 모바일, 임베디드 시스템의 OS로 사용됩니다. 리눅스 커널 리눅스는 커널을 통해 메모리, 파일 시스템, 프로세스를 관리하고 디바이스를 제어합니다. 사용자는 리눅스 커널을 통해 디바이스에 접근하며, 실행된 프로세스에 PID를 할당하여 관리합니다. 또한 프로세스가 실행되기 위해서 메모리에 탑재되어야 되는데, 리눅스 커널은 프로그램/데이터를 물리 메모리..
하드웨어와 네트워크 시스템 기반에서 가장 하위 레이어를 구성하는 요소는 하드웨어와 네트워크입니다. 이번 포스트에서는 온프레미스 시스템 혹은 클라우드 시스템을 구축하기 위한 하드웨어와 네트워크의 기본 지식을 알아보도록 하겠습니다. 서버 장비 CPU (Central Processing Unit) CPU란 프로그램의 처리를 수행하는 시스템의 핵심적인 부품으로 작동 주파수가 크거나 코어가 많아질 수록 연산 능력이 높아집니다. 하드웨어의 발전에 힘입어 최근 대부분의 서버는 멀티 코어를 사용합니다. 또한, CPU는 프로그램의 처리를 위해 메모리에 접근하게 되는데, 메모리와의 처리 속도 차이를 완화할 목적으로 캐시를 사용합니다. CPU는 입출력장치, 기억장치, 연산장치 등의 컴퓨터 리소스를 활용하여 멀티 태스킹을 위한 작업들의 우선순위..
Variational Autoencoders and Importance Weighted Autoencoders Variational Autoencoders (VAE)는 데이터를 latent 공간 상의 분포로 매핑하는 encoder와 latent 공간에서 데이터 공간 상의 분포로 매핑하는 decoder로 이루어진 확률 기반의 생성 모델로, 2013년에 발표된 이후로 많은 분야의 연구 대상이 되어 왔습니다. VAE는 직접적으로 다룰 수 없는 posterior probability $p(z|x)$를 encoder를 통해 근사시킴으로써 $q(z|x)$ 데이터의 likelihood에 대한 variational lower bound를 유도하여 생성 모델을 훈련합니다. Importance Weighted Autoencoders (IWAE) 는 2016년 Burda에 의해 발표된 VAE의 개량 모델로 기존의 variationa..
Deep State Space Models for Time Series Forecasting 시계열 데이터 예측은 각종 산업의 의사 결정 단에서 두루 사용되는 분야로 비용 감소, 재고 관리 등의 업무에 사용됩니다. 기존에는 예측 모델의 구조를 미리 가정하고 추세나 계절성 등의 패턴을 예측하는 state space models (SSM)이 주로 사용되었습니다만, 사용가능한 시계열 데이터의 수와 feature가 많아짐에 따라 적절한 모델과 입력/출력 구조를 정의하는데 오랜 시간이 걸립니다. 또한, 각 시계열 데이터마다 별도로 모델링되다 보니 비슷한 시계열 데이터들의 공통된 패턴을 활용하지 못하는 단점도 있습니다. 이에 반해 deep neural networks를 사용한 예측은 deep neural networks의 강력한 feature extraction에 힘입어 raw 데이터로부터 복잡한 패턴을 ..
Classification-based Anomaly Detection for General Data 이 논문은 classification 기반의 이상 탐지를 수행한 GEOM (Geometric-transformation classification) 을 확장하여 이미지 이외의 tabular 등의 다른 데이터 타입에도 적용 가능한 이상 탐지 알고리즘을 (GOAD) 제안한 논문입니다. 훈련 데이터에 정상 데이터만 포함된 semi-supervised 시나리오를 가정하였고 open-set classification 에서 영감을 받아 inter-class separation (각 클래스 간의 거리)은 늘리고 intra-class separation (한 클래스 안의 거리) 줄어들도록 GEOM 알고리즘을 개선했습니다. 또한, 이미지가 아닌 데이터에 대해서도 일반화가 가능하도록 기존의 기하학적인 transformat..
Interpretable Explanations of Black Boxes by Meaningful Perturbation 딥러닝 모델은 여러 분야에서 기존의 방법보다 강력한 성능을 보이지만 수많은 비선형의 조합으로 이루어져 왜 잘되는지를 설명하기가 쉽지 않아 보통 black-box 함수로 불리웁니다. 의사 결정 시에는 딥러닝 모델의 결과를 무조건적으로 신뢰하는 것이 아니라 왜 그런 결과를 나타내는지에 대한 설명이 판단 근거로 필요하기 때문에 explainable AI (XAI) 분야에 대한 관심이 점점 높아지고 있는 상황입니다. 예를 들어 이미지의 어떤 부분을 보고 특정한 클래스를 예측했는지 설명이 필요하다는 것이죠. 이 논문은 딥러닝 모델, black-box 함수 $f$의 입출력 관계를 해석하는 방법으로 다음 그림처럼 classification 에서 이미지의 어떤 부분이 $f$의 결과에 가장 큰 영향을 미치는지 설명합니다..
Deep Anomaly Detection Using Geometric Transformations 이 논문은 이미지의 geo-transformation을 이용한 이상 탐지 알고리즘을 제안합니다. 입력 이미지에 대해 flipping, rotation 등의 transformation을 통해 얻은 self-labeled (자가 라벨) 데이터를 이용해 일반적인 classifier를 학습시키고 classifier의 score로부터 정상, 비정상 여부를 판단합니다. 이 방법은 classifier가 정상 데이터에 대한 geo-transformed 된 이미지를 어떠한 transformation을 적용하였는지 잘 구분하게 학습하게 되면 정상 데이터의 도드라지는 공통된 feature를 얻을 수 있게 되리라는 동기에서 출발하였습니다. Methods Problem statement 먼저 문제를 정의하겠습니다. 주어진 정상..
Deep Semi-Supervised Anomaly Detection 일반적으로 anomaly detection은 비지도 학습을 가정합니다. 무엇이 정상이고 비정상인지 모르지만 대부분의 데이터가 정상일 것이다라고 가정하고 학습을 진행합니다. 하지만 이상 탐지 문제에서 도메인 전문가들에 의한 라벨 데이터가 주어지는 경우도 많습니다. 즉, 라벨이 되어 있지 않은 데이터 이외에도 정상, 비정상 라벨이 되어 있는 데이터도 존재하는 것이죠. 이 논문은 정상, 비정상으로 라벨링된 데이터를 포함한 semi-supervised 이상 탐지 방법론을 제안하여 라벨링된 데이터를 이용해 기존 비지도 학습 기반 이상 탐지보다 더 높은 성능을 보였습니다. 먼저 semi-supervised (준지도) 의 개념을 먼저 짚고 넘어가야합니다. 준지도 학습은 라벨링되지 않은 데이터와 라벨링된 데이터 모두 ..

반응형