[이상탐지] 오토인코더(AutoEncoder)에 대한 자세한 설명

티스토리 뷰

Data Science&AI

[이상탐지] 오토인코더(AutoEncoder)에 대한 자세한 설명

calmmimi 2021. 7. 14. 00:26

🟩 오토인코더(AutoEncoder)란 무엇인가?

◼ 오토인코더를 이용하면 데이터에 대한 Labeling을 하지 않아도 데이터의 주성분이 되는 입력 데이터의 특징들을 학습할 수 있다.

◼ 레이블 되어 있지 않은 훈련 데이터를 사용해서 효율적인 표현인 coding을 학습할 수 있는 인공 신경망

✔ coding(코딩) : 일반적인 부호화, 입력데이터보다 훨씬 낮은 차원을 가진 은닉층

✔ 입력이 곧 타겟이 되는 자기지도 학습(self-supervised learning)이라고도 부름

◼ 오토인코더의 학습 목표는 Output을 가능한 Input에 근사 시키는 것이다.

◼ 이상 감지 시 정상 데이터를 학습하여 이상 데이터가 들어올 때 발생되는 오차에 따라 이상 패턴을 감지한다.

🟩 오토인코더(AutoEncoder) 사용 목적

◼ 오토인코더가 차원 축소에 유용

◼ 오토인코더가 강력한 특성 추출기처럼 작동하여 심층 신경망의 비지도 사전훈련에 사용(이상감지)

◼ 오토인코더는 훈련 데이터와 매우 비슷한 새로운 데이터를 생성 가능, 이를 생성모델(generative model)이라 함

🟩 오토인코더(AutoEncoder) 구성

오토인코더가 입력을 받아 효율적인 내부 표현으로 바꾸고 입력과 매우 가까워 보이는 어떤 것을 출력
(출력은 오토인코더가 입력을 재구성하기 때문에 재구성(reconstruction)이라고 부름)

◼ 인코더(Encoder) : 입력 데이터를 내부 표현(code라는 은닉층)으로 바꿈(인지네트워크(recognition network))

◼ 디코더(Decoder) : 내부 표현(code)을 출력 데이터로 바꿈 (생성네트워크(generative network))

(출력층의 뉴런 수가 입력 개수와 동일하는 것을 제외하면 일반적으로 오토인코더는 MLP(다층 퍼셉트론)와 동일한 구조를 가짐)

(1) Input의 정보들을 유지하면서 차원 축소(Encoding)
(* PCA는 linear한 형태를 가정하나, AutoEncodr는 각 layer에 비선형식으로 축약)

(2) 차원 축소된 데이터를 다시 원래 데이터로 복원(Decoding)

◼ 주어진 고차원 공간상의 샘플을 bottle-neck(병목) 구간의 저차원 공간으로 맵핑하는 방법을 학습하는 과정에서
(이를 다시 고차원 공간으로 복원해야 하기 때문에) 복원에 필요없는 정보부터 버리게 된다.
◼따라서 인코딩(Encoding)과 디코딩(Decoding) 과정을 통해서 스스로 중요한 특징(Feature)들만
압축적으로 추출하는 방법을 학습한다.

◼신경망에 여러 제약(contraints)들을 추가함으로써 AutoEncoder가 단순히 입력을 바로 출력으로 복사하지
못하도록 방지하며, 데이터를 효율적으로 표현(Representation)하는 방법을 학습(Learning)하도록 제어한다.

🟩 오토인코더(AutoEncoder) 비용함수

◼ Input과 Output 오차 줄이는 게 목표인 모델이므로 마지막 Layer에 Input값을 복제하는 로직을 만드는 경향이 있다
축약되는 정보에 대해 확인이 필요한 상황이다

출력이 입력과 다를 때 모델에 벌점을 부과한느 재구성 손실 포함

🟩 오토인코더(AutoEncoder)의 이상 감지 방법

◼ 정상 sample를 넣어주면, 축약된 정보를 가지고 만들어진 추정치(Output)와 실제 X변수(Input)의
차이가 작게 되어, 정상 데이터와 패턴이 유사한 것으로 해석 할 수 있다.

◼ 반면, 비정상적인 sample를 넣으면, AutoEncoder가 최대한 정상 sample처럼 복원하기 때문에
Input과 Output의 차이가 두드러지게 발생되어 비정상 sample을 검출할 수 있다.

저작자표시 (새창열림)

'Data Science&AI' 카테고리의 다른 글

[머신러닝 기초] Bagging(배깅) vs Boosting(부스팅) (0)	2021.07.17
[머신러닝 기초] Bias vs Variance (0)	2021.07.17
Explainable AI(XAI) : 설명 가능한 AI (0)	2021.05.16
(작성중)추천 알고리즘 (0)	2021.05.15
[딥러닝] 머신러닝 보다 딥러닝이 높은 성능을 보이는 경우는? (0)	2021.05.15

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

글 보관함

MiMi's Self-development Blog

티스토리 뷰