티스토리 뷰

 

이미지 데이터나 자연어 데이터 및 정형 데이터로 예측 또는 분류 문제를 해결하고자 할 때, 

머신러닝과 딥러닝을 동시에 적용하여 성능이 좋은 모델을 선정하기 마련이다.

딥러닝이 좀 더 복잡한 모델이라, 무조건 성능이 잘 나올거 같지만, 그렇지 않은 경우가 많다.

 

과연 머신러닝 보다 딥러닝이 성능이 좋을 때는 언제일까?

 

당연한 답변일 수 있지만...

(1) 분석하고자 하는 데이터나 학습 데이터가 고차원 데이터(high dimensional data)인 경우

(2) 고차원 데이터를 잘 표현하기 위해서 고차원 Feature가 필요한 경우

에 딥러닝이 훨씬 성능이 좋다.

 

딥러닝 모델은 hidden layer를 거칠 수록 고차원 데이터의 잠재적 Feature를 잘 포착할 수 있고,

이를 통해 고도로 추상화된 표현(representation)을 할 수 있기 때문이다.

 

 

[딥러닝 Application 시스템 프로세스]

  1. 데이터 전처리 단계 : 데이터 검증, 클린징, 증폭 등 학습을 위한 데이터 처리
  2. 모델 학습 단계  : 학습 데이터로 심층 신경망 모델 학습
  3. 모델 평가 및 선정 단계 : 검증 데이터로 학습된 모델 평가, 최고 성능 모델 선정
  4. 모델 관리 단계 : 모델 이력 및 생명주기 관리, 모델 배포