ํฐ์คํ ๋ฆฌ ๋ทฐ
[์ด์ํ์ง] ์คํ ์ธ์ฝ๋(AutoEncoder)์ ๋ํ ์์ธํ ์ค๋ช
calmmimi 2021. 7. 14. 00:26๐ฉ ์คํ ์ธ์ฝ๋(AutoEncoder)๋ ๋ฌด์์ธ๊ฐ?
โผ ์คํ ์ธ์ฝ๋๋ฅผ ์ด์ฉํ๋ฉด ๋ฐ์ดํฐ์ ๋ํ Labeling์ ํ์ง ์์๋ ๋ฐ์ดํฐ์ ์ฃผ์ฑ๋ถ์ด ๋๋ ์ ๋ ฅ ๋ฐ์ดํฐ์ ํน์ง๋ค์ ํ์ตํ ์ ์๋ค.
โผ ๋ ์ด๋ธ ๋์ด ์์ง ์์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด์ ํจ์จ์ ์ธ ํํ์ธ coding์ ํ์ตํ ์ ์๋ ์ธ๊ณต ์ ๊ฒฝ๋ง
โ coding(์ฝ๋ฉ) : ์ผ๋ฐ์ ์ธ ๋ถํธํ, ์ ๋ ฅ๋ฐ์ดํฐ๋ณด๋ค ํจ์ฌ ๋ฎ์ ์ฐจ์์ ๊ฐ์ง ์๋์ธต
โ ์ ๋ ฅ์ด ๊ณง ํ๊ฒ์ด ๋๋ ์๊ธฐ์ง๋ ํ์ต(self-supervised learning)์ด๋ผ๊ณ ๋ ๋ถ๋ฆ
โผ ์คํ ์ธ์ฝ๋์ ํ์ต ๋ชฉํ๋ Output์ ๊ฐ๋ฅํ Input์ ๊ทผ์ฌ ์ํค๋ ๊ฒ์ด๋ค.
โผ ์ด์ ๊ฐ์ง ์ ์ ์ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ์ด์ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ฌ ๋ ๋ฐ์๋๋ ์ค์ฐจ์ ๋ฐ๋ผ ์ด์ ํจํด์ ๊ฐ์งํ๋ค.
๐ฉ ์คํ ์ธ์ฝ๋(AutoEncoder) ์ฌ์ฉ ๋ชฉ์
โผ ์คํ ์ธ์ฝ๋๊ฐ ์ฐจ์ ์ถ์์ ์ ์ฉ
โผ ์คํ ์ธ์ฝ๋๊ฐ ๊ฐ๋ ฅํ ํน์ฑ ์ถ์ถ๊ธฐ์ฒ๋ผ ์๋ํ์ฌ ์ฌ์ธต ์ ๊ฒฝ๋ง์ ๋น์ง๋ ์ฌ์ ํ๋ จ์ ์ฌ์ฉ(์ด์๊ฐ์ง)
โผ ์คํ ์ธ์ฝ๋๋ ํ๋ จ ๋ฐ์ดํฐ์ ๋งค์ฐ ๋น์ทํ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑ ๊ฐ๋ฅ, ์ด๋ฅผ ์์ฑ๋ชจ๋ธ(generative model)์ด๋ผ ํจ
๐ฉ ์คํ ์ธ์ฝ๋(AutoEncoder) ๊ตฌ์ฑ
์คํ ์ธ์ฝ๋๊ฐ ์
๋ ฅ์ ๋ฐ์ ํจ์จ์ ์ธ ๋ด๋ถ ํํ์ผ๋ก ๋ฐ๊พธ๊ณ ์
๋ ฅ๊ณผ ๋งค์ฐ ๊ฐ๊น์ ๋ณด์ด๋ ์ด๋ค ๊ฒ์ ์ถ๋ ฅ
(์ถ๋ ฅ์ ์คํ ์ธ์ฝ๋๊ฐ ์
๋ ฅ์ ์ฌ๊ตฌ์ฑํ๊ธฐ ๋๋ฌธ์ ์ฌ๊ตฌ์ฑ(reconstruction)์ด๋ผ๊ณ ๋ถ๋ฆ)
โผ ์ธ์ฝ๋(Encoder) : ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ด๋ถ ํํ(code๋ผ๋ ์๋์ธต)์ผ๋ก ๋ฐ๊ฟ(์ธ์ง๋คํธ์ํฌ(recognition network))
โผ ๋์ฝ๋(Decoder) : ๋ด๋ถ ํํ(code)์ ์ถ๋ ฅ ๋ฐ์ดํฐ๋ก ๋ฐ๊ฟ (์์ฑ๋คํธ์ํฌ(generative network))
(์ถ๋ ฅ์ธต์ ๋ด๋ฐ ์๊ฐ ์ ๋ ฅ ๊ฐ์์ ๋์ผํ๋ ๊ฒ์ ์ ์ธํ๋ฉด ์ผ๋ฐ์ ์ผ๋ก ์คํ ์ธ์ฝ๋๋ MLP(๋ค์ธต ํผ์ ํธ๋ก )์ ๋์ผํ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง)
(1) Input์ ์ ๋ณด๋ค์ ์ ์งํ๋ฉด์ ์ฐจ์ ์ถ์(Encoding)
(* PCA๋ linearํ ํํ๋ฅผ ๊ฐ์ ํ๋, AutoEncodr๋ ๊ฐ layer์ ๋น์ ํ์์ผ๋ก ์ถ์ฝ)
(2) ์ฐจ์ ์ถ์๋ ๋ฐ์ดํฐ๋ฅผ ๋ค์ ์๋ ๋ฐ์ดํฐ๋ก ๋ณต์(Decoding)
โผ ์ฃผ์ด์ง ๊ณ ์ฐจ์ ๊ณต๊ฐ์์ ์ํ์ bottle-neck(๋ณ๋ชฉ) ๊ตฌ๊ฐ์ ์ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ๋งตํํ๋ ๋ฐฉ๋ฒ์ ํ์ตํ๋ ๊ณผ์ ์์
(์ด๋ฅผ ๋ค์ ๊ณ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ๋ณต์ํด์ผ ํ๊ธฐ ๋๋ฌธ์) ๋ณต์์ ํ์์๋ ์ ๋ณด๋ถํฐ ๋ฒ๋ฆฌ๊ฒ ๋๋ค.
โผ๋ฐ๋ผ์ ์ธ์ฝ๋ฉ(Encoding)๊ณผ ๋์ฝ๋ฉ(Decoding) ๊ณผ์ ์ ํตํด์ ์ค์ค๋ก ์ค์ํ ํน์ง(Feature)๋ค๋ง
์์ถ์ ์ผ๋ก ์ถ์ถํ๋ ๋ฐฉ๋ฒ์ ํ์ตํ๋ค.
โผ์ ๊ฒฝ๋ง์ ์ฌ๋ฌ ์ ์ฝ(contraints)๋ค์ ์ถ๊ฐํจ์ผ๋ก์จ AutoEncoder๊ฐ ๋จ์ํ ์
๋ ฅ์ ๋ฐ๋ก ์ถ๋ ฅ์ผ๋ก ๋ณต์ฌํ์ง
๋ชปํ๋๋ก ๋ฐฉ์งํ๋ฉฐ, ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ํํ(Representation)ํ๋ ๋ฐฉ๋ฒ์ ํ์ต(Learning)ํ๋๋ก ์ ์ดํ๋ค.
๐ฉ ์คํ ์ธ์ฝ๋(AutoEncoder) ๋น์ฉํจ์
โผ Input๊ณผ Output ์ค์ฐจ ์ค์ด๋ ๊ฒ ๋ชฉํ์ธ ๋ชจ๋ธ์ด๋ฏ๋ก ๋ง์ง๋ง Layer์ Input๊ฐ์ ๋ณต์ ํ๋ ๋ก์ง์ ๋ง๋๋ ๊ฒฝํฅ์ด ์๋ค
์ถ์ฝ๋๋ ์ ๋ณด์ ๋ํด ํ์ธ์ด ํ์ํ ์ํฉ์ด๋ค
์ถ๋ ฅ์ด ์ ๋ ฅ๊ณผ ๋ค๋ฅผ ๋ ๋ชจ๋ธ์ ๋ฒ์ ์ ๋ถ๊ณผํ๋ ์ฌ๊ตฌ์ฑ ์์ค ํฌํจ
๐ฉ ์คํ ์ธ์ฝ๋(AutoEncoder)์ ์ด์ ๊ฐ์ง ๋ฐฉ๋ฒ
โผ ์ ์ sample๋ฅผ ๋ฃ์ด์ฃผ๋ฉด, ์ถ์ฝ๋ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ๋ง๋ค์ด์ง ์ถ์ ์น(Output)์ ์ค์ X๋ณ์(Input)์
์ฐจ์ด๊ฐ ์๊ฒ ๋์ด, ์ ์ ๋ฐ์ดํฐ์ ํจํด์ด ์ ์ฌํ ๊ฒ์ผ๋ก ํด์ ํ ์ ์๋ค.
โผ ๋ฐ๋ฉด, ๋น์ ์์ ์ธ sample๋ฅผ ๋ฃ์ผ๋ฉด, AutoEncoder๊ฐ ์ต๋ํ ์ ์ sample์ฒ๋ผ ๋ณต์ํ๊ธฐ ๋๋ฌธ์
Input๊ณผ Output์ ์ฐจ์ด๊ฐ ๋๋๋ฌ์ง๊ฒ ๋ฐ์๋์ด ๋น์ ์ sample์ ๊ฒ์ถํ ์ ์๋ค.
'Data Science&AI' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋จธ์ ๋ฌ๋ ๊ธฐ์ด] Bagging(๋ฐฐ๊น ) vs Boosting(๋ถ์คํ ) (0) | 2021.07.17 |
---|---|
[๋จธ์ ๋ฌ๋ ๊ธฐ์ด] Bias vs Variance (0) | 2021.07.17 |
Explainable AI(XAI) : ์ค๋ช ๊ฐ๋ฅํ AI (0) | 2021.05.16 |
(์์ฑ์ค)์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ (0) | 2021.05.15 |
[๋ฅ๋ฌ๋] ๋จธ์ ๋ฌ๋ ๋ณด๋ค ๋ฅ๋ฌ๋์ด ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒฝ์ฐ๋? (0) | 2021.05.15 |
- Total
- Today
- Yesterday
- ์๊ณ์ด๋ฅ๋ฌ๋
- NHITS์ค๋ช
- Model Drift Detection
- Generative BI
- ์ถ์ฒ์์คํ
- ๋ชจ๋ธ ๋๋ฆฌํํธ
- On-premise BI vs Cloud BI
- SQLD ์ ๋ฆฌ
- data drift
- ์์ด๊ณต๋ถ
- amzaon quicksight
- ๋น์ฆ๋์ค ๊ด์ AI
- SQLD์๊ฒฉ์ฆ
- AutoEncoder
- ์คํ ์ธ์ฝ๋
- ์ํ ์ธํด
- ๋ฐ์ดํฐ ๋๋ฆฌํํธ
- SQLD
- Data Drift Detection
- pandas-gpt
- ๋ชจ๋ธ ๋๋ฆฌํํธ ๋์๋ฒ
- ์ต์ ์๊ณ์ด
- ์์ฑํBI
- amazon Q
- Model Drift
- ๋ชจ๋ธ ๋ฐฐํฌ
- Concept Drift
- pandas-ai
- Tableau vs QuickSight
- Data Drift์ Concept Drift ์ฐจ์ด
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |