Google Cloud AI에서 2020년 발표한 논문이 TabNet에 대해서 소개 하겠습니다. TabNet은 다양한 Tabular 데이터셋에서 높은 성능을 보이고 해석 가능한 알고리즘입니다. 캐글 MOA(Mechanisms of Action Prediction) 대회의 baseline 모델이며, 우승 알고리즘에도 활용되었습니다. (900여개 특성, 5000여개 샘플로 200개 Action 예측하는 multi-label classification 문제) Google ML Platform인 Vertex AI에 탑재되어 GCP 내에서 즉시 사용 가능합니다. 그럼 논문에 실린 내용을 살펴보겠습니다. Abstract tabular 형식 데이터에 대해 고성능과 해석 가능한 딥러닝 아키텍쳐를 제안 각 decisio..
이번 글에서는 NLU(Natural Language Understanding) 즉 자연어 이해에 대해 알아보겠습니다. NLU란 무엇인가? NLU의 목표는 기계에 기계어가 아닌 사람이 평소에 쓰는 자연스러운 표현을 그대로 제공해도 알아들을 수 있게끔 하는 것입니다. 자연어 : 사람들이 일상적으로 쓰는 언어, 인간적인 표현 기계어 : 의도어 목적에 따라 인공적으로 만든 언어, 예를 들어, '엄마한테 오늘 늦는다고 문자 보내줘'라고 할 때, 'send_message'와 같은 코딩을 하지 않아도 그대로 알아듣게 하는 것입니다. 여기서 언어란 무엇일까? 만약 드라마 '더 글로리'를 설명하려고 할 때, '학창시절 학교폭력을 당한 주인공이 복수한다' 이렇게 한 줄 줄거리만으로 설명을 할 수 있을가요? 만약 드라마 영..
이번 글에서는 AI 모델이 중요하게 생각하는 부분을 우리에게 알려주는 XAI에 대해서 알아보겠습니다. XAI(eXplainable Artificial Intelligence) 등장배경 인공신경망 기반의 딥러닝 모델은 사람이 그 결과를 해석하기 어렵기 때문에 Black Box 모델이라고도 합니다. ⬛ Black Box 모델 예측 결과에 대한 근거가 제공되지 않습니다. 일반적으로 모델의 예측 정확도와 결과에 대한 해석력은 Trade-Off 관계를 가집니다. 예측 정확도가 높은 모델들은 결과에 대해 해석력이 떨어집니다. 머신러닝 기반 모델의 경우 딥러닝 모델보다는 정확도는 떨어질 수 있으나, 학습된 모델을 통한 해석력은 좀 더 높다고 할 수 있습니다. 어떤 설명 변수가 얼마나 영향을 미치는지 알 수 있기 때문..
다음 글은 AI 타임스의 기사를 요약하였습니다. http://www.aitimes.com/news/articleView.html?idxno=145531 마이크로소프트, 비학습 데이터로 응답하는 언어 모델 ‘고델(GODEL)’ 공개 - AI타임스 가상비서나 챗봇과 같은 대화 에이전트가 레스토랑 추천과 같은 주제별 전문 지식을 제공하는 것 외에도 지역의 역사나 최근 스포츠 경기에 대한 대화에 참여할 수 있다면 어떨까? 또한 에 www.aitimes.com ⬛ 마이크로소프트의 고델(GODEL)이란 무엇인가? 고델(GODEL)은 Grounded Open Dialogue Model의 약자입니다. 고델은 사전 학습 모델에 의한 응답 뿐만 아니라 외부 정보를 활용하여 응답을 생성하는 언어 모델입니다. 고델은 마이..
ML Ops에는 다양한 구성요소가 있지만, 그 중 중요한 구성요소에 대해 알아보겠습니다. ML Ops 구성요소 - 1) Serving Production 환경에 사용할 수 있도록 모델을 배포하는 Serving 방식은 다음과 같습니다. Batch Serving Airflow, Cronjob 등으로 스케쥴링 작업 (학습과 예측을 별도의 작업으로 설정) API 형태로 요청이 올 때마다 Serving Flask , Fast API Docker kubernetes Serving 프레임워크 사용 kuberflow, BentoML, Seldon Core, Cortex, KFServing, Tensorflow Serving Torch Serve 등 Server와 실시간으로 통신해야 하는 것이 아니라면, Batch Se..
MLOps를 구현하는 것은 예측용 API로 모델을 배포하는 것 뿐만 아니라, 모델의 재학습 및 배포를 자동화할 수 있는 ML 파이프라인 배포를 포함합니다. CI/CD 시스템을 세팅해서 새로운 파이프라인 구현을 통해 자동으로 테스트하고 배포할 수 있습니다. 이런 시스템을 사용하면 데이터와 비즈니스 환경에서 일어나는 빠른 변화에 대처하기 쉬워질 것입니다. Google에서는 자동화가 필요하지 않은 가장 일반적인 수준 부터 ML 및 CI/CD 파이프라인 모두를 자동화하는 세 가지 MLOPs 수준을 설명합니다. 이 중 ML 및 CI/CD 파이프라인 자동화에 대해 살펴보겠습니다. ML Ops 1단계 : ML 파이프라인 자동화 데이터 추출부터 모델 학습 및 배포하기 까지의 작업을 ML 파이프라인으로 배포하여 자동화할..
분석 업무를 하는 사람이면 누구나 MLOps에 관심을 가질 것입니다. 현재 다양한 MLOps 오픈소스들이 나오면서 크게 발전하고 있기 때문에 이를 실제 업무에 활용하기 위해 A-Z까지 정리해보고자 합니다. MLOps 정의 MLOps는 DevOps에서 파생된 개념으로 ML시스템에서도 머신러닝 시스템 개발뿐만 아니라 서비스 운영을 안정적으로 제공해야 하기 때문에 MLOps라는 개념이 탄생하게 됩니다. Google과 Nvidia는 MLOps를 다음과 같이 정의합니다. Google : MLOps는 ML 시스템 개발(Dev)과 ML 시스템 운영(Ops)을 통합하는 것을 목표로 하는 ML 엔지니어링 문화 및 방식입니다. MLOps을 수행하면 통합, 테스트, 출시, 배포, 인프라 관리를 비롯하여 ML 시스템 구성의 ..
보호되어 있는 글입니다.
- Total
- Today
- Yesterday
- data drift
- 시계열딥러닝
- Tableau vs QuickSight
- 비즈니스 관점 AI
- 영어공부
- 영화 인턴
- pandas-gpt
- 데이터 드리프트
- AutoEncoder
- 오토인코더
- SQLD자격증
- amzaon quicksight
- Model Drift Detection
- amazon Q
- 모델 배포
- 생성형BI
- 모델 드리프트 대응법
- 모델 드리프트
- pandas-ai
- Data Drift와 Concept Drift 차이
- Generative BI
- Concept Drift
- On-premise BI vs Cloud BI
- Data Drift Detection
- NHITS설명
- 최신시계열
- 추천시스템
- Model Drift
- SQLD 정리
- SQLD
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |