티스토리 뷰

** 데이터 분석 시 활용할 만한 데이터셋 모음 **

데이터 분석 연습을 위한 공모전 데이터와

실전 분석에서 Feature로 활용할 수 있는 공개 데이터에 대한 사이트 목록입니다.

 

 

 

 

[공모전 데이터]

이름 링크 설명
Kaggle https://www.kaggle.com/ 전세계 다양한 분야의 데이터셋 (2017 구글이 인수)
DACON https://dacon.io/ 공공분야 및 한국 기업의 시각화 / 예측 / AI 경진대회 데이터셋
COMPAS https://compas.lh.or.kr/ 시도별 도시문제 해결을 위한 데이터셋

 

[각 분야 공개 데이터]

구분 이름 링크 설명
전체 공공데이터 포털 https://www.data.go.kr/ 공공행정, 과학기술, 교통물류, 국토관리, 농축수산, 문화관광, 사회복지, 산업고용
식품건강, 재난안전, 재정금융, 환경기상, 교육, 법률, 보건의료, 통일외교안보
전체 서울특별시 빅데이터 캠퍼스 https://bigdata.seoul.go.kr/ 인구/가구, 보건/복지, 문화/관광,
교통/물류, 환경/기상, 과학 기술/에너지, 도시/지역, 산업/고용, 경제/금융,
행정/안보, 재난/안전, 교육
전체 KDX 한국 데이터 거래소 https://kdx.kr/ 경제/산업, 금융/증권, 통신/인구,
소비/상권, 이커머스, 유통/마케팅,
물류/교통, 보건의료, 부동산/지리, 자동차, 여가/레저, 인공지능
금융 금융 빅데이터 플랫폼 https://www.bigdata-finance.kr/main.do 융합, 카드, 맛집, 소셜, 구매패널,
유동인구, 보험, 자영업, 금융, 투자
통신 KT 통신 빅데이터 플랫폼 https://bdp.kt.co.kr/ Space, Life, Public, Biz, Social
AI AI허브 https://aihub.or.kr/ NLU 모델 학습 위한 한국어 데이터셋