Skip to content

seareale/2020-dataCampus-yonsei

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

2020-dataCampus-yonsei

빅데이터 분석처리 과정 Link

과정 개요

운영

  • 주최 : 한국데이터산업진흥원, 과학기술정보통신부
  • 교육 : 연세대학교
  • 인원 : 66명

내용 및 특징

  • 파이썬, spark 등 다양한 빅데이터 분석도구 활용
  • 데이터베이스와 연동한 분석 학습
  • 머신 러닝, 딥러닝 기법을 활용한 실전 KDD 프로세스 분석 실습 교육

교육기간

  • 이론실습 : 2020. 7. 6 ~ 8. 16 / 09:30 ~ 17:30
  • 프로젝트 : 2020. 8. 17 ~ 9. 4 / 09:30 ~ 17:30
  • 프로젝트 보완 및 제출(비대면) : 2020. 9. 7 ~ 9. 18

커리큘럼

교과목명 주요 내용 시간
빅데이터 분석 빅데이터 정의 및 개념, 가치 및 트렌드 이해, 빅데이터 주요 기술 소개 3H
파이썬 프로그래밍 개발 도구 및 빌드 환경의 이해, 데이터 유형 및 기초 문법,
데이터베이스 연동, 쥬피터를 통한 interactive programming
35H
데이터 분석 기초 및 시각화 numpy, pandas, matploylib 라이브러리를 사용한 데이터 분석 28H
데이터베이스와 SQL SQL 기본 개념, SQL 주요 문법 설명(select, join, agregate),
고급 문법 활용 설명(subquery, view …)
7H
빅데이터 전처리 데이터 정제, 통합, 변환, 축소, 이산화 기법 14H
고급 데이터 분석 분석 방법론, 클러스터링, 연관규칙, 빈발패턴, 순차패턴,
결정트리 기법, xgBoost, 인공신경망
61H
크롤링 및 소셜 분석 웹페이지 크롤링, 자연어 처리 21H
실전 KDD 프로세스 분석 실습 실전 프로젝트 실습, 실무 분석 21H
Spark 기반 배치/실시간 빅데이터 처리 Apache Spark 아키텍쳐, Spark SQL, Spark Streaming, Zepplin 10H
프로젝트 팀 및 주제 선정 프로젝트 팀 선정, 주제 선정, 데이터 선정 및 분석방법론 설계 14H
프로젝트 수행 팀 프로젝트 및 특강 69H
프로젝트 발표 및 보완 프로젝트 발표식, 보완 개선 7H

About

2020 데이터 청년 캠퍼스

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published