DSAC(Data Scientist Academy & Certificate)는 4차 산업혁명의 요구에 부응하여 '데이터 사이언티스트'를 양성하기 위한 자격시험입니다.
이 시대에는 인공지능과 빅데이터가 중요해지고 있으며, 각 산업에서 데이터를 분석하고 활용할 수 있는 전문가들이 필요합니다. 정부는 이러한 필요성을 인식하여 'AI기반 데이터 사이언티스트'를 양성하는 계획을 적극적으로 추진하고 있습니다.
DSAC은 이러한 인재 양성을 위한 교육과 자격인증제도를 제공하고 있으며, 한국생산성본부의 체계적인 평가를 통해 학습자들에게 인증을 부여합니다.
KCP자격증: DSAC데이터 사이언티스트 능력인증자격 시험출제기준 및 시험일정 · 기출문제 다운로드
등록번호
민간자격번호 : 한국직업능력개발원 제2019-001649호
DSAC 자격은 자격기본법 규정에 따라 등록한 민간자격으로, 국가로부터 인정받은 공인자격이 아닙니다.민간자격 등록 및 공인 제도에 대한 상세내용은 민간자격정보서비스(www.pqi.or.kr)의 ‘민간자격 소개’란을 참고해 주십시오.
단계적으로 지능화된 인재를 양성하는 것이 목표입니다. 전문가 교육과정 모델부터 대학생까지 확대하여 전공별 맞춤과정을 제공하여 모든 대학생들이 'AI 기반 데이터 사이언티스트'로 양성될 수 있는 커리큘럼을 제공합니다.
또한, 데이터 사이언티스트 핵심 교육 양성과정을 한국에서 검증된 인증이 이루어지는 한국생산성본부에서 실시합니다. 이는 4차 산업혁명의 중요한 교육인 데이터 사이언스와 인공지능 핵심 교육을 포함합니다. 또한, 산업계와 연계한 컨소시엄 교육 및 인증을 통해 미래 일자리와 연계한 인증 기반을 마련합니다.
응시대상
기초
전 학과의 대학생 기초 과목 교육이 필요한 대학생
파이썬 프로그래밍 데이터 분석개념
- M1 데이터 프로그래밍
- M2 데이터 프로세스 & 분석
핵심
기초 과정 수료자 및 이전 단계 과정 수료자
데이터 분석 고급 기계학습 이론 및 적용
- M3 머신러닝
- M4 딥러닝
응용
기초 과정 수료자 및 이전 단계 과정 수료자
텍스트, 이미지 분석 최신 딥러닝 기술
- M5 이미지 분석
- M6 자연어 처리
실전
기초 과정 수료자 및 이전 단계 과정 수료자
현장 빅테이터 분석 기술 및 현실 문제 해결 방법론
- M7 도메인 프로젝트
자격기준
등급 | 합격기준 |
1급 (컨설턴트) | 7개 모듈을 모두 취득 |
MASTER급 (마스터) | 7개 모듈 중 6개 모듈 취득 |
2급 (전문가) | 7개 모듈 중 2개 모듈 취득 |
3급 (프로그래머) | 7개 모듈 중 1개 모듈 취득 |
DSAC 교육 프로세스
D-30 교육 의뢰
D-25 일정 및 과정 협의
D-20 참가자 모집
D-15 참가자 정보취합
D-+14 결과보고서 제출
D-0 만족도 설문 및 개강.운영
D-10 강사 확정
교육특징으로는 각 단계별 과정이 전공별 트랙에 따라 맞춤 과정으로 구성되어 있어서 모듈별 선택이 가능합니다. 각 반의 최대 수강인원은 30명으로 제한되며, 실습 중심의 과정으로 운영됩니다. 또한, 교육내용은 표준 교육 커리큘럼으로 제공되며, 일정 및 과목은 협의를 거쳐 결정됩니다.
교육내용
단계 | 시간 | 과목(모듈) | 과목개요 | 교육내용 |
기초 | 30H | M1.데이터 프로그래밍 | 데이터 사이언티스트가 되기 위해 필요한 기본적인 통계 지식 및 파이썬을 중심으로 프로그래밍 능력을 배움 | 통계 기초개념 Jupyter 설치 및 사용법 벡터, 행렬, 매트릭스 연산 프로그래밍 환경설정 파이썬 기초 문법 |
30H | M2.데이터 프로세스 & 분석 | 데이터의 생산, 수집, 저장, 변형,전처리 방법과 데이터 서버 및 클라우드 사용법을 배움 | 공공데이터 활용 데이터 수집 및 관리, 변환 데이터 정제 및 전처리 데이터 마이닝 웹 크롤링 및 데이터 수집 파이썬 데이터 분석 라이브러리 |
|
코어 | 30H | M3.머신러닝 | 데이터로부터 지식과 지능을 추출하는 핵심기술로서 지도학습 및 비지도 학습 머신러닝 이론과 구현 기술을 배움 | 예측, 분류, 회귀, 추천 기술 선형회귀, kNN, 결정트리 로지스틱 회귀, 다중 분류 k-Means, DBSCAN, PCA 앙상블 알고리즘 SVM, 랜덤 포레스트 차원축소, 군집화, 시각화 |
30H | M4.딥러닝 | 빅데이터기반으로 인공지능을 구현하는 중요 기술로서 신경망 및 딥러닝 기술을 이해하고 이를 활용하는 방법을 배움 | 신경망 개념 CNN, RNN 강화학습의 이해와 응용 딥러닝 구조 텐서플로우, Keras |
|
응용 | 30H | M5.이미지 분석 | 딥러닝의 주요 응용 분야인 영상인식, 객체검출, 동영상 인식 기술을 배우고 이의 활용 예를 다룸 | 영상 신호 처리 영상인식, 분류, 객체 검출 활동 인식 openCV 동영상 인식 |
30H | M6.자연어 처리 | 음성 및 텍스트 처리와 자연어 처리 등 컴퓨터가 언어를 이해하고 대화를 나누는 기술 및 활용 예를 다룸 | 음성인식 형태소분석, 개체명 인식 주제 분석, 감성 분석 텍스트처리, 언어모델링 SNS데이터 수집, 분석 챗봇 기술, 번역 |
|
실전 | 30H | M7.도메인 프로젝트 | 금융, 제조, 마케팅, 물류 등 도메인별로 빅데이터 기반의 문제해결 방법을 프로젝트 기반으로 수행함 | 비즈니스 데이터 분석 IoT 데이터 활용 실습 문제 해결 중심 팀 프로젝트 기업 맞춤형 교육 |
실습환경구성은 개별PC로 진행
- OS: Window10 Home Edition 이상
- Memory : 8GB이상
- HDD(SDD):256GB이상
- Graphic : GTX960 이상 (CPU활용 시)
- 분석도구 :Anaconda, Jupyter Notebook
- 프로그래밍 언어(패키지) :Python
수강생
- 대학생, 대학원생, 국가(공공)기관 및 산업체 기획분야 SW개발분야 전문가
교육운영
- 학기 별(주,야간), 방학 중 집중 코스 (일8시간 2~4주 구성)
- 실습실 제공과 전문 강사를 통한 원활한 실습 환경 구성
- 홍보:대학 홈페이지, E-mail을 통한 일정, 계획 등의 안내를 실시하여 수강생의 강의 이수 지원
- 프로젝트 진행 중 전문 강사의 전담 멘토링 수시 운영
- 수강생 출석관리
- 전 과정을 이수한 수강생에게 KPC수료증 및 인증 자격 응시 실시
- 교육 과정 제공과 자발적 학습 유도를 위한 질의응답, 추가 학습자료 등 학습지원
데이터 사이언티스트 업종별 권장 과목
단계 | 과목(모듈) | 과목개요 | 교육 내용 | |||
금융 | 제조 | 마케팅 | 물류 / 유통 |
|||
기초 | M1.데이터 프로그래밍 | ○ | ○ | ○ | ○ | 업종 공통 영역 분석 역량 중심 |
M2.데이터 프로세스 & 분석 | ○ | ○ | ○ | ○ | 업종 공통 영역 플랫폼/기술 역량 중심 |
|
코어 | M3.머신러닝 | ○ | ○ | ○ | ○ | 업종 공통 영역 데이터 사이언스 역량 필수 영역 |
M4.딥러닝 | ○ | ○ | ○ | △ | 업종 선별 영역 | |
응용 | M5.이미지 분석 | - | ○ | △ | △ | 업종 선별 영역 |
M6.자연어 처리 | ○ | - | ○ | △ | 업종 선별 영역 | |
실전 | M7.도메인 프로젝트 | △ | △ | △ | △ | 업종 선별 영역 |
응시자격
※ DSAC 자격취득교육 수강에 대한 자격은 없으며, 교육을 수료한 자에 대해서만 시험을 실시합니다. 단, 1급 컨설턴트는 MASTER(마스터) 자격을 취득한 후에 응시할 수 있습니다.
자격종목 | 등급 | 응시자격 |
DSAC | 1급(컨설턴트) | DSAC 기반 교육을 수료하고, MASTER급 자격을 취득한 자 |
MASTER급(마스터) | DSAC 기반 교육을 수료한 자 | |
2급(전문가) | ||
3급(프로그래머) |
모듈별 출제.배점기준
모듈명(분야,영역) | 배점 | 문항수 | 검정시간 | 합격기준 |
M1. 데이터 프로그래밍 | 100 | 10 문항 x 5점 = 50점 5 문항 x 10점 = 50점 |
45분 | 출석률 80% 이상 60점 이상 합격 |
M2. 데이터 프로세스 & 분석 | 100 | 10 문항 x 5점 = 50점 5 문항 x 10점 = 50점 |
45분 | 출석률 80% 이상 60점 이상 합격 |
M3. 머신러닝 | 100 | 10 문항 x 5점 = 50점 5 문항 x 10점 = 50점 |
45분 | 출석률 80% 이상 60점 이상 합격 |
M4. 딥러닝 | 100 | 10 문항 x 5점 = 50점 5 문항 x 10점 = 50점 |
45분 | 출석률 80% 이상 60점 이상 합격 |
M5. 이미지 분석 | 100 | 10 문항 x 5점 = 50점 5 문항 x 10점 = 50점 |
45분 | 출석률 80% 이상 60점 이상 합격 |
M6. 자연어 처리 | 100 | 10 문항 x 5점 = 50점 5 문항 x 10점 = 50점 |
45분 | 출석률 80% 이상 60점 이상 합격 |
M7. 도메인 프로젝트 | 100 | 10 문항 x 2점 = 20점 20 문항 x 4점 = 80점 |
100분 | M1~M6 자격취득 별도 채점 기준 |
시험과목
검정방법 | 모듈 | 주제 | 내용 |
필기 | M1. 데이터 프로그래밍 | 데이터 사이언스 범위 | 통계학, 컴퓨터 사이언스, 비즈니스의 관계 |
빅데이터와 AI | 빅데이터 분석과 AI 성공 사례 | ||
데이터 사이언스 도구 | 분석 도구, 파이선, R, 프로그래밍 언어 | ||
파이선 기초 | 파이선 시작, 변수, 함수, 파일 다루기 | ||
파이선 문법 | 파이선 기초 문법 | ||
데이터 수집 | 파일 다운로드, 데이터 제공 사이트 | ||
데이터 처리 | 데이터 읽기, 저장하기 | ||
데이터 탐색 | 데이터 특성 파악 | ||
통계 분석 | 확률 분포, 정규분포, 로그분포 | ||
탐색적 분석 | 스캐터플롯, 히스토그램 | ||
데이터 시각화 | 다양한 시각화 도구 학습 | ||
결측치 처리 | 없는 값, 틀린 값 처리 방법 | ||
이상치 처리 | Outlier 검출 및 처리 방법 | ||
문제 해결 프로세스 | 문제정의, 데이터 분석, 머신러닝 | ||
결과 시각화 | 리포팅 기술 | ||
M2. 데이터 프로세스 & 분석 | 데이터 분석 범위 | 데이터 분석 프로세스 | |
데이터 분석 기술 | 분류, 회귀, 추천, 머신러닝, 신경망 | ||
수치 데이터 | 테이블 데이터 다루기 | ||
선형 모델 | 데이터 분석 기초, 다차원 선형회귀 | ||
특성 공학 | 피처(feature) 선택 기술, 원핫인코딩 | ||
결정 트리 기초 | 엔트로피, gini | ||
클러스터링 기초 | 거리기반 클러스터링 | ||
고객 세분화 | 대표적인 클러스터링 기법 소개 | ||
모델 성능 | 성능 측정 방법 소개, 정확도 | ||
데이터 크롤링 | HTML의 이해, bs4 | ||
웹 API | 웹 API 프로그램 | ||
텍스트 데이터 | 코퍼스, 도큐먼트 개념 이해 | ||
텍스트 처리 | BoW, 기초 어근 처리 | ||
데이터 분석 프로젝트 | 데이터 분석을 실제 문제에 적용하는 방법 | ||
분석 결과 적용 | 현장에 적용하는 기술 소개 | ||
M3. 머신러닝 | 머신러닝 범위 | 지도학습, 비지도학습, 강화학습 | |
머신러닝 동작 | 학습과정, 최적화, 손실함수, 성능평가 | ||
최적화 알고리즘 | 모델 튜닝, 과적합, 과소적합 | ||
분류 예측 | 협업필터링 (kNN) | ||
로지스틱 회귀 | 로짓, 이진 분류 | ||
앙상블 알고리즘 | 렌덤포레스트, 그라디언트부스팅 | ||
서포트 벡터 머신 | 서포트 벡터 이해, 분류 분석 | ||
분류 성능 | 컨퓨전 매트릭스, ROC, AUC | ||
회귀 예측 | 실함수, 성능평가 지표, 시계열 | ||
모델 최적화 | 최적화, 랜덤 탐색, 일반화, 교차검증 | ||
비지도 학습 | 비지도 학습의 종류, 스케일링, 변환 | ||
클러스터링 고급 | 클러스터링의 적용 범위 | ||
데이터 변환 | 로그변환, 역수변환 | ||
데이터 특성 추출 | 차원 축소, 주성분 분석(PCA), 시각화고급 | ||
클러스터링 평가 | KMeans, DBSCAN 성능 비교평가 | ||
* 베이즈 알고리즘 | * 나이브 베이즈 알고리즘 | ||
* 텍스트 분석 | * 형태소 분석, 어근 분석, TF-IDF | ||
* 스팸 메일 분석 | * 스팸 필터링 | ||
* SNS 분석 | * SNS 데이터 속성 파악 | ||
* 감성 분석 | * 긍정 부정 감성 분석 | ||
M4.딥러닝 | 딥러닝과 AI | 딥러닝과 AI 특징과 성공 요인 | |
딥러닝 도구 | 텐서플로우, 케라스, 카페, 파이토치 | ||
다층퍼셉트론 | 다층퍼셉트론(MLP) 원리 이해 | ||
CNN 원리 | 딥러닝 구조, 계층, 유닛, 활성화 함수 | ||
CNN 구현 | CNN 기본 모델 | ||
이미지 인식 | 이미지 인식 원리 소개 | ||
CNN 성능 향상 | 드롭아웃, 배치 정규화 | ||
전이 학습 | 이미지넷 학습 모델 전이학습 | ||
데이터 확장 | 데이터 Augmentation | ||
객체 인식 | 다수의 이미지 객체 인식 | ||
자연어 처리 | NLP 프로세스 소개 | ||
RNN 원리 | RNN 동작원리 | ||
LSTM | LSTM 원리 소개 | ||
시계열 분석 | RNN을 이용한 시계열 예측 | ||
단어 임베딩 | 임베딩 원리 이해 | ||
* 임베딩 구축 | * 임베딩 직접 구축 및 활용 | ||
* 언어 모델링 | * 언어 모델링 개념 설명 | ||
* 챗봇 | * 챗봇 구현 기술 | ||
* 딥러닝 응용 | * GAN, 자동 번역 원리 | ||
* 강화학습 | * 강화학습 원리 | ||
M5. 이미지 분석 | ※ 주제 및 내용에 대한 커리큘럼은 현재 전문가 검토 중 ※ 2020년 1월 주제 및 세부내용에 대한 내용 공지예정 |
||
M6. 자연어 처리 | |||
필기/실기 | M7. 도메인 프로젝트 |
별첨(*) 표시된 과목은 모듈 별 응용심화학습용으로 정규시험과목에서 제외됩니다.
기출문제 다운로드
DSAC데이터 사이언티스트 능력인증자격 기출문제는 아래 "기출문제 바로보기"를 클릭하면 회차별 문제와 답안을 확인할 수 있습니다.
- KPC자격증 종류, 4차 선업혁명 시대 필수 자격증 정리
- KCP자격증 자주 묻는 질문과 답변 정리
- KCP자격증: ERP 정보관리사 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: GTQ그래픽기술자격 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: IEQ 인터넷윤리자격 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: SMAT서비스경영자격 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: SW코딩자격 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: CAD실무능력평가 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: DSAC데이터 사이언티스트 능력인증자격 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: PAC프레젠테이션능력인증자격 시험출제기준 및 시험일정 · 기출문제 다운로드
- KCP자격증: 정보기술자격 ITQ 시험출제기준 및 시험일정 · 기출문제 다운로드
'자격ㅣ취업ㅣ교육' 카테고리의 다른 글
KCP자격증 자주 묻는 질문과 답변 정리 (0) | 2024.04.30 |
---|---|
KCP자격증: PAC프레젠테이션능력인증자격 시험출제기준 및 시험일정 · 기출문제 다운로드 (0) | 2024.04.30 |
KCP자격증: CAD실무능력평가 시험출제기준 및 시험일정 · 기출문제 다운로드 (1) | 2024.04.30 |
KCP자격증: SW코딩자격 시험출제기준 및 시험일정 · 기출문제 다운로드 (0) | 2024.04.30 |
KCP자격증: SMAT서비스경영자격 시험출제기준 및 시험일정 · 기출문제 다운로드 (0) | 2024.04.30 |
댓글