2022년 6월 25일 오늘 제4회 빅데이터 분석기사 실기시험을 보고 왔습니다.
아직 회차가 많지 않은 시험이라 혹시 공부에 도움이 되실까 해서 후기 남깁니다.
(7월 8일 예상 발표에서 합격으로 확인했습니다. 작업형은 두 유형 모두 만점이었어요!)
1. 사전 지식
파이썬과 R은 공부삼아 사용해 본 경험이 약간 있었는데 머신러닝 기법을 자유롭게 사용할 정도는 아니었습니다.
그나마 파이썬이 넘파이, 판다스, 사이킷런이 뭔지는 들어본 적이 있어서 조금 더 친숙하게 느껴져서 파이썬으로 시험을 치르기로 결정했습니다.
2. 공부 방법 및 기간
실기 교재는 필기 교재보다 아쉬운 후기가 많아 필기 교재로 사용했던 예문사의 2022 빅데이터분석기사 실기 한권완성 교재로 다시 한 번 공부하기로 하였습니다.
교재 구성은 파트 1 단답형, 파트 2 파이썬, 파트 3 기출문제로 구성되어 있는데요. 실제 시험 문제에 나올법한 문제들만 직접 해보고 나머지 부분은 읽고 넘어가는 수준으로 활용했습니다.
공부는 약 시험 4주 전인 5월 29일부터 시작했는데요. 개인 일정에 맞추어서 파트 1은 1일, 파트 2는 5일, 파트 3은 2일에 나누어서 진도를 뺐습니다.
여기까지 책을 보면서 작업형 2는 EDA > 전처리 > 모델링 > 평가 순서로 문제를 풀어야 하는구나! 하는 점을 확인했고 자주 사용되는 함수들도 정리할 수 있었습니다. 책에서 해 줄 수 있는 영역은 이 정도 뿐인 것 같다는 생각도 드네요.
책을 다 본 후에는 연습문제를 풀었습니다. 연습문제는 두 곳에서 찾을 수 있었는데요.
첫 번째는 캐글 Big Data Certification KR 페이지이고
두 번째는 datamanim이라는 사이트 입니다.
두 사이트 모두 실전과 유사한 유형의 문제를 많이 정리해두어서 시험에 큰 도움이 되었습니다.
캐글 페이지에 있는 문제는 작업형 1을 하루, 작업형 2를 하루씩 나누어서 공부했고
datamanim에 있는 문제는 시험 전날에 몇 개만 골라서 풀어봤습니다.(이 곳은 늦게 발견해서 저는 다 풀어보지 못했는데 시간 여유가 된다면 다 풀어보는게 확실히 좋을 것 같아요)
단답형 문제는 당일 시험장에 일찍 가서 교재를 한 번 다시 읽어봤고, datamanim 앱에서 몇 차례 문제를 풀어봤습니다. 그리고 다른 분이 정리해주신 내용을 한 번 읽어보기도 했습니다.
여기는 제가 봤던 곳 링크에요 [https://5ohyun.tistory.com/113]
추가로 때때로 네이버 카페 데이터 전문가 포럼에서 다른 분들이 올리는 질문/답변 글을 보기도 했습니다.
3. 주관적 후기
시험 문제는 생각보다 낯설지 않았지만 코딩보다 단답형에서 오히려 막히는 내용이 있었습니다. 공부가 부족했던 것 같아요. 그래도 코딩 비중이 높고 60점짜리 시험이니 모르는 문제는 일단 넘어가고 코딩 후 남는 시간에 다시 한 번 살펴봤습니다.
작업형 문제들은 큰 어려움은 없었는데 문제를 꼼꼼히 읽어야 한다는 점 꼭 주의하시면 좋을 것 같아요. 네이버 카페를 보니 어떤 문제는 조건을 덜 주셔서 오답을 제출하신 분들도 계신 것 같더라구요.
새로웠던 건 작업형 2유형 문제가 두 가지 분류가 아니라 여러 가지 고객 세그멘트를 분류하는 내용이었습니다. 문제 풀이는 똑같아서 동일한 문제가 나중에 여러분들 시험에 출제되더라도 큰 어려움은 없으실거에요.
시험은 3시간 진행되는데 절반인 1시간 30분이 지나면 제출하고 조기 퇴실할 수 있습니다. 일찍 나가시는 분들도 어느 정도 있었습니다.
역시 시험이 끝나자마자 바로 네이버 카페로 가봤는데 답안을 맞춰보는 분들이 많아서 예상 점수를 대략이나마 가늠해볼 수 있어서 좋았습니다.
시험장은 한국IT직업전문학교 양재관으로 선택했었는데 생각보다 좁고 옆사람과 자리가 가깝더라구요. 시험 볼때는 시험에 집중해서 그런지 신경쓰이지 않았는데 시험 보기 전에는 좀 답답하다는 느낌이 들었습니다.
4. 대략적인 문제 및 예상 답안
제가 기억하고 있는 내용 + 네이버 카페 내용 참고한 문제와 답안입니다.
답과 문제 모두 확실하진 않으니 참고만 부탁드립니다!
1. 단답형
1) 속성과 값을 쌍으로 갖는 데이터? [ JSON / 딕셔너리]
2) 회귀 관련 기법 ~~ 제곱하여 ~~ [최소제곱법]
3) 람다를 사용하는 정규화 기법? [Box-cox]
4) PCA 등을 뭐라고 부르는지 [차원 축소]
5) 고차원을 저차원으로 쉽게 바꾸는 ~신경망~ [SOM]
6) 회귀 가정 중 오차가 정규성 [오차의 정규성]
7) 초평면 쓰는 지도학습 분류 기법 [SVM]
8) 신경망 과적합 방지 [드롭아웃]
9) 하둡 정형데이터 [Sqoop]
10) f1-score 0.8, 0.6 [0.686]
2. 작업형 1유형
1) q1-q3의 절대값 버림하여 정수 프린트 [36] (quantile, trunc 사용)
2) 조건 3개 만족하는 행 개수 정수로 프린트 [90] (특정 값의 비율 나타내는 새로운 열 생성함)
3) 조건 3개 만족하는 행 개수 정수로 프린트 [6] (to_datetime, dt.year, dt.month 사용)
3. 작업형 2유형
고객 세그먼트 분류 문제
train을 X_train, y_train으로 나누기
라벨인코딩
모델링
[정답 없음]
5. 요약
교재: 예문사 2022 빅데이터분석기사 실기 한권 완성
투자기간: 책 8일 + 캐글 2일 + datamanim 1일(일별 시간은 측정 X)
코딩 참고:
캐글 Big Data Certification KR 페이지
datamanim 사이트
단답형 참고: https://5ohyun.tistory.com/113
기타: 네이버 카페 데이터 전문가 포럼
'데이터 분석 > 자격증' 카테고리의 다른 글
28회 ADP 실기 후기 / 기출문제 복원 / 가답안 (0) | 2023.03.12 |
---|---|
빅데이터 분석기사 실기 작업형 2유형 흐름 (0) | 2022.07.25 |
ADP 필기 합격 후기(비전공자) (0) | 2022.06.13 |
ADP 필기 공부 오답 정리 (0) | 2022.05.05 |
제4회 빅데이터 분석기사 필기 합격 후기(비전공자) (0) | 2022.04.21 |