데이터 분석/자격증

제4회 빅데이터 분석기사 실기 합격 후기, 예상 답안(비전공자)

쎄마비 2022. 6. 25. 15:52
728x90
반응형

2022년 6월 25일 오늘 제4회 빅데이터 분석기사 실기시험을 보고 왔습니다.

아직 회차가 많지 않은 시험이라 혹시 공부에 도움이 되실까 해서 후기 남깁니다.

 

(7월 8일 예상 발표에서 합격으로 확인했습니다. 작업형은 두 유형 모두 만점이었어요!)


1. 사전 지식

파이썬과 R은 공부삼아 사용해 본 경험이 약간 있었는데 머신러닝 기법을 자유롭게 사용할 정도는 아니었습니다.

그나마 파이썬이 넘파이, 판다스, 사이킷런이 뭔지는 들어본 적이 있어서 조금 더 친숙하게 느껴져서 파이썬으로 시험을 치르기로 결정했습니다.

 


2. 공부 방법 및 기간

실기 교재는 필기 교재보다 아쉬운 후기가 많아 필기 교재로 사용했던 예문사2022 빅데이터분석기사 실기 한권완성 교재로 다시 한 번 공부하기로 하였습니다.

교재 구성은 파트 1 단답형, 파트 2 파이썬, 파트 3 기출문제로 구성되어 있는데요. 실제 시험 문제에 나올법한 문제들만 직접 해보고 나머지 부분은 읽고 넘어가는 수준으로 활용했습니다.

공부는 약 시험 4주 전인 5월 29일부터 시작했는데요. 개인 일정에 맞추어서 파트 1은 1일,  파트 2는 5일, 파트 3은 2일에 나누어서 진도를 뺐습니다.

여기까지 책을 보면서 작업형 2는 EDA > 전처리 > 모델링 > 평가 순서로 문제를 풀어야 하는구나! 하는 점을 확인했고 자주 사용되는 함수들도 정리할 수 있었습니다. 책에서 해 줄 수 있는 영역은 이 정도 뿐인 것 같다는 생각도 드네요.

 

책을 다 본 후에는 연습문제를 풀었습니다. 연습문제는 두 곳에서 찾을 수 있었는데요.

첫 번째는 캐글 Big Data Certification KR 페이지이고

두 번째는 datamanim이라는 사이트 입니다.

두 사이트 모두 실전과 유사한 유형의 문제를 많이 정리해두어서 시험에 큰 도움이 되었습니다.

 

캐글 페이지에 있는 문제는 작업형 1을 하루, 작업형 2를 하루씩 나누어서 공부했고

datamanim에 있는 문제는 시험 전날에 몇 개만 골라서 풀어봤습니다.(이 곳은 늦게 발견해서 저는 다 풀어보지 못했는데 시간 여유가 된다면 다 풀어보는게 확실히 좋을 것 같아요)

 

단답형 문제는 당일 시험장에 일찍 가서 교재를 한 번 다시 읽어봤고, datamanim 앱에서 몇 차례 문제를 풀어봤습니다. 그리고 다른 분이 정리해주신 내용을 한 번 읽어보기도 했습니다.

여기는 제가 봤던 곳 링크에요 [https://5ohyun.tistory.com/113]

 

추가로 때때로 네이버 카페 데이터 전문가 포럼에서 다른 분들이 올리는 질문/답변 글을 보기도 했습니다.

 


3. 주관적 후기

시험 문제는 생각보다 낯설지 않았지만 코딩보다 단답형에서 오히려 막히는 내용이 있었습니다. 공부가 부족했던 것 같아요. 그래도 코딩 비중이 높고 60점짜리 시험이니 모르는 문제는 일단 넘어가고 코딩 후 남는 시간에 다시 한 번 살펴봤습니다.

 

작업형 문제들은 큰 어려움은 없었는데 문제를 꼼꼼히 읽어야 한다는 점 꼭 주의하시면 좋을 것 같아요. 네이버 카페를 보니 어떤 문제는 조건을 덜 주셔서 오답을 제출하신 분들도 계신 것 같더라구요.

새로웠던 건 작업형 2유형 문제가 두 가지 분류가 아니라 여러 가지 고객 세그멘트를 분류하는 내용이었습니다. 문제 풀이는 똑같아서 동일한 문제가 나중에 여러분들 시험에 출제되더라도 큰 어려움은 없으실거에요.

 

시험은 3시간 진행되는데 절반인 1시간 30분이 지나면 제출하고 조기 퇴실할 수 있습니다. 일찍 나가시는 분들도 어느 정도 있었습니다.

 

역시 시험이 끝나자마자 바로 네이버 카페로 가봤는데 답안을 맞춰보는 분들이 많아서 예상 점수를 대략이나마 가늠해볼 수 있어서 좋았습니다.

 

시험장은 한국IT직업전문학교 양재관으로 선택했었는데 생각보다 좁고 옆사람과 자리가 가깝더라구요. 시험 볼때는 시험에 집중해서 그런지 신경쓰이지 않았는데 시험 보기 전에는 좀 답답하다는 느낌이 들었습니다.

 


4. 대략적인 문제 및 예상 답안

제가 기억하고 있는 내용 + 네이버 카페 내용 참고한 문제와 답안입니다.

답과 문제 모두 확실하진 않으니 참고만 부탁드립니다!

 

1. 단답형

1) 속성과 값을 쌍으로 갖는 데이터?   [ JSON / 딕셔너리]

2) 회귀 관련 기법 ~~ 제곱하여 ~~ [최소제곱법]

3) 람다를 사용하는 정규화 기법? [Box-cox]

4) PCA 등을 뭐라고 부르는지 [차원 축소]

5) 고차원을 저차원으로 쉽게 바꾸는 ~신경망~ [SOM]

6) 회귀 가정 중 오차가 정규성 [오차의 정규성]

7) 초평면 쓰는 지도학습 분류 기법 [SVM]

8) 신경망 과적합 방지 [드롭아웃]

9) 하둡 정형데이터 [Sqoop]

10) f1-score 0.8, 0.6 [0.686]

 

2. 작업형 1유형

1) q1-q3의 절대값 버림하여 정수 프린트 [36] (quantile, trunc 사용)

2) 조건 3개 만족하는 행 개수 정수로 프린트 [90] (특정 값의 비율 나타내는 새로운 열 생성함)

3) 조건 3개 만족하는 행 개수 정수로 프린트 [6] (to_datetime, dt.year, dt.month 사용)

 

3. 작업형 2유형

 

고객 세그먼트 분류 문제

train을 X_train, y_train으로 나누기

라벨인코딩

모델링

 

[정답 없음]


5. 요약

교재: 예문사 2022 빅데이터분석기사 실기 한권 완성

 

투자기간: 책 8일 + 캐글 2일 + datamanim 1일(일별 시간은 측정 X)

 

코딩 참고:

캐글 Big Data Certification KR 페이지

datamanim 사이트

 

단답형 참고: https://5ohyun.tistory.com/113

 

기타: 네이버 카페 데이터 전문가 포럼

 

728x90
반응형