데이터 분석/자격증

28회 ADP 실기 후기 / 기출문제 복원 / 가답안

쎄마비 2023. 3. 12. 14:24
728x90
반응형

2023년 3월 12일 ADP 실기 시험 보고 왔습니다.

 

기억이 사라지기 전에 바로 후기 남깁니다.

 

다음과 같은 문제가 나왔습니다.

 


 

기계학습

 

[1~3 모두 결석 데이터 사용, 변수는 모두 범주형이었음]

 

1-1. EDA, 차원 축소 필요한지 확인, 기타 문제 확인

1-2. 1-1.에서 찾은 문제 처리 후 해결되었는지 재확인

1-3. 과적합 문제가 있다고 가정하고 해결하는 방법 2가지 이상 제시/수행/결과 비교

 

2-1. 랜덤포레스트, 인공신경망, lightGBM 모델링

# sklearn.ensemble.RandomForestClassifier

# sklearn.neural_network.MLPClassifier

# lightgbm.LGBMClassifier

2-2. 위 세 가지 모델로 하드 보팅, 소프트 보팅

# sklearn.ensemble.VotingClassifier

2-3. 2-1과 2-2의 총 5가지 방법 중 최적의 방법 선택 및 이유 설명

 

3-1. 문제 1과 2에서 추가로 수행해야 하는 것이 무엇인지 설명

3-2. 만든 모델을 학교 정보시스템에서 활용하려면 어떻게 해야 하는지 적고 설명

 

통계분석

 

4-1. 시간별/제조사별 불량률 데이터로 생존분석하여 25, 30, 35개월 후 불량률 계산

# lifelines.KaplanMeierFitter

4-2. 로그 순위법으로 제조사별 차이 검정

# lifelines.statistics.logrank_test

 

5. 시식 전 후 구매 의도를 가진 사람 비율 차이 검정 # 교차표 형식으로 표 그림 제공

# scipy.stats.chi2_contingency

 

6. 2개 열을 가진 성적 데이터로 각 열의 분산 차이 검정 # 각 열의 행 개수가 달랐음

# scipy.stats.levene ?

 

7. 몸무게 통제 시 나이와 콜레스테롤 지수 편상관분석 # pingouin.partial_corr

 

 


 

이번 시험에서 중요했던 부분은 머신러닝에서는 얼마나 설명을 잘 하느냐

통계분석에서는 생존분석을 할 줄 아느냐 였던 것 같습니다.

 

생존분석을 위해서는 python의 lifelines 패키지를 사용할 줄 알아야 하는데

이 패키지가 이번에 추가된 패키지라 많은 분들이 어려워하셨을 것 같네요.

 

저는 데이터마님에서 운영하는 단톡방에서 소식을 들어 혹시나 해서 대비했는데 바로 나오다니... 무섭습니다 ADP...

728x90
반응형