안녕하세요 노션에 이전 빅데이터 분석기사 공부할 때 적었던 노트가 있어 공유합니다. 맨 처음 공부할 때 정리한거라 빠진 부분도 많지만 작업형 2유형의 전체적인 프로세스가 이런 식으로 흘러가는구나 하고 보시면 도움되는 부분이 있을 것 같습니다 :) 데이터 불러오기pd.read_csv() 데이터 EDAdf.info() df.describe() df.unique() 결측치 처리df.dropna() df.index_reset(drop = True, inplace = True) 범주형 변수 처리from sklearn.preprocessing import OneHotEncoder ohe = OneHotEncoder() X = pd.concat([X_train,X_test]) ohe.fit(X[COL_CAT]) X_..