
2과목 정리결측치 처리 (결측치가 있다면 필수) --> 평가 지표에 따라- train 만 행 삭제(train, test 둘다인데 test는 train의 값으로 채움)- 결측치 ㅈㄴ 많은 ㅄ 컬럼 : 컬럼 train test 둘다 삭제- 범주형 : 최빈값 또는 X - 수치형 : 평균값 , 중앙값이상치 처리 (선택)인코딩 (범주형 데이터가 있다면 필수)필수: y_train = train.pop("income")1) 원핫인코딩 (쉬움) shape 확인 필수!!!!!train_oh = pd.get_dummies(train)test_oh = pd.get_dummies(test)print(train.shape, test.shape, train_oh.shape, test_oh.shape)shape 갯수 차이 있다?..