Show pageOld revisionsBacklinksBack to top This page is read only. You can view the source, but not change it. Ask your administrator if you think this is wrong. # PCA (주성분 분석) {{ https://i.imgur.com/aBvAyge.jpg?300 }} [[PCA]]로 고차원의 [[Feature]] 중 중요한 몇 가지를 추출(extract) ### PCA 이해 https://blog.naver.com/hancury/221215245092 분산이 크다 = 주어진 정보가 많다 주어진 데이터의 분산을 표현할 수 있는 벡터를 찾을 수 있다면, 그 중 표현력이 큰 벡터를 선별 후 원본 데이터를 투영 k차원의 새로운 데이터 셋으로 재구성 (k < d) ### PCA <code py> from sklearn.decomposition import PCA pca = PCA(n_components=60, svd_solver='full') dummied = dummied.drop(columns=['id', 'income_<=50K', 'income_>50K']) X_train_std = st_scaler.fit_transform(dummied) X_train_pca = pca.fit_transform(X_train_std) </code> open/pca.txt Last modified: 2024/10/05 06:15by 127.0.0.1