본문 바로가기
반응형

ADP2

데이터 결합 및 요약 모형에 적용할 데이터를 만들기 위해 서로 다른 여러 개의 데이터를 결합하는 과정이 필요할 수 있다. 이 같이 데이터 결합과 요약에 사용될 수 있는 유용한 함수들을 알아보자! 1. 데이터 결합 1) rbind - 행을 서로 결합 - rbind를 사용할 때는 결합하고자 하는 데이터의 열 이름과 개수가 동일해야 한다는 점 > customer1 customer2 customer1 id last_name 1 c01 Lee 2 c02 Kim 3 c03 Choi 4 c04 Park > id_name id_name id last_name 1 c01 Lee 2 c02 Kim 3 c03 Choi 4 c04 Park 5 c05 Lim 6 c06 Bae 7 c07 Kim 2) cbind - 열을 서로 결합 - cbind를 사.. 2021. 1. 2.
주성분분석(PCA) 주성분분석(PCA)은 수치형 변수가 어떤 식으로 공변하는 지 알아내는 기법 용어정리 - 주성분 : 예측변수들의 선형결합 - 부하(loading) : 예측변수들을 성분으로 변형할 때 사용되는 가중치 - 스크리그래프 : 성분들의 변동을 표시한 그림. 성분들의 상대적인 중요도를 보여준다. 즉, 전체 변수들의 변동성을 거의 대부분 설명할 수 있느 적은 수의 변수들의 집합을 주성분이라고 한다. PCA는 선형판별분석의 비지도 학습 버전이라고도 할 수 있다. 가중치 (w1, w2)를 주성분의 부하 라고 한다. 주성분 분석을 할 때, 첫 번째 주성분으로 전체 변동을 가장 많이 설명할 수 있도록 하고, 두 번째 주성분으로는 첫 번째 주성분이 설명하지 못하는 나머지 변동을 정보의 손실 없이 가장 많이 설명할 수 있도록 변.. 2020. 12. 31.
반응형