반응형
https://tonnykang.tistory.com/269
주성분분석 PCA
여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존변수를 요약 및 축소하는 분석 방법이다
- 변수를 축소하여 모형의 설명력을 높임
- 다중공선성 문제를 해결
- 군집분석 시 모형의 성능을 높일 수 있음
- IoT 센서 데이터를 주성분분석 후 스마트팩토리에 활용
- 선형변환이 필요함
728x90
실습
> fruits <- data.frame(cal, car, fat, pro, fib, sug)
> result <- prcomp(fruits, center = T, scale = T)
#center와 scale 값을 T로 표준화하여 변수 간 단위 차이를 제거
> result
standard deviations (1, .., p=6):
Proportion of Variance가 높을 수록 원래 데이터에 대한 설명력이 높은 것이고
Cumulative Proportion이 70~90 정도는 될정도로 성분을 골라야한다
반응형
주성분분석 - Scree Plot
x축은 성분의 개수, y축을 고유값(eigenvalue)으로 하는 그래프로 주성분의 개수를 선택하는 데 도움을 준다, 일반적으로 고유값이 1 근처의 값는 주성분분석의 수를 결정할 수 있고, 또는 그래프가 수평을 이루기 전 단계로 선택 할 수 있다
> screeplot( result, type = 'lines')
반응형
'컴퓨터공학 > ADsP' 카테고리의 다른 글
ADsP 데이터 분석 준 전문가 정리 14 (37) | 2024.07.20 |
---|---|
ADsP 데이터 분석 준 전문가 정리 13 (51) | 2024.07.19 |
ADsP 데이터 분석 준 전문가 정리 11 (59) | 2024.07.17 |
ADsP 데이터 분석 준 전문가 정리 10 (58) | 2024.07.16 |
ADsP 데이터 분석 준 전문가 정리 9 (50) | 2024.07.15 |