T'SPACE

다채로운 에디터들의 이야기

컴퓨터공학/ADsP

ADsP 데이터 분석 준 전문가 정리 12

Tonny Kang 2024. 7. 18. 10:15
반응형

https://tonnykang.tistory.com/269

 

ADsP 데이터 분석 준 전문가 정리 11

https://tonnykang.tistory.com/268 ADsP 데이터 분석 준 전문가 정리 10https://tonnykang.tistory.com/267 ADsP 데이터 분석 준 전문가 정리 9https://tonnykang.tistory.com/266 ADsP 데이터 분석 준 전문가 정리 8https://tonnykang.

tonnykang.tistory.com

 

주성분분석 PCA

여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존변수를 요약 및 축소하는 분석 방법이다

  • 변수를 축소하여 모형의 설명력을 높임
  • 다중공선성 문제를 해결
  • 군집분석 시 모형의 성능을 높일 수 있음
  • IoT 센서 데이터를 주성분분석 후 스마트팩토리에 활용
  • 선형변환이 필요함
728x90

실습

> fruits <- data.frame(cal, car, fat, pro, fib, sug)
> result <- prcomp(fruits, center = T, scale = T)

#center와 scale 값을 T로 표준화하여 변수 간 단위 차이를 제거

> result
standard deviations (1, .., p=6):

Proportion of Variance가 높을 수록 원래 데이터에 대한 설명력이 높은 것이고

Cumulative Proportion이 70~90 정도는 될정도로 성분을 골라야한다

반응형

주성분분석 - Scree Plot

x축은 성분의 개수, y축을 고유값(eigenvalue)으로 하는 그래프로 주성분의 개수를 선택하는 데 도움을 준다, 일반적으로 고유값이 1 근처의 값는 주성분분석의 수를 결정할 수 있고, 또는 그래프가 수평을 이루기 전 단계로 선택 할 수 있다

> screeplot( result, type = 'lines')

반응형