T'SPACE

다채로운 에디터들의 이야기

728x90
반응형

컴퓨터공학/ADsP 18

ADsP 데이터 분석 준 전문가 정리 18

https://tonnykang.tistory.com/278 ADsP 데이터 분석 준 전문가 정리 17거리 측도변수가 연속형인 경우유클리디안 거리 (Euclidean):L2 Norm, 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로, 두 점 사이의 가장 짧은 거리를 계산한다맨하튼 거리 (Manhattan):tonnykang.tistory.com연관분석연관분석의 척도지지도 (Support)전체 거래 중에서 A와 B라는 두 개의 품목이 동시에 포함된 거래의 비율지지도가 높다는 것은 그 두개의 아이템이 같이 잘 팔린다는 것신뢰도어떤 하나의 품목이 구매되었을 때 다른 품목 하나가 구매될 확률항상도품목 A가 주어지지 않았을 때 품목 B가 구매될 확률 대비 품목 A가 구매될 떄 품목 B가 구매될 확..

ADsP 데이터 분석 준 전문가 정리 17

거리 측도변수가 연속형인 경우유클리디안 거리 (Euclidean):L2 Norm, 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로, 두 점 사이의 가장 짧은 거리를 계산한다맨하튼 거리 (Manhattan):L1 Norm, 두 점 사이를 가로지르지 않고 길을 따라 갔을 때의 거리고, 변수들의 차이의 단순합으로 계산한 거리다체비셰프 거리 (Chebyshev):변수 간 거리 차이 중 최대값을 데이터 간의 거리로 정의한다.마할라노비스 거리:표준화 거리가 고려하지 못한 변수 간 상관성까지 고려한 거리다(S:변수의 공분산을 성분으로 하는 대각행렬)민코프스키 거리:Generalized Norm, 유클리디안 거리와 맨하튼 거리를 한번에 표현한 거리로, m=1일 때는 맨하튼 거리이며, m=2일 때는 유클..

ADsP 데이터 분석 준 전문가 정리 16

인공신경망 알고리즘활성함수 Activation Function인공신경망은 노드에 입력되는 값을 바로 다음 노드로 전달하지 않고 비선형 함수에 통과시킨 후 전달한다 → 이떄 사용되는 비선형함수를 활성함수라고 한다대표적으로는Step Function, Sigmoid Function, Sign Function, Tanh Function, ReLU function, Softmax Function 등이 있다인공신경망의 계층 구조데이터를 입력하는 입력층, 데이터를 출력하는 출력층을 갖고 있는 단층신경망과 입력층과 출력층 사이에 보이지 않는 다수의 은닉층을 가지고 있을 수 있는 다층신경망으로 구분을 할 수 있다단층 퍼셉트론 (단층 신경망)입력층이 은닉층을 거치지 않고 바로 출력층과 연결된다하나의 데이터로 가공되어 활성..

ADsP 데이터 분석 준 전문가 정리 15

로지스틱 회귀분석의 변수일반적인 로지스틱 회귀분석은 종속변수가 속할 수 있는 집단이 두개로 이진 분류가 기본이며, 세개 이상의 집단을 분류하는 경우 이를 “다중 로지스틱 회귀분석”이라 한다로지스틱 회귀분석은 독립변수가 연속형이면서 종속변수가 범주형일 떄 가능하다. 만약 독립변수가 범주형일 경우에는 그 범주형 독립변수를 더미변수로(Dummy) 변환하면 가능하다오즈 Odds성공할 확률이 실패할 확률의 몇 배인지를 나타내는 값이다로지스틱 회귀분석에서 이 오즈를 사용하여 각 범주에 분류될 확률 값을 추정한다ex) 제비를 뽑아 4번의 성공과 1번의 실패를 경험하였다면 오즈는 4이다성공확률이 P이니 실패확률은 1-P이다이때 오즈값은로그를 취한 로지스틱 회귀분석 추정식은위 로지스틱 회귀분석의 추정식으로부터 오즈값을 ..

ADsP 데이터 분석 준 전문가 정리 14

데이터 마이닝Data Mining은 방대한 양의 데이터 속에서 숨겨진 규칙, 패턴 등을 찾아내어 예측하거나 의사결정에 활용하는 것을 목적으로 한다.데이터 마이닝의 종류데이터 마이닝 방법에 따른 분류지도학습정답이 있는 데이터를 활용해 분석 모델을 학습시키는 것이다, 입력 데이터에 따른 출력 데이터 모두가 필요한 학습 방법이다비지도학습지도학습과는 달리 정답을 알려주지 않고 학습하는 것이다. 컴퓨터가 학습할 때 입력 데이터만 가지고 그 속에 숨겨진 패턴을 찾아내는 학습 방법이다데이터 마이닝 분석 목적에 따른 분류분류 Classification 분석대표적인 지도학습 중 하나로 데이터가 어떤 그룹에 속하는지 판별하고자 하는 분석 기법이다군집 Clustering 분석비지도학습 중 하나로 여러 이질적인 데이터들 사이..

ADsP 데이터 분석 준 전문가 정리 13

https://tonnykang.tistory.com/270 ADsP 데이터 분석 준 전문가 정리 12주성분분석 PCA여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존변수를 요약 및 축소하는 분석 방법이다변수를 축소하여 모형의 설명력을 높임tonnykang.tistory.com 시계열 분석일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석방법이다시계열 자료의 자기상관성이 말은 서로 이웃하는 자료들끼리 일종의 상관관계를 가진다는 말이다→ 시간적으로 앞 뒤 데이터와 관련 있음여기서 공분산의 개념을 살펴봐야한다 Covariance→ 두 개의 확률 변수의 선형관계를 나타낸다→ 하나의 증감에 따른 다른 확률 변수의 증감 경향에 대한 측도..

ADsP 데이터 분석 준 전문가 정리 12

https://tonnykang.tistory.com/269 ADsP 데이터 분석 준 전문가 정리 11https://tonnykang.tistory.com/268 ADsP 데이터 분석 준 전문가 정리 10https://tonnykang.tistory.com/267 ADsP 데이터 분석 준 전문가 정리 9https://tonnykang.tistory.com/266 ADsP 데이터 분석 준 전문가 정리 8https://tonnykang.tonnykang.tistory.com 주성분분석 PCA여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존변수를 요약 및 축소하는 분석 방법이다변수를 축소하여 모형의 설명력을 높임다중공선성 문제를 해결군집분석 시 모형의 성능을 높..

ADsP 데이터 분석 준 전문가 정리 11

https://tonnykang.tistory.com/268 ADsP 데이터 분석 준 전문가 정리 10https://tonnykang.tistory.com/267 ADsP 데이터 분석 준 전문가 정리 9https://tonnykang.tistory.com/266 ADsP 데이터 분석 준 전문가 정리 8https://tonnykang.tistory.com/265 데이터 준 분석가 R언어 기초https://tonnykang.tistorytonnykang.tistory.com 회귀분석 Regression회귀분석의 가정선형성독립변수와 종속변수가 선형적이어야한다예외적으로는 2차 함수 회귀선을 갖는 다항회귀분석의 경우에는 괜찮다독립성단순회귀분석에서는 잔차와 독립변수의 값이 서로 독립이어야한다독립변수가 여러 개인 다..

ADsP 데이터 분석 준 전문가 정리 10

https://tonnykang.tistory.com/267 ADsP 데이터 분석 준 전문가 정리 9https://tonnykang.tistory.com/266 ADsP 데이터 분석 준 전문가 정리 8https://tonnykang.tistory.com/265 데이터 준 분석가 R언어 기초https://tonnykang.tistory.com/264 ADsP 데이터 분석 준 전문가 정리 6분석 준비도기업의tonnykang.tistory.com 상관 분석 Correlation Analysis피어슨 상관분석 (선형적 상관관계)Pearson’s Correlation Analysis피어슨 상관계수는 모수적 방법의 하나로두 변수가 모두 정규분포를 따른다는 가정이 필요하다> X Y cor( X, Y, method ..

ADsP 데이터 분석 준 전문가 정리 9

https://tonnykang.tistory.com/266 ADsP 데이터 분석 준 전문가 정리 8https://tonnykang.tistory.com/265 데이터 준 분석가 R언어 기초https://tonnykang.tistory.com/264 ADsP 데이터 분석 준 전문가 정리 6분석 준비도기업의 데이터 분석 도입의 수준을 파악하기 위한 진단 방법이다tonnykang.tistory.com  측정과 척도측정: 표본조사를 실시하는 경우 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하게 관측해 자료를 얻는 것척도: 관측 대상의 속성을 측정하여 그 값이 숫자로 나타나도록 일정한 규칙을 정하여 바꾸는 도구척도의 종류질적 척도명목척도측정 대상이 어느 집단에 속하는지 나타내는 자료ex) 성별, 지역순..

728x90
반응형