T'SPACE

다채로운 에디터들의 이야기

728x90
반응형

컴퓨터공학 109

오버피팅 과적합과 언더핏팅

학습 곡선 해석하기훈련 데이터에 있는 정보를 크게 두 가지로 나눌 수 있습니다: 신호(signal)와 노이즈(noise)입니다. 신호는 모델이 새로운 데이터에서 예측할 때 도움이 되는 부분이며, 일반화될 수 있는 정보입니다. 반면, 노이즈는 훈련 데이터에서만 나타나는 우연한 변동이나 의미 없는 패턴을 포함하고 있으며, 실제로는 예측에 도움이 되지 않는 정보입니다.모델을 훈련할 때, 우리는 훈련 세트의 손실(loss)을 최소화하는 가중치 또는 파라미터를 선택합니다. 그러나 모델의 성능을 정확하게 평가하려면 새로운 데이터 세트, 즉 검증 데이터(validation data)에서 평가해야 합니다.훈련할 때, 우리는 각 에포크마다 훈련 세트의 손실을 그래프로 그립니다. 여기에 검증 데이터의 손실도 추가로 플로팅..

Stochastic Gradient Descent 경사하강법

신경망 훈련 방법: 학습 과정 이해하기이번 강의에서는 신경망을 훈련시키는 방법과 신경망이 어떻게 학습하는지를 알아보겠습니다.모든 머신러닝 작업과 마찬가지로, 우리는 먼저 학습 데이터를 준비해야 합니다. 학습 데이터의 각 예시는 입력(특징)과 기대 출력(목표)으로 구성됩니다. 신경망을 훈련시킨다는 것은, 이러한 입력을 출력으로 변환할 수 있도록 네트워크의 가중치를 조정하는 것을 의미합니다.학습 데이터를 준비하는 것 외에도, 우리는 두 가지 요소가 더 필요합니다:손실 함수: 네트워크의 예측이 얼마나 좋은지를 측정합니다.최적화 알고리즘: 네트워크가 가중치를 어떻게 변경해야 할지 알려줍니다.손실 함수손실 함수는 모델의 예측값과 목표값의 차이를 측정합니다. 문제 유형에 따라 다른 손실 함수를 사용할 수 있습니다...

딥뉴럴 네트워크 Deep Neural Networks

레이어 Layers신경망은 일반적으로 뉴런을 레이어로 조직화합니다. 동일한 입력을 가진 선형 유닛들을 모으면 밀집층(dense layer)이 됩니다.신경망의 각 레이어는 상대적으로 간단한 변환을 수행한다고 생각할 수 있습니다. 여러 레이어가 쌓이면서 신경망은 입력을 점점 더 복잡한 방식으로 변환할 수 있습니다. 잘 훈련된 신경망에서는 각 레이어가 점점 더 정답에 가까워지도록 변환을 수행합니다.활성화 함수 Activation Function그러나, 두 개의 밀집층을 중간에 아무것도 없이 연결하면 하나의 밀집층과 크게 다르지 않습니다.→ 여러 선형 변환을 거쳐도 여전히 선형이기 때문입니다.밀집층만으로는 단순한 선과 평면의 세계를 벗어날 수 없습니다. 우리는 비선형적인 무언가가 필요합니다. 바로 활성화 함수입..

딥러닝과 뉴런, 파이썬 케라스 코드

딥러닝이란 무엇인가?딥러닝은 기계 학습의 한 접근 방식으로, 깊이 있는 계산 스택이 특징입니다. 이러한 깊은 계산이 딥러닝 모델이 복잡하고 계층적인 패턴을 파악할 수 있게 해주며, 이는 가장 도전적인 실제 데이터셋에서 발견됩니다.신경망은 이러한 강력함과 확장성을 통해 딥러닝의 대표적인 모델이 되었습니다.선형 유닛 Linear Unity=wx+b신경망의 연결에는 w라고 하는 가중치가 있습니다. 값이 연결을 통해 흐를 때마다, 그 값을 연결의 가중치로 곱합니다.신경망은 가중치를 수정함으로써 "학습"합니다.b는 바이어스 (bias) 라고 불리는 특별한 종류의 가중치입니다. 바이어스는 입력 데이터와 연관되지 않은 출력 값을 조정할 수 있게 해줍니다.다중 입력 하나의 뉴런에 더 많은 입력 연결을 추가하여 각 추가..

ADsP 데이터 분석 준 전문가 정리 18

https://tonnykang.tistory.com/278 ADsP 데이터 분석 준 전문가 정리 17거리 측도변수가 연속형인 경우유클리디안 거리 (Euclidean):L2 Norm, 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로, 두 점 사이의 가장 짧은 거리를 계산한다맨하튼 거리 (Manhattan):tonnykang.tistory.com연관분석연관분석의 척도지지도 (Support)전체 거래 중에서 A와 B라는 두 개의 품목이 동시에 포함된 거래의 비율지지도가 높다는 것은 그 두개의 아이템이 같이 잘 팔린다는 것신뢰도어떤 하나의 품목이 구매되었을 때 다른 품목 하나가 구매될 확률항상도품목 A가 주어지지 않았을 때 품목 B가 구매될 확률 대비 품목 A가 구매될 떄 품목 B가 구매될 확..

ADsP 데이터 분석 준 전문가 정리 17

거리 측도변수가 연속형인 경우유클리디안 거리 (Euclidean):L2 Norm, 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로, 두 점 사이의 가장 짧은 거리를 계산한다맨하튼 거리 (Manhattan):L1 Norm, 두 점 사이를 가로지르지 않고 길을 따라 갔을 때의 거리고, 변수들의 차이의 단순합으로 계산한 거리다체비셰프 거리 (Chebyshev):변수 간 거리 차이 중 최대값을 데이터 간의 거리로 정의한다.마할라노비스 거리:표준화 거리가 고려하지 못한 변수 간 상관성까지 고려한 거리다(S:변수의 공분산을 성분으로 하는 대각행렬)민코프스키 거리:Generalized Norm, 유클리디안 거리와 맨하튼 거리를 한번에 표현한 거리로, m=1일 때는 맨하튼 거리이며, m=2일 때는 유클..

ADsP 데이터 분석 준 전문가 정리 16

인공신경망 알고리즘활성함수 Activation Function인공신경망은 노드에 입력되는 값을 바로 다음 노드로 전달하지 않고 비선형 함수에 통과시킨 후 전달한다 → 이떄 사용되는 비선형함수를 활성함수라고 한다대표적으로는Step Function, Sigmoid Function, Sign Function, Tanh Function, ReLU function, Softmax Function 등이 있다인공신경망의 계층 구조데이터를 입력하는 입력층, 데이터를 출력하는 출력층을 갖고 있는 단층신경망과 입력층과 출력층 사이에 보이지 않는 다수의 은닉층을 가지고 있을 수 있는 다층신경망으로 구분을 할 수 있다단층 퍼셉트론 (단층 신경망)입력층이 은닉층을 거치지 않고 바로 출력층과 연결된다하나의 데이터로 가공되어 활성..

ADsP 데이터 분석 준 전문가 정리 15

로지스틱 회귀분석의 변수일반적인 로지스틱 회귀분석은 종속변수가 속할 수 있는 집단이 두개로 이진 분류가 기본이며, 세개 이상의 집단을 분류하는 경우 이를 “다중 로지스틱 회귀분석”이라 한다로지스틱 회귀분석은 독립변수가 연속형이면서 종속변수가 범주형일 떄 가능하다. 만약 독립변수가 범주형일 경우에는 그 범주형 독립변수를 더미변수로(Dummy) 변환하면 가능하다오즈 Odds성공할 확률이 실패할 확률의 몇 배인지를 나타내는 값이다로지스틱 회귀분석에서 이 오즈를 사용하여 각 범주에 분류될 확률 값을 추정한다ex) 제비를 뽑아 4번의 성공과 1번의 실패를 경험하였다면 오즈는 4이다성공확률이 P이니 실패확률은 1-P이다이때 오즈값은로그를 취한 로지스틱 회귀분석 추정식은위 로지스틱 회귀분석의 추정식으로부터 오즈값을 ..

ADsP 데이터 분석 준 전문가 정리 14

데이터 마이닝Data Mining은 방대한 양의 데이터 속에서 숨겨진 규칙, 패턴 등을 찾아내어 예측하거나 의사결정에 활용하는 것을 목적으로 한다.데이터 마이닝의 종류데이터 마이닝 방법에 따른 분류지도학습정답이 있는 데이터를 활용해 분석 모델을 학습시키는 것이다, 입력 데이터에 따른 출력 데이터 모두가 필요한 학습 방법이다비지도학습지도학습과는 달리 정답을 알려주지 않고 학습하는 것이다. 컴퓨터가 학습할 때 입력 데이터만 가지고 그 속에 숨겨진 패턴을 찾아내는 학습 방법이다데이터 마이닝 분석 목적에 따른 분류분류 Classification 분석대표적인 지도학습 중 하나로 데이터가 어떤 그룹에 속하는지 판별하고자 하는 분석 기법이다군집 Clustering 분석비지도학습 중 하나로 여러 이질적인 데이터들 사이..

ADsP 데이터 분석 준 전문가 정리 13

https://tonnykang.tistory.com/270 ADsP 데이터 분석 준 전문가 정리 12주성분분석 PCA여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존변수를 요약 및 축소하는 분석 방법이다변수를 축소하여 모형의 설명력을 높임tonnykang.tistory.com 시계열 분석일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석방법이다시계열 자료의 자기상관성이 말은 서로 이웃하는 자료들끼리 일종의 상관관계를 가진다는 말이다→ 시간적으로 앞 뒤 데이터와 관련 있음여기서 공분산의 개념을 살펴봐야한다 Covariance→ 두 개의 확률 변수의 선형관계를 나타낸다→ 하나의 증감에 따른 다른 확률 변수의 증감 경향에 대한 측도..

728x90
반응형