T'SPACE

다채로운 에디터들의 이야기

728x90
반응형

요약 8

ADsP 데이터 분석 준 전문가 정리 17

거리 측도변수가 연속형인 경우유클리디안 거리 (Euclidean):L2 Norm, 두 점 사이의 거리를 계산할 때 가장 널리 쓰이는 계산 방법으로, 두 점 사이의 가장 짧은 거리를 계산한다맨하튼 거리 (Manhattan):L1 Norm, 두 점 사이를 가로지르지 않고 길을 따라 갔을 때의 거리고, 변수들의 차이의 단순합으로 계산한 거리다체비셰프 거리 (Chebyshev):변수 간 거리 차이 중 최대값을 데이터 간의 거리로 정의한다.마할라노비스 거리:표준화 거리가 고려하지 못한 변수 간 상관성까지 고려한 거리다(S:변수의 공분산을 성분으로 하는 대각행렬)민코프스키 거리:Generalized Norm, 유클리디안 거리와 맨하튼 거리를 한번에 표현한 거리로, m=1일 때는 맨하튼 거리이며, m=2일 때는 유클..

ADsP 데이터 분석 준 전문가 정리 13

https://tonnykang.tistory.com/270 ADsP 데이터 분석 준 전문가 정리 12주성분분석 PCA여러 개의 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존변수를 요약 및 축소하는 분석 방법이다변수를 축소하여 모형의 설명력을 높임tonnykang.tistory.com 시계열 분석일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석방법이다시계열 자료의 자기상관성이 말은 서로 이웃하는 자료들끼리 일종의 상관관계를 가진다는 말이다→ 시간적으로 앞 뒤 데이터와 관련 있음여기서 공분산의 개념을 살펴봐야한다 Covariance→ 두 개의 확률 변수의 선형관계를 나타낸다→ 하나의 증감에 따른 다른 확률 변수의 증감 경향에 대한 측도..

ADsP 데이터 분석 준 전문가 정리 6

https://tonnykang.tistory.com/263 ADsP 데이터 분석 준 전문가 정리 5분석 마스터플랜 수립 프레임워크첫 단계는 발굴한 분석 과제의 우선순위를 정하는일이다전략적 중요도비즈니스 성과 및 ROI분석 과제의 실행 용이성을 기준으로 고려해 우선순위를 설정한다 tonnykang.tistory.com  분석 준비도기업의 데이터 분석 도입의 수준을 파악하기 위한 진단 방법이다분석 업무 파악분석 인력 및 조직분석 기법분석 데이터분석 문화IT 인프라분석 준비도 및 성숙도 진단 결과를 4분면으로 구분확-정-준-도데이터 분석 조직 유형집중형 조직 구조조직 내에 별도의 독립적인 분석 전담 조직을 구성하고 회사의 모든 분석 업무를 담당기능 중심의 조직 구조별도로 분석 조직을 구성하지 않고 각 해당 ..

ADsP 데이터 분석 준 전문가 정리 5

https://tonnykang.tistory.com/261 ADsP 데이터 분석 준 전문가 정리 4https://tonnykang.tistory.com/257 ADsP 데이터 분석 준 전문가 정리 3데이터 분석 기획분석 대상과 그 방법에 따른 4가지 분석 주제최적화 Optimization - 문제, 분석법 둘다 앎솔루션 Solution - 문제만 알고 분tonnykang.tistory.com  분석 마스터플랜 수립 프레임워크첫 단계는 발굴한 분석 과제의 우선순위를 정하는일이다전략적 중요도비즈니스 성과 및 ROI분석 과제의 실행 용이성을 기준으로 고려해 우선순위를 설정한다 우선순위 고려요소와 적용범위/방식 고려 요소를 구분하는 것은 시험에 자주 출제되었다 https://tonnykang.tistory.c..

ADsP 데이터 분석 준 전문가 정리 4

https://tonnykang.tistory.com/257 ADsP 데이터 분석 준 전문가 정리 3데이터 분석 기획분석 대상과 그 방법에 따른 4가지 분석 주제최적화 Optimization - 문제, 분석법 둘다 앎솔루션 Solution - 문제만 알고 분석법 모름발견 Discovery - 둘다 모름통찰 Insight - 문제는 모르tonnykang.tistory.com 하양식 접근법1단계 - 문제 탐색 단계1. 비즈니스 모델 탐색 기법비즈니스 모델 캔버스의 9가지 블록을 5가지로 단순화한 탐색 기법이다2. 분석 기회 발굴 범위의 확장거시적 관점문제 혹은 변화가 기업에 주는 영향을 탐색경쟁자 확대 관점기업에 위협이 될 상황을 탐색한다시장의 니즈 탐색시장의 니즈 탐색 관점에서 문제를 탐색한다역량의 재해석..

ADsP 데이터 분석 준 전문가 정리 3

https://tonnykang.tistory.com/256 ADsP 데이터 분석 준 전문가 정리 2https://tonnykang.tistory.com/255 ADsP 데이터 분석 준 전문가 정리 1데이터의 이해DIKW Pyramid데이터 Data정보 Information, 내포된 의미 → 유용하지 않을 수도 있음지식 Knowledge지혜 WidsomDataBase통합된 데이터 (tonnykang.tistory.com  데이터 분석 기획분석 대상과 그 방법에 따른 4가지 분석 주제최적화 Optimization - 문제, 분석법 둘다 앎솔루션 Solution - 문제만 알고 분석법 모름발견 Discovery - 둘다 모름통찰 Insight - 문제는 모르지만 분석법은 앎분석 기획 시 고려사항가용 데이터 ..

ADsP 데이터 분석 준 전문가 정리 2

https://tonnykang.tistory.com/255 ADsP 데이터 분석 준 전문가 정리 1데이터의 이해DIKW Pyramid데이터 Data정보 Information, 내포된 의미 → 유용하지 않을 수도 있음지식 Knowledge지혜 WidsomDataBase통합된 데이터 (Integrated data): 중복되지 않게 통합되어있다저장된 데이터 (Sttonnykang.tistory.com 빅데이터 활용 기본 테크닉 7가지1. 연관 규칙 학습 (Association Rule Learning)주목할 만한 상관 관계가 있는지 찾아내는 방법2. 유형분석 (Classification tree analysis)새로운 사건이 속할 범주를 찾아내는 방법3. 유전 알고리즘https://tonnykang.tist..

ADsP 데이터 분석 준 전문가 정리 1

데이터의 이해DIKW Pyramid데이터 Data정보 Information, 내포된 의미 → 유용하지 않을 수도 있음지식 Knowledge지혜 WidsomDataBase통합된 데이터 (Integrated data): 중복되지 않게 통합되어있다저장된 데이터 (Stored data): 컴퓨터가 접근 가능공용 데이터 (Shared data): 공동으로 이용할 수 있다변화하는 데이터 (Operational data): 삽입, 수정, 삭제 등다양한 측면에서의 특성-정보의 축적 및 전달 측면 : 기계 가독성, 검색 가능성, 원격 조작성-정보이용 측면-정보관리 측면-정보기술발전측면-경제, 산업적 측BigData더그 래니 3V데이터의 양 Volume데이터의 유형 Variety데이터의 생성 및 처리 속도의 증가 Velo..

728x90
반응형